معالجة الصور

تحليل وتحرير الصور الملتقطة من Nodes.

تحليل الصور باستخدام Vision Models

بعد التقاط صورة من Node، يمكن للـ Agent تحليلها باستخدام نماذج Vision مثل Claude أو GPT-4V.

مثال: تحليل صورة من الكاميرا

# التقط صورة
photo=$(openclaw nodes camera_snap --node=my-iphone --facing=back)

# حلل الصورة باستخدام Claude
openclaw chat "ما الذي تراه في هذه الصورة؟ $photo"

يدعم OpenClaw تلقائيًا إرسال الصور إلى نماذج Vision. Claude و GPT-4o يمكنهما وصف الصور، قراءة النصوص، والتعرف على الأشياء.

حالات الاستخدام

📖 OCR - قراءة النصوص

يمكن للنماذج قراءة النصوص من الصور:

# التقط صورة لوثيقة وحلل النص
photo=$(openclaw nodes camera_snap --node=my-iphone)
openclaw chat "اقرأ النص في هذه الصورة: $photo"

🔍 التعرف على الأشياء

تحديد الأشياء في الصور:

openclaw chat "ما الأشياء الموجودة في هذه الصورة؟ $photo"

🎨 وصف تفصيلي

احصل على وصف دقيق:

openclaw chat "صف هذه الصورة بالتفصيل: $photo"

🔢 قراءة الأرقام والبيانات

استخرج البيانات من جداول أو شاشات:

openclaw chat "استخرج البيانات من هذا الجدول بصيغة CSV: $photo"

أمثلة متقدمة

مراقبة الباب الأمامي

التقط صورة كل 5 دقائق وتحقق من وجود أشخاص:

# في Cron job أو Heartbeat
photo=$(openclaw nodes camera_snap --node=front-door-iphone)
result=$(openclaw chat "هل يوجد أشخاص في هذه الصورة؟ أجب بنعم أو لا فقط: $photo")

if [[ "$result" == *"نعم"* ]]; then
  openclaw nodes notify --node=my-iphone --title="تنبيه" --body="شخص عند الباب"
fi

قراءة عداد الكهرباء

photo=$(openclaw nodes camera_snap --node=my-iphone)
openclaw chat "اقرأ الرقم من عداد الكهرباء في هذه الصورة: $photo"

مقارنة صورتين

photo1=$(openclaw nodes camera_snap --node=my-iphone --facing=back)
sleep 60
photo2=$(openclaw nodes camera_snap --node=my-iphone --facing=back)

openclaw chat "قارن هاتين الصورتين وأخبرني بالاختلافات: $photo1 $photo2"

معالجة الصور المحلية

يمكنك أيضًا استخدام أدوات معالجة الصور التقليدية:

# تصغير صورة
openclaw exec "convert input.jpg -resize 800x600 output.jpg" --sandbox

# قص صورة
openclaw exec "convert input.jpg -crop 300x300+100+100 cropped.jpg" --sandbox

# تحويل إلى أبيض وأسود
openclaw exec "convert input.jpg -colorspace Gray bw.jpg" --sandbox

يتطلب ImageMagick أو أدوات مشابهة في Sandbox.

النماذج المدعومة للصور

  • Claude (Anthropic): ممتاز لوصف الصور وقراءة النصوص
  • GPT-4o (OpenAI): قدرات Vision قوية، سريع
  • GPT-4V (OpenAI): النسخة الأقدم، دقة عالية

💡 نصائح

  • استخدم --quality=1.0 للصور التي تحتاج دقة عالية (OCR)
  • الإضاءة الجيدة تحسن دقة التحليل بشكل كبير
  • للنصوص الصغيرة، قرّب الكاميرا أو استخدم zoom
  • يمكنك إرسال عدة صور دفعة واحدة لـ Agent