معالجة الصور
تحليل وتحرير الصور الملتقطة من Nodes.
تحليل الصور باستخدام Vision Models
بعد التقاط صورة من Node، يمكن للـ Agent تحليلها باستخدام نماذج Vision مثل Claude أو GPT-4V.
مثال: تحليل صورة من الكاميرا
# التقط صورة photo=$(openclaw nodes camera_snap --node=my-iphone --facing=back) # حلل الصورة باستخدام Claude openclaw chat "ما الذي تراه في هذه الصورة؟ $photo"
يدعم OpenClaw تلقائيًا إرسال الصور إلى نماذج Vision. Claude و GPT-4o يمكنهما وصف الصور، قراءة النصوص، والتعرف على الأشياء.
حالات الاستخدام
📖 OCR - قراءة النصوص
يمكن للنماذج قراءة النصوص من الصور:
# التقط صورة لوثيقة وحلل النص photo=$(openclaw nodes camera_snap --node=my-iphone) openclaw chat "اقرأ النص في هذه الصورة: $photo"
🔍 التعرف على الأشياء
تحديد الأشياء في الصور:
openclaw chat "ما الأشياء الموجودة في هذه الصورة؟ $photo"
🎨 وصف تفصيلي
احصل على وصف دقيق:
openclaw chat "صف هذه الصورة بالتفصيل: $photo"
🔢 قراءة الأرقام والبيانات
استخرج البيانات من جداول أو شاشات:
openclaw chat "استخرج البيانات من هذا الجدول بصيغة CSV: $photo"
أمثلة متقدمة
مراقبة الباب الأمامي
التقط صورة كل 5 دقائق وتحقق من وجود أشخاص:
# في Cron job أو Heartbeat photo=$(openclaw nodes camera_snap --node=front-door-iphone) result=$(openclaw chat "هل يوجد أشخاص في هذه الصورة؟ أجب بنعم أو لا فقط: $photo") if [[ "$result" == *"نعم"* ]]; then openclaw nodes notify --node=my-iphone --title="تنبيه" --body="شخص عند الباب" fi
قراءة عداد الكهرباء
photo=$(openclaw nodes camera_snap --node=my-iphone) openclaw chat "اقرأ الرقم من عداد الكهرباء في هذه الصورة: $photo"
مقارنة صورتين
photo1=$(openclaw nodes camera_snap --node=my-iphone --facing=back) sleep 60 photo2=$(openclaw nodes camera_snap --node=my-iphone --facing=back) openclaw chat "قارن هاتين الصورتين وأخبرني بالاختلافات: $photo1 $photo2"
معالجة الصور المحلية
يمكنك أيضًا استخدام أدوات معالجة الصور التقليدية:
# تصغير صورة openclaw exec "convert input.jpg -resize 800x600 output.jpg" --sandbox # قص صورة openclaw exec "convert input.jpg -crop 300x300+100+100 cropped.jpg" --sandbox # تحويل إلى أبيض وأسود openclaw exec "convert input.jpg -colorspace Gray bw.jpg" --sandbox
يتطلب ImageMagick أو أدوات مشابهة في Sandbox.
النماذج المدعومة للصور
- Claude (Anthropic): ممتاز لوصف الصور وقراءة النصوص
- GPT-4o (OpenAI): قدرات Vision قوية، سريع
- GPT-4V (OpenAI): النسخة الأقدم، دقة عالية
💡 نصائح
- استخدم
--quality=1.0للصور التي تحتاج دقة عالية (OCR) - الإضاءة الجيدة تحسن دقة التحليل بشكل كبير
- للنصوص الصغيرة، قرّب الكاميرا أو استخدم zoom
- يمكنك إرسال عدة صور دفعة واحدة لـ Agent