"فايسبوك": البحث عن الكلمات ضمن الصور بات ممكناً!

المدن - ميديا

الخميس 2018/09/13
كشف باحثون في شركة "فايسبوك"، عن نظام جديد للذكاء الاصطناعي اسمه "روزيتا" يستخدم منهج تعلم الآلة لتعزيز قدرات التعرف البصري على الحروف "أو سي آر"، ليتيح للمستخدمين التنقيب بين ملايين الصور التي يتم تحميلها يومياً في شبكة "فايسبوك" للتواصل الاجتماعي.


ففي حال أراد المستخدم إجراء بحث عن كلمات أو عبارات ضمن الصور في "فايسبوك"، فإن التحدي الذي سيواجهه الموقع هو اكتشاف إذا كانت هناك حروف مطبوعة ضمن الصورة، ثم تحليل تلك الحروف لمعرفة ماذا تقول العبارة، وهو ما يحاول "روزيتا" تحقيقه، حسب مدونة نشرتها الشركة.

وبالرغم من أن التقنية ليست جديدة تماماً بل كانت تستخدم لسنوات في معالجة المستندات، إلا أن التحدي الذي يواجه "فايسبوك" هو تمييز النص في أي عدد من الصور المعقدة، بما في ذلك النص المرسوم فوق الصورة، كما هو الحال في بطاقات التهنئة مثلاً المنتشرة عبر الإنترنت، أو النص في علامة كانت جزءاً من صورة أصلية، ثم جعل التقنية تعمل على نطاق التدفق المستمر للصور في الموقع.

وتقسم "فايسبوك" مهمة "استخراج" النص من الصور إلى موضوعين منفصلين، الأول اكتشاف ما إذا كان هناك نص أصلاً في الصورة، والثاني تحليل ما هي كلمات العبارة. واستخدم الباحثون من أجل المهمة الأولى شبكة عصبية تلافيفية تدعى "فاستر آر-سي إن إن" استمدت من عمل قام به في الأصل الباحث لدى "فايسبوك" روس غريشيك عندما كان يعمل لدى شركة "مايكروسوفت".

وفي حين أن تقنية "سي إن إن" استخدمت بعض الشيء في العقد الماضي للتعرف على الصور فإن تقنية "آر-سي إن إن" تضيف إليها مفهوم "المناطق" كوسيلة لتسريع استخراج الكائن في الصورة وتحديد مكان وجوده فيها بدقة. وبمجرد تمييز وجود نص في الصورة فإنه يتم تمرير إحداثيات تلك الصورة إلى نظام "سي إن إن" آخر لتمييز الكلمة أو العبارة حرفاً بحرف، ونتائج هذه الخطوة الثانية هي سلاسل من الحروف التي تشكل الكلمات والعبارات.

ولأن التعرف على الكلمات أو العبارات الطويلة قد يكون صعباً بشكل خاص فإن الباحثين استخدموا وسيلة تدعى "المنهج التعليمي" لتدريب نظام التعرف على الحروف، حيث بدأوا بتدريبه على كلمات صغيرة من خمسة أحرف أو أقل، ثم أخذوا يزيدون طول الكلمات تدريجياً مع تكرار عمليات التدريب.

يذكر أن نظام "روزيتا" مفعل حالياً في "فايسبوك" ويستخدم يومياً وفقاً للباحثين الذين يقولون إن التحدي المقبل يتضمن استخراج النص من تطبيقات الفيديو.

©جميع الحقوق محفوظة لموقع المدن 2024