علماء من جامعة أوكسفورد يبتكرون ذكاء اصطناعياً قادراً على قراءة الشفاه
علماء من جامعة أوكسفورد يبتكرون ذكاء اصطناعياً قادراً على قراءة الشفاه

السبت | 26/11/2016 - 07:01 مساءً

تستخدم قراءة الشفاه لفهم الكلام بتفسير حركات شفاه المتكلم. غير أن الكلام عند البشر شديد التعقيد والتنوع، بحيث تقابل حركة من الشفاه العديد من "الفونيمات"، أو واحدات الصوت الأساسية. وبالتالي، فإن هذه الطريقة معرضة للأخطاء، مما قد يؤدي أحياناً إلى نتائج مضحكة.

قام علماء من جامعة أوكسفورد بوصف نظام ذكاء اصطناعي، يسمى ليب نت، قادر على قراءة الشفاه بدقة. يعتمد النظام على تقنيات التعلم العميق ليدرب نفسه باستخدام 29,000 من تسجيلات الفيديو، مزودة بعناوين، ويبلغ طول الواحد منها ثلاث ثوان.

تم بناء نظام سابق على مستوى الكلمات، وتم تعليمه لمطابقة الفونيمات مع حركات معينة للشفاه، وقد حقق دقة تبلغ 79.6%. من ناحية أخرى، فإن ليب نت يعمل على مستوى جمل كاملة، محققاً دقة 93.4%، وعند مقارنته مع قراء الشفاه البشريين الذين حققوا دقة 52.3%، تبين أن ليب نت أدق منهم بمقدار 1.78 مرة، وذلك عند ترجمة نفس الجمل.

المزيد من الأدوات لمساعدة الصم

على الرغم من الدقة العالية للنظام، إلا أنه ليس مثالياً بعد، حيث إن تسجيلات الفيديو التي تم تلقيمه بها تتميز بإضاءة مثالية، كما أن المتكلم يواجه الكاميرا بشكل أمامي، وقد تتغير النتائج في ظروف أقل مثالية، مما تسبب ببعض الشك حول نتائج البحث.

على الرغم من هذا، فإن هذه التقنية واعدة بلا شك، ويدرس العلماء التطبيقات الممكنة لها، حيث يمكن استخدامها على سبيل المثال كأداة لمن يعانون من مشاكل في السمع. تعتمد تقنيات أخرى على حلول أخرى لهذه المشكلة، مثل: التعويض الحسي.

وفقاً لجاك كلارك من موقع OpenAI، فإن تطبيق هذا العمل في العالم الحقيقي يتطلب ثلاثة تحسينات كبيرة: كمية كبيرة من تسجيلات الفيديو لأناس يتكلمون في أوضاع ومواقف واقعية، وتطوير الذكاء الاصطناعي ليتمكن من قراءة الشفاه من زوايا متعددة، وتنويع الجمل التي يستطيع التنبؤ بها.



التعليـــقات 
جميع التعليقات تعبر عن وجهة نظر اصحابها وليس عن وجهة نظر طقس فلسطين

النشرة الجوية
جاري التحميل ..
أحدث الاخبار
أوقات الصلاة
الفجر 04:10
الظهر 11:44
العصر 03:15
المغرب 05:56
العشاء 07:19