تعتمد خوارزميات الذكاء الاصطناعي، على التدرب لتتمكن من كتابة العناوين للنصوص الإخبارية بشكل آلي، حيث يتم تدريبها من خلال تحليل قواعد بيانات مخصصة لذلك الغرض، بحيث تحتوي قواعد البيانات على عنصرين، الأول: مثال على النص الاخباري، والثاني: مثال لعنوان مناسب لذلك النص، ومن خلال التعرف على عدد كبير من الأمثلة، للنصوص الإخبارية وعناوينها، يمكن للخوارزمية أن تقوم بمحاولة إنتاج عنوان لنص لم تره تلك الخوارزمية من قبل.
ويعمد مطورًا مثل تلك الخوارزميات إلى التأكد من دقتها، وذلك من خلال إعطائها نصًا جديدًا، ويُطلب من الخوارزمية كتابة عنوان له، وبعد ذلك يمكن مطابقة العنوان، مع ما يوجد فعليًا في قاعدة البيانات، وفي حال كان اختبار الخوارزمية يتم على مئات أو آلاف النصوص، فإن عملية المطابقة تتم بشكل آلي أيضًا، وتعد هذه العملية شديدة الصرامة، إذ أن الخوارزمية محل التطوير، يتم اختبارها بكتابة عنوان مطابق حرفيا لما يوجد في قاعدة البيانات، وهو ما جعل أعلى دقة تصل لها تلك الخوارزميات لا تكاد أن تتجاوز 40 %.
قام البروفيسور ناواكي أوكازاكي (Naoaki Okazaki) من معهد طوكيو للتكنلوجيا (Tokyo Institute of Technology) بقيادة فريق بحث لدراسة التوليد الآلي للعناوين الإخبارية، ووجد أن أحد المشاكل التي تواجه خوارزميات الذكاء الاصطناعي في هذا المجال، تكمن في عملية التدريب، إذ أن وجود نصوص وعناوين غير دقيقة في قواعد البيانات المستخدمة في تطوير الخوارزميات، يؤدي إلى نتائج غير دقيقة، والمفاجأة كانت باكتشاف أن قواعد البيانات التي كان الباحثون حول العالم يستخدمونها لتطوير خوارزمياتهم منذ سنين لا تعد دقيقة بما يكفي.
بالرغم من أن فريق البروفيسور ناواكي تمكن من تطوير خوارزمية مستقلة، تقوم على استبعاد البيانات غير الدقيقة، فإن ذلك للأسف لم يسهم في رفع دقة ما تم اختباره من خوارزميات الكتابة الآلية للعناوين الإخبارية، وهذا يدل على أن اكتشاف الفريق الياباني ما هو إلا أحد الخطوات الأولى في طريق إصلاح خوارزميات الكتابة الآلية لعناوين النصوص الإخبارية.