ينشر حول العالم كم كبير من الأبحاث، سواء في المجلات العلمية المٌحكمة أو المؤتمرات الدولية، والتي تتم فيها دراسة عدد من الظواهر العلمية، وهذه الكمية الكبيرة من الأبحاث التي تنشر تحتاج، بشكل شديد، إلى أدوات رقمية، تساعد في وصول الباحثين إلى محتويات تلك المنشورات.
الأنظمة الرقمية لأرشفة الأبحاث، ومنها ما يعمل بمساعدة خوارزميات الذكاء الاصطناعي، بدورها تقوم على تحليل محتوى تلك الأبحاث، لتصنيفها وتجميعها، وبناء العلاقات بينها، لتساعد الباحثين في الوصول إلى كم أكبر من المعلومات، حيث تقوم عدد من أنظمة تحليل الأبحاث العلمية على تحليل المفردات والجمل التي ترد في تلك الأبحاث، وذلك لتعليم خوارزميات الذكاء الاصطناعي كيفية التعامل مع محتوى وموضوعات المنشور العلمي، وبالتالي مساعدة الباحثين في الوصول إلى مزيد من المعلومات المرتبطة ارتباطا مباشرا بالمنشور الحالي الذي يتم تصفحه.
ولكن كثيرا من أنظمة الأرشفة الرقمية، وعلى الرغم من تقدمها، فإنها تفتقر للنظر إلى المنشور العلمي ككتلة واحدة، وبالتالي التعرف على خواصه الشاملة، وليس فقط الكلمات والجمل الواردة به، وهذه المشكلة تحديدا كانت مجالا لإحدى الدراسات التي أجراها الدكتور أرمان كوهان (Arman Cohan) من معهد آلان للذكاء الاصطناعي (Allen Institute for AI)، بالتعاون مع عدد من الباحثين من جامعة واشنطن (University of Washington)، حيث درس الباحثون الخواص الكلية للمنشورات العلمية، وتأثيرها على أداء خوارزميات الذكاء الاصطناعي التي تستخدم في أرشفة الأبحاث العلمية.
الدكتور أرمان وفريقه درسوا أيضا إمكان توظيف الإشارات المرجعية، أو الاقتباسات العلمية التي تتم على الأبحاث العلمية، في عملية تدريب خوارزميات الذكاء الاصطناعي على القيام بعدد من المهام العامة المتعلقة بأرشفة الأبحاث مثل تصنيف الأبحاث، أو إظهار الدراسات المشابهة التي تتناول الموضوع نفسه. وقد نظر الباحثون أيضا إلى تأثير اسم الباحث ودار النشر على خوارزمياتهم.
وقد كان أحد التحديات التي واجهت الدكتور أرمان هو التعامل مع الأبحاث الجديدة التي لم يتم الاستشهاد بها بعد، والتي قد تجعل عملية تعليم خوارزميات الذكاء الاصطناعي غير مكتملة أو غير متسقة مع الأبحاث التي قد تم بالفعل الاستشهاد بها، ولكن الباحثين استطاعوا تجاوز هذه العقبة بإجرائهم تعديلا طفيفا على الخوارزميات المطورة.
الجميل في الخوارزمية التي تم إنتاجها أنه تم تدريبها لمرة واحدة فقط على القيام بعدد من المهام المختلفة المتعلقة بأرشفة الأبحاث العلمية، وبالتالي لم يعد يلزم تطوير خوارزمية مستقلة لكل وظيفة من وظائف الأرشفة. كما تراوحت دقة هذه الخوارزمية في أداء مهامها بين 80 و%90، وذلك باختلاف العمل المناط بها.
الأنظمة الرقمية لأرشفة الأبحاث، ومنها ما يعمل بمساعدة خوارزميات الذكاء الاصطناعي، بدورها تقوم على تحليل محتوى تلك الأبحاث، لتصنيفها وتجميعها، وبناء العلاقات بينها، لتساعد الباحثين في الوصول إلى كم أكبر من المعلومات، حيث تقوم عدد من أنظمة تحليل الأبحاث العلمية على تحليل المفردات والجمل التي ترد في تلك الأبحاث، وذلك لتعليم خوارزميات الذكاء الاصطناعي كيفية التعامل مع محتوى وموضوعات المنشور العلمي، وبالتالي مساعدة الباحثين في الوصول إلى مزيد من المعلومات المرتبطة ارتباطا مباشرا بالمنشور الحالي الذي يتم تصفحه.
ولكن كثيرا من أنظمة الأرشفة الرقمية، وعلى الرغم من تقدمها، فإنها تفتقر للنظر إلى المنشور العلمي ككتلة واحدة، وبالتالي التعرف على خواصه الشاملة، وليس فقط الكلمات والجمل الواردة به، وهذه المشكلة تحديدا كانت مجالا لإحدى الدراسات التي أجراها الدكتور أرمان كوهان (Arman Cohan) من معهد آلان للذكاء الاصطناعي (Allen Institute for AI)، بالتعاون مع عدد من الباحثين من جامعة واشنطن (University of Washington)، حيث درس الباحثون الخواص الكلية للمنشورات العلمية، وتأثيرها على أداء خوارزميات الذكاء الاصطناعي التي تستخدم في أرشفة الأبحاث العلمية.
الدكتور أرمان وفريقه درسوا أيضا إمكان توظيف الإشارات المرجعية، أو الاقتباسات العلمية التي تتم على الأبحاث العلمية، في عملية تدريب خوارزميات الذكاء الاصطناعي على القيام بعدد من المهام العامة المتعلقة بأرشفة الأبحاث مثل تصنيف الأبحاث، أو إظهار الدراسات المشابهة التي تتناول الموضوع نفسه. وقد نظر الباحثون أيضا إلى تأثير اسم الباحث ودار النشر على خوارزمياتهم.
وقد كان أحد التحديات التي واجهت الدكتور أرمان هو التعامل مع الأبحاث الجديدة التي لم يتم الاستشهاد بها بعد، والتي قد تجعل عملية تعليم خوارزميات الذكاء الاصطناعي غير مكتملة أو غير متسقة مع الأبحاث التي قد تم بالفعل الاستشهاد بها، ولكن الباحثين استطاعوا تجاوز هذه العقبة بإجرائهم تعديلا طفيفا على الخوارزميات المطورة.
الجميل في الخوارزمية التي تم إنتاجها أنه تم تدريبها لمرة واحدة فقط على القيام بعدد من المهام المختلفة المتعلقة بأرشفة الأبحاث العلمية، وبالتالي لم يعد يلزم تطوير خوارزمية مستقلة لكل وظيفة من وظائف الأرشفة. كما تراوحت دقة هذه الخوارزمية في أداء مهامها بين 80 و%90، وذلك باختلاف العمل المناط بها.