דף הבית חדשות
חדשות

ענקית הטכנולוגיה סיילספורס מפתחת מנוע חיפוש מופעל AI של חומרי מחקר על נגיף COVID-19

מערכת AI במנוע החיפוש מאפשרת למשתמש לנסח שאלה ולקבל את המידע המחקרי העדכני ביותר, באופן ממוקד ומדויק לשאלה שנשאלה מנוע החיפוש יעזור להנגיש למדענים ולחוקרים את המידע הרלוונטי ביותר בנוגע לנגיף הקורונה, ופתוח וזמין לשימוש הציבור בכל העולם, ללא עלות

מערכת TheMEDICAL | 07.07.2020

סיילספורס, המובילה העולמית בטכנולוגיית ענן ושירותי CRM, פיתחה את COVID-19 Search - מנוע חיפוש חכם המופעל על ידי בינה מלאכותית, שיעזור להנגיש למדענים וחוקרים את המידע הרלוונטי ביותר בנוגע לנגיף הקורונה. מערכת AI במנוע החיפוש מאפשרת למשתמש לנסח שאלה ולקבל את המידע המחקרי העדכני ביותר, באופן ממוקד ומדויק לשאלה שנשאלה, גם אם לא הוגדרו מילות חיפוש ספציפיות. מנוע החיפוש פתוח וזמין לשימוש הציבור בכל העולם, ללא עלות.
 
מחודש פברואר עד מאי 2020, מספר המאמרים המדעיים שפורסמו בנושא נגיף הקורונה (COVID-19) זינק מ-29,000 ליותר מ-138,000. עם הירתמות האוכלוסיה הגלובלית, המספר רק ימשיך לצמוח באופן אקספוננציאלי, כאשר התחזיות צופות שעד סוף שנת 2020, הוא יגיע ליותר מ-1,000,000.
מכיוון שמאמרים עשירים בנתונים ויכולים להגיע למאות עמודים, עבור הקהילה הרפואית וקובעי מדיניות העובדים על חיסונים וטיפולים, יכול להיות מאתגר במיוחד למצוא בדיוק את מה שהם מחפשים במסגרת זמן לחוצה ובמהלכה של מגיפה עולמית. 

לכן, עם ניסיון רחב בעיבוד שפה טבעית (NLP), סיילספורס איגדו צוות של מומחים שמטרתו לפתח מנוע חיפוש שיתמוך במאמצי המחקר ככל שמידע נוסף יתווסף למאגרי המידע הציבוריים, וכך בתוך מספר חודשים פיתחו את COVID-19 Search. בסיילספורס השתמשו בנתונים מאתגר ה-CORD-19, אתגר הנערך בחסות הבית הלבן, שנועד לזרז פיתוח אלגוריתמים ומנועי חיפוש שמטרתם לאפשר לחוקרים ולקובעי מדיניות להבין טוב יותר את נגיף COVID-19 ולהילחם בו. 

יוזמה זו תואמת את היעדים המנחים של סיילספורס, כך שבנוסף לפיתוח טכנולוגיה המפעילה את ליין מוצרי "איינשטיין" (הבינה המלאכותית) של סיילספורס, חלק מרכזי מהצוות עובד על יישום בינה מלאכותית בתחומים הפועלים למען הקהילה, כמו שירותי בריאות. בסיילספורס מאמינים כי על ידי קידום תחום ה-AI, הם יכולים לשרת את הקהילה ולשפר את העולם.
 
חיפוש במאמרים מדעיים דורש טכניקות שונות ממנועי חיפוש מסורתיים התואמים מילות מפתח. לכן, חשוב שמנוע החיפוש COVID-19 יפרש את המשמעות המדויקת בחיפוש נתון, ויחרוג ממציאת תוצאות בהתבסס על התדירות שבה מופיעות המילים במסמכים. במסמכים ארוכים במיוחד כדאי גם להעלות במהירות קטעים רלוונטיים בתוצאות החיפוש.

מנוע החיפוש COVID-19 מבצע דרישות אלו באמצעות שילוב של אחזור טקסט ו-NLP - כולל חיפוש סמנטי, QA עדכני ביותר ו-Abstractive Summarization – בכדי להבין טוב יותר את השאלה ולהביא את התוצאות המדעיות הרלוונטיות ביותר. 

- חיפוש סמנטי: סדר המילים בחיפוש מדעי יחיד הוא ספציפי מאוד, ולשינוי קל בסדר זה יכולה להיות משמעות שונה באופן דרסטי. לכן, שילבנו חיפוש של אחזור מידע (IR) עם החוזקות שלנו ב-NLP כדי להדגיש חיפוש סמנטי שמבליט את המשמעות שמאחורי השאילתה. 
- מערכת QA: חיפוש סמנטי יכול לקחת קבוצת מסמכים אדירה ולצמצם אותה לקבוצה המכילה 100 או 1,000 מסמכים. אנו מריצים מסמכים אלה דרך מערכת QA המבוססת על AI שמתייחס לשאילתת המשתמש כאל שאלה, ועושה כמיטב יכולתו כדי ליצור תשובה מהמידע שנלקח ממסמכים שאוחזרו. אם תשובה כלולה במסמך בודד, COVID-19 Search יכול לדרג מחדש את רשימת המסמכים כך שמסמך זה יופיע ראשון. על ידי חיפוש במסמכים שונים, COVID-19 Search עוזר למשתמשים למצוא תוצאות מדויקות יותר.
- מערכת Abstractive Summarization: מנוע החיפוש COVID-19 מיישם מערכת Abstractive Summarization ובכך קורא מסמך בודד או קבוצת מסמכים ואז מייצר סיכום של אותם מסמכים. אנו ממנפים את ההתקדמות האחרונה במודלים של שפות כדי ליצור סיכום קצר ולאחר מכן לדרג מחדש את התוצאות על סמך המסמכים התואמים אותה ביותר. 
 
בתגובה לאתגר CORD-19, ועידת TREC הקימה את אתגר ה- TREC-COVID Information Retrieval (IR). תחרות זו - שנוצרה כדי להעריך באופן אובייקטיבי את מנועי החיפוש של COVID-19 - גרמה להאצה של שיתופי פעולה בין קהילה של חוקרי NLP ו- IR, ומאפשרת להם לבנות על עבודתם של זה ולפתח טכניקות הרבה יותר מהר. אנו מקווים שצוותים אחרים בקהילה ייקחו את עבודתם ויתרחבו בה עוד יותר.

מנוע החיפוש COVID-19 נועד לשרת את אלו שבחזית הרפואה וקביעת המדיניות, כדי להאיץ את החיפוש אחר חיסונים וטיפולים יעילים. אתגרי CORD-19 ו-TREC-COVID הם רק ההתחלה. קהילת מדעי המחשב משתפת פעולה ואנחנו נמשיך לעבוד יחד ולשתף את המחקר שלנו כדי לעזור לקהילה הנרחבת לפתח מנועי חיפוש טובים יותר למגפה זו ולאתגרים עתידיים.