חשיפה: יב"מ ונאס"א בשת"פ במאבק בשינוי האקלים בשילוב AI
מאת:
חיים חביב, 1.2.23, 18:14
עיקר השת"פ יהיה שימוש בטכנולוגיות בינה מלאכותית מבית IBM כדי להגיע לתובנות מחקריות חדשות על בסיס מאגר הנתונים המדעי והגיאוגרפי העצום של נאס"א.
חברת המחשוב
IBM ומרכז מארשל לטיסות חלל של נאס"א (
Marshall Space Flight Center) הכריזו אמש על שיתוף פעולה, שעיקרו שימוש בטכנולוגיות בינה מלאכותית מבית
IBM כדי להגיע לתובנות מחקריות חדשות על בסיס מאגר הנתונים המדעי והגיאוגרפי העצום של נאס"א.
לראשונה ייעשה שימוש במודלי-בסיס (
Foundation Models) של יב"מ לעיבוד וניתוח צילומי לוויין של כדור הארץ, שנאספו במשך שנים.
מודלי-בסיס (
Foundation Models) של יב"מ ינתחו מאגרי נתונים עצומים של צילומי לוויינים ומידע גיאוגרפי של נאס"א, ויאפשרו חיפוש יעיל ביותר מ-300 אלף מאמרים אקדמיים בנושא כדור הארץ, כדי לסייע בגיבוש תובנות וחשיפת ידע חדש ובעל ערך עבור חוקרים המתמודדים עם אתגרי האקלים הדחופים ביותר.
Foundation Models הם מודלים של בינה מלאכותית, שאומנו על מאגרי נתונים רחבים מאוד שלא תויגו. כך, שניתן להכווין אותם במשימות גיבוש תובנות מסוגים שונים. ב-5 השנים האחרונות מודלים כאלה קידמו מאד את תחום עיבוד השפה הטבעית (
NLP), ו-
IBM היא חלוצה עולמית ביישום מודלים אלה מעבר לשימוש שונים של שפה.
נאס"א מבצעת מזה שנים רבות תצפיות לוויינים על כדור הארץ כדי לאפשר למדענים לנטר ולחקור תופעות פיזיקליות וגיאוגרפיות שונות על פני כדור הארץ. נוכח גודלו העצום של מאגר הנתונים, נדרשות עתה גישות חדשות לחילוץ תובנות ומידע שימושי מתוך הנתונים. מטרת שיתוף הפעולה בין
IBM לנאס"א היא לספק דרך יעילה יותר למדענים וחוקרים לנתח ולהפיק תובנות ממאגרי הנתונים הגדולים הללו, ולמודלים של
IBM יש את היכולות להאיץ את ניתוח הנתונים וגילוי של תובנות חדשות על כדור הארץ, ולקדם מהר יותר את ההבנה המדעית של תופעות הקשורות לאקלים.
במסגרת שיתוף הפעולה הייחודי, נערכות
IBM ונאס"א לפתח טכנולוגיות חדשות כדי לחלץ תובנות מהתצפיות בכדור הארץ. פרויקט אחד יאמן
Foundation Model של
IBM בתחום הגיאוגרפי על מערך הנתונים
Harmonized Landsat Sentinel-2 המתעד שינויים בקרקע, שנצפו מלוויינים המקיפים את כדור הארץ, שינויים בטביעת הרגל הגיאוגרפית של תופעות כמו אסונות טבע, תפוקות יבולים מחזוריות ובתי גידול לחיות בר. מדובר במערך נתונים בהיקף עצום הכולל פטה-בייטים (
Petabytes) של צילומי לוויין ונתונים נלווים, וטכנולוגיית ה-
Foundation Model תסייע לחוקרים לנתח אותו ולספק תובנות קריטיות אודות המערכות הסביבתיות של כדור הארץ.
שיתוף הפעולה צפוי להניב בנוסף יכולת חיפוש במאגר הספרות המדעית על כדור הארץ, שנאספה על ידי נאס"א. יב"מ פיתחה מודל עיבוד שפה טבעית (
NLP), שהוכשר על כ-300 אלף מאמרים אקדמיים העוסקים במדעי כדור הארץ, ויקל על חילוץ ידע חדש בתחום.
מדובר באחד ממאגרי המידע הגדולים בעולם, והאימון של המערכת בוצע על גבי פלטפורמת התוכנה
OpenShift של חברת
Red Hat, בעזרת
PrimeQA - פתרון מבוסס שאלות ותשובות רב לשוני בקוד פתוח. מעבר לשימוש שלו ככלי לחוקרים, מודל השפה החדש, ש"יתמחה" במדעי כדור הארץ, יוכל לשמש גם לניהול נתונים מדעיים וניהול תהליכים בנאס"א.
Raghu Ganti, חוקר ראשי ב-
IBM: "טכנולוגיית ה-
Foundation Model הוכיחה עצמה בהצלחה בעיבוד שפה טבעית, והגיע הזמן להרחיבה לתחומים חדשים החשובים לעסקים ולחברה. החלת
Foundation Model על נתונים גיאוגרפיים, תהליכים המתפרסים על פני זמן וסוגי נתונים מדעיים נוספים שאינם שפה, יכולה לחשוף תובנות חדשות וידע בעלי ערך עצום לקבוצה רחבה הרבה יותר של חוקרים, עסקים ואזרחים, ולהקל על מספר גדול יותר של אנשים, שעובדים על כמה מאתגרי האקלים החיוניים ביותר".
המשך שיתוף הפעולה בין
IBM לנאס"א צפוי לכלול בניית
Foundation Model לחיזוי מזג אוויר ואקלים באמצעות
MERRA2, מערך נתונים של תצפיות אטמוספריות. שיתוף פעולה זה הוא חלק מיוזמת המדע הפתוח של נאס"א, שהתחייבה לגבש קהילה מדעית שיתופית במהלך העשור הבא.