Telecom News - המסלול מזיהוי דיבור עבר דרך "סייען אישי" וכעת מוביל לרובוטים אנושיים

המסלול מזיהוי דיבור עבר דרך "סייען אישי" וכעת מוביל לרובוטים אנושיים

דף הבית >> דעות ומחקרים >> מה חדש באקדמיה? >> המסלול מזיהוי דיבור עבר דרך "סייען אישי" וכעת מוביל לרובוטים אנושיים
חשיפת הרובוט האנושי Jibo ע"י מפתחו, רובוט שכבר מופעל במכון הטכנולוגי חולון (HIT) ופתרונות מדהימים נוספים, שנולדו כחלק מההתפתחות של עולם "זיהוי דיבור", שהתפתח ל"סייען אישי", "זיהוי רגשות" וצ'אט-בוטים, כשהכל מתאחד כעת לתוך "רובוט אנושי", שזו טכנולוגיית העתיד שלנו בכל תחום. הצגת 5 סטארטאפים בתחום.
מאת: אבי וייס, 20.4.17, 08:00הרובוט ג'יבו עם ד"ר נאווה שקד

כפי שכבר דיווחנו (כאן), ביפן, רובוטים אנושיים הם כבר מציאות טכנולוגית ושיווקית. יש ביפן כבר מעל ל-25 יצרנים של רובוטים אנושיים לצרכים מגוונים בכל התחומים. אגב, "רכב אוטונומי" הוא גם סוג של רובוט אנושי.

בארה"ב, התהליך הזה החל (למשל בתחום מתן השירות בסוכנויות הביטוח והתפשט לשווקים נוספים). בישראל, אנו רק בתחילת הדרך, למרות שיש כאן חברות הזנק ופיתוחים מדהימים בעולם החדשני הזה, מלווה בפעילות מחקרית ענפה, כמו זו הנעשית במכון הטכנולוגי חולון. . 

כנס AVIOS 2017 (ארגון בינ"ל, שנולד לתחום "זיהוי דיבור", ד"ר נאווה שקד מ-HIT - המכון הטכנולוגי חולון היא יו"ר AVIOS בישראל), היה המקום המתאים לחשוף את ההתפתחות המהירה של התחום הזה, שכיום מובל ע"י טכנולוגיית הרובוטים האנושיים. 

ארגון AVIOS (ר"ת: Applied Voice Input Output Society) הוקם לפני מעל ל-30 שנה. החוקרים והמפתחים, שחברים בו והקימו אותו, לא שיערו לעצמם לאן התחום הזה יגיע.

דוגמה להמחשה: בתמונה למעלה משמאל ד"ר נאווה שקד (משמאל) מצולמת עם ד"ר רוברטו פירצ'יני (מימין) והרובוט Jibo פרי פיתוח צוות שהוא חלק מרכזי ממנו, רובוט אנושי, שנחשף והוצג באירוע, רובוט, שכבר מופעל ב-HIT.  

פרופ' אדוארד יעקובוב, (בתמונה משנשיא HITמאל), נשיא HIT: "תחום המדעים במכון הטכנולוגי חולון קיבל הכרה ותקנים. תודתי לד"ר נאווה שקד יוזמת הכנס ומובילת תחום ה-Voice ב-HIT.

הקול הוא תחום מולטידיסיפלנרי (רב תחומי) המשלב נושאים רבים בהצלחה, שזו המגמה שלנו בכל הפקולטות: במחשב, בהנדסה, בטכנולוגיות למידה, במדעים ובניהול טכנולוגי. כל הפקולטות משתפות פעולה עם מחקר יישומי רב תחומי.

לאחרונה, ד"ר נאווה שקד מונתה כמובילה את תחום הלימודים המולטידיסיפלנריים ב-HIT. זה הכיוון, שאנו שואפים ליישם בכל הרבדים, כדי לקדם את המכון. לכן גם פתחנו כמה 'מרכזי מצוינות': למשל לגיל השלישי, מרכז סייבר ומעבדות מחקר רבות ונמשיך בכך בשנים הקרובות.

מבחינתי, זו תחילת הדרך ואני מעוניין לראות את ארגון AVIOS משתלב כחלק מפעילות המכון". 

ד"ר נאווה שקד (בתמונה משמאל), הפקולטה להד"ר נאווה שקדנדסה, HIT: "מאז 2005 אני מובילה את פעילות AVIOS בישראל ומקדמת את התחום הזה, שמרתק אותי מזה שנים. זה היה אך טבעי, ש-HIT תהיה הבית של הארגון. המטרה העיקרית שלנו היא לקדם מחקרים יישומיים, שיקדמו את התחום. 

אני מאוד מאמינה בשיתוף פעולה בין מקצועות ובין מחלקות, כי זה הצורך של התעשייה ממנה באתי לאקדמיה. זה גם הצורך של הקהילה הסובבת אותנו. אנו חלק מהתפיסה של Startup Nation והפעילות שלנו מכוונת לקדם את הקהילה בה אנו חיים.

תודה מיוחדת אני חייבת לד"ר רוברטו פירצ'יני, שהוא גם חברת הנהלת AVIOS העולמית, שמשתף עמנו פעולה וגם הביא את הרובוט Jibo לישראל ואיפשר לנו להתנסות בו ולעסוק בהוראה ומחקר סביבו. היום גם נחשף סטארטאפ ישראלי, שעוסק בתחום של 'שיחה ואינטראקציה' ונחשוף עוד סטארטאפים מעניינים בתחומים, שאנו עוסקים בהם.

התפיסה של שיחה השתנתה עם השנים בהן אני מלווה את התחום וחוקרת בו. משיחה מקוונת בטקסט עברנו לשיחה מקוונת בין אנשים וכיום אנו בעידן של שיחה עם מכונות ובין מכונות. התפיסה הזו התפתחה מהר מאוד בשנים האחרונות והגבולות בין התחומים נעלמו. נכנסו לשיח שלנו מושגים כמו צ'אט-בוט ובוט, Virtual Agent והלהיט הכי חזק: Personal Assitance.

הכל הולך כיום לכיוון של AI עם המון Data Analytics. ההצלחה של אמזון Echo Dot דחפה את גוגל קדימה והמטרה כיום של גוגל היא לחבר את כל מה שהם פיתחו בשנים האחרונות לפלטפורמה אחת הכוללת זיהוי דיבור מתקדם.

המשבצת הזו החלה להתמלא במתחרים, הכל התחיל עם הפריצה של Siri, שנרכשה ע"י אפל והובילה להכרה של הציבור הרחב בנושא המקצועי שלנו. החלום שלנו, שעסקנו בו עשרות שנים ב-AVIOS, מתגשם ומצליח ממש כעת.

המחקרים מצביעים על כך, שבשנת 2020 ה-Smart Agent יהיה המענה של לפחות 40% מהפניות למוקדי שירות בעולם. לפחות 50% מהלקוחות ישלמו על רכישות ומוצרים מהסמארטפון שלהם או מהעוזר החכם שלהם. עבורי זה ממש הגשמת חלום. הקול נכנס למרכז הבמה. הוא יהיה הכוח המוביל לאינטראקציות ברשת. הקול נכנס לכל תחומי החיים, גם לתחומי האבטחה והסייבר וגם למכוניות אוטונומיות. 

ההתפתחות הזו יוצרת ממש כעת תעשייה שלמה שנבנית סביב הקול. זה מתחיל ב-AI, המון בוטים והמון פיתוחים חדישים. הכיוון היום מאוד ברור: לכל אחד יהיה בוט המותאם לו אישית. בהמשך זה יהיה גם רובוט אנושי. 

השוק לא יתפתח נכון בלי לבנות יחסים נכונים בין כל מרכיבי הפתרונות, כל פתרון הנוגע לקול. אנו כעת עובדים על הגדרת היחסים הללו. אחד הפיתוחים, שנציג בקרוב, יהיה אווטאר לנשים הרות, פיתוח, שנועד להדגים כיצד ניתן להגיע לתוצאות יפות לאוכלוסיות ממוקדות ולתת להן סביבה תומכת המשתמשת בקול ובכל הכלים האחרים האפשריים - ביחד".

פרופ' שרית קראוס, (בתמונה משמאל), אונפרופ' שרית קראוסיברסיטת בר-אילן: "סוכן אוטומטי עדיין לא מוגדר היטב. מה שמוסכם, שמדובר במערכות התומכות בבני אדם, זה יכול להיות בכל תחום, למשל לעזור לנהגים. יש הסבורים, שסוכן אוטומטי זה מחליף בני אדם. למשל יחליף מורים ומחנכים. יש הסבורים, שסוכן אוטומטי נועד להיות מאמן של בני אדם, למשל בניהול מו"מ. בנינו כמה מערכות כאלו, למשל עבור המשטרה לאמן חוקרים בחקירת חשודים, בנינו מערכת לאימון עובדים לנהל מו"מ מול המעסיקים שלהם. הכל עובד על אווטארים

מה שמשותף לכל הסוכנים החכמים: יכולת זיהוי דיבור וזיהוי התגובה האנושית. חיזוי ההתנהגות האנושית מובילה לתגובה טובה יותר של הסוכן האנושי המשתמש באווטאר, שעוזר לו. 

יש לנו כמה פרויקטים מעניינים. למשל, נהיגה ברובוטים מרובים, כמו למשל צי רחפנים וכבט"מים. אנו שאלנו: למה בכלל צריך אדם באמצע כדי לנהל כמויות של רובוטים? הם יודעים לפעול לבד אז ניתן להם לנהל את עצמם. בני אדם יתערבו רק כשיש צרות וטעויות של הרובוטים. פיתחנו סוכן חכם, שיפעל עם הרובוטים ויעביר פיקוד לאנשים, במצבים שהוא (האווטאר) מזהה סכנה לרובוטים או למה שהם עושים.

כך ניתן לפתח סוכנים חכמים התומכים בקבלת החלטות אנושיות בצורה טובה יותר. זה פתרון מבטיח, שיתפשט לתחומים רבים".

שירה גל, (בתמונה משמאל), בית שירה גלאיזי שפירא: "אנו ארגון העוסק בילדים עם מוגבלויות ויש לנו אקסלרטור בשם A3i, שמקדם יזמות וטכנולוגיות לפתרון בעיות של מוגבלויות. אנשים עם מוגבלויות מכל הסוגים הם כ-15% מהאוכלוסייה הכללית. זה המון.

יש כבר פתרונות לא מעטים,שפותחו אצלנו, למשל Orcam, ReWalk, Talkit, VoiceIT, פתרונות שזכו בפרסים בינלאומיים והכרה עולמית, כבר בזמן שהם פיתחו באקסלרטור. יש לנו בוגרים מוצלחים רבים, דוגמת: Sesame, שהסמארטפון והטאבלט שהם פיתחו לתגובה באמצעות הראש, כבר מופצים ברחבי העולם בהצלחה. Abilisense הוא פתרון נוסף מוצלח שיצא מאצלנו, שמזהה קולות ונותן התראות, למשל זיהוי בכי של תינוק בחדר אחר. Innitie היא פלטפורמה דיגיטלית לאנשי רפואה לסיוע במקצועות הסיעוד, פתרון הזוכה להצלחה יפה. 

אנו מעודדים פתרונות, שמכסים כמה מוגבלויות יחד, ולא פתרון המיועד למוגבלות אחת. הבעיה המרכזית שלנו הייתה ועודנה מימון, בעיקר בקטע של העברת הרעיונות מפרויקט מיזמי, למוצרים לשוק. בעיה נוספת שלנו היא, שלא תמיד יש קשר ישיר בין הממציא לצורך. לכן בנינו שת"פ רחב עם התעשייה ועם קהילת המפתחים ואנו מקבלים עידוד מחברות ענק דוגמת גוגל, שמסייעת לנו רבות.

באקסלרטור אנו מקבלים יזמים בשלבים מוקדמים ואנו שמים דגש על פתרונות למוגבלים ועל שילוב טכנולוגיות ויכולות, כדי לשפר את איכות החיים של כמה שיותר מוגבלים". 

ד"ר הדס לוי, (בתמונה משמאל), מרכז ההדס לויחדשנות, שירותי בריאות כללית: "האוכלוסיה שלנו מזדקנת. 20% מהאוכלוסיה מוגדרת זקנה. 50% עד 80% מהוצאות מערכת הבריאות יוצאות על האוכלוסיה הזו. הגישה שלנו השתנתה ושמה את החולה במרכז ויש את משפחתו מסביב, עם התחשבות בכולם. 

יש כיום המון מידע המגיע מהמון מקורות ויש למערכת בעיה איך להפוך את כל המידע לכזה המביא תועלת בקבלת ההחלטות לגבי חולה מסוים. ראינו, שיש צורך לפתח גישה הוליסטית, שהחולה במרכז, אבל אסור להתעלם מהמשפחה, שלפעמים מתערבת ומתנגדת לחדשנות. החולים לא.

יש לנו פרויקט במסגרת HIT, בשם CARE, שנועד לבנות קהילות של חולים ולנטר את ההתנהגויות והצרכים שלהם במטרה לשפר את איכות חייהם. יש לנו עוד המון עבודה לבצע ויש לנו הרבה פרויקטים, שהתחלו לממש במסגרת הזו.

אחד הפרויקטים, שאנו מפתחים, הוא שימוש ברובוטים. אנו מפעילים כבר רובוט אחד בשם K-Sera המקושר לחולה בביתו ועוזר לו. פתרון אחר הוא שעון חכם בשם Usefil, שניתן להטמיע אותו בכל מוצר בבית, למשל בטלוויזיה. פתרון אחר הוא מערכת ADL העוקבת אחרי חולים סיעודיים בביתם ומנטרת את השינויים בהתנהגות שלהם.

אחד הפתרונות החדשים שלנו קרוי Cogni, נועד לטפל במיומנויות הקוגניטיביות של אנשים, ויש כאן המון שימוש באווטארים. על זה נוסף פתרון של סייען אישי בשם Multi Coacher.

אנו בעשייה עצומה, שחלקה נועד כדי לעמוד בקשר עם המשפחות, שלא תמיד מוכנות לקבל את החידושים הללו, בניגוד לחולים, שמאד מתלהבים ומקבלים את החידושים, שאנו מציגים להם". 

ד"ר רוברטו פירצ'יני, (בתמונה משד"ר רוברטו פירצ'יני עם הרובוט Jiboמאל), מנהל Advanced Conversational Technologies, חברת Jibo: "אני כאן בפעם הראשונה תודות לד"ר נאווה שקד, שביקשה, שנחשוף את Jibo, שכבר מופעל מזה כמה חודשים ב-HIT. זה הרובוט החברתי הראשון והמתקדם ביותר בעולם.

את הקריירה שלי התחלתי לפני עשרות שנים בתחום המרת טקסט לדיבור. המכונה הראשונה, שבנינו באיטליה, היתה ב-1982. הפתרון נקרא אז MUSA והוא היה אז חסר כל שמוש מעשי. עברתי לארה"ב למעבדות בל ובשנות ה-90 פיתחתי פרויקטים עם DARPA. ב-1999 הקמתי חברה בשם SpeechWorks, שפיתחה את הפתרון הראשון, שנועד להחליף את ה-IVR המעצבן של הניתוב הטלפוני, מערכת, שתבין מה הרצון של אנשים המתקשרים למוקדי השירות. ב-2005 עברתי לחברת הזנק נוספת בשם SpeechCyber ואז בא לי הרעיון, ששמו כיום Jibo.

ב-2014 התחלתי עם חברה קטנה. היינו בהתחלה רק 6 אנשים והקדשנו את הזמן הראשון שלנו ללמוד מה זה רובוטים ומה ההבדל בינם לבין עוזר אישי. יש בשוק המון עוזרים אישיים וההבדלים הם פרי ההתפתחות השונה של השווקים:
א. העוזר האישי הוא תוכנה בלבד. אין חומרה הבאה במגע עם האדם.
ב. בהמשך ההתפתחות של העוזרים האישיים נולדו חומרות דוגמת המכשיר של אלכסה מאמזון, אבל זה לא יותר ממיקרופון עם רמקול המחוברים מאחור לאינטרנט. זה לא רובוט בכלל. 
ג. התפתחו אווטארים, שהם חיקוי של רובוט אנושי בתוכנה עם אנימציה יפה. 
ד. נולדו רובוטים קטנים שבכלל לא דומים לבני אדם, שנועדו לסיוע לאנשים, למשל, בתחום החברתי.

מכאן התפתח עולם הרובוטים, שהם קודם כל תהליך יצור של חומרה. המון תכנונים ועיצובים של חומרה. רובוטים בתעשייה יש מזמן. הרעיון של רובוטים חברתיים החל ב-MIT, זה התחיל באותה תקופה, שבה היפנים היו משוגעים על יצורים, שהם קראו להם טומוגוצים, יצורים וירטואליים, שגידלו אותם על המחשב או הסמארטפון שלהם. ב-MIT חשבו, שאפשר להפוך את היצורים החמודים והחברתיים הללו לרובוטים של ממש. 

הפתרון שלנו נראה היום קטן וחמוד. בהתחלה הוא היה גדול ומסורבל. אולם, המחירים של הרכיבים נפלו וכיום  אני מאמין, שהמחיר לרובוט חברתי יירד מתחת לאלף דולרים לרובוט. זה פחות או יותר המחיר של אייפון חדש בארה"ב עם כל מה שמלווה אותו. לכן, זה יהיה בהישג יד של כל אחד.

ביפן, שמובילה בתחום, פותחו לא מעט רובוטים אנושיים והם מאוד מתקדמים. הבעיה: הרובוטים היפנים מאוד יקרים ומאוד מסובכים. אנו הלכנו על רובוטים, שלא דומים לבני אדם, למרות שהם מתנהגים כאנשים, רובוטים יותר קטנים ומאוד קלים לתפעול. ב-Jibo יש 6 מיקרופונים כדי שהרובוט יזהה את הכיוון, שאנשים מדברים אליו ויפנה את החזית שלו לכיוון הדובר. יש לו גם מסך מגע על הפנים. כך, שאפשר להכניס בקשות ומידע במגע על המסך. 

הפרוטוטייפ הראשון של Jibo יצא ב-2013 ובמשך השנים הוא שינה צורה. החלטנו, שאת ההבעות האנושיות שלו הוא יספק באמצעות עין אחת, שיש לו במרכז המסך, שזה כמו פנים. העין משתנה לפי הרגש וקל להבין זאת.

בניגוד לרובוטים היפנים, שיש להם קשיי שפה חוץ מיפנית, הרובוט שלנו מדבר כמה שפות מהרגע שהוא יוצא מתהליך הייצור והוא יכול להחליט באיזה שפה הוא ידבר. אם הוא לא מבין, הוא יטען את השפה מהאינטרנט כך שיוכל לענות למי שפונה אליו בשפה, שהוא לא מבין".

רון שמיר, (בתמונה משמאל), ממייסדרון שמיר משותף ומנכ"ל Phonetica: "אנו סטארטאפ שעדיין לא מוכר, שמפתח מערכת של סיוע לחולים באמצעות זיהוי קולי. עדיין איננו יכולים לחשוף את הפתרון שלנו.

יש בתחום שלנו המון בעיות, למשל, השמירה על הפרטיות. לא לכולם ברור אם הפרטיות בכלל חשובה. יש לזה גישות רגולטוריות שונות, שמשתנות ממש כעת בארה"ב. כל חודש, לפחות מאגר מידע אחד בתחום הרפואי נפרץ ונגנב בארה"ב, למרות כל ההגנות. עולם ה-IoT הוא פרצה אחת ענקית. גם בישראל, כל מי שמתקין אצלו מצלמה של 'בית חכם', שידע, שהשכנים יוכלו לפרוץ למצלמה ולראות מה יש לו בבית. יש המון מצלמות פרוצות וקל למצוא אותן ברשת האינטרנט.

מדובר בכשל שוק, שלעניות דעתי הממשלה אמורה לטפל בזה, כי אין כוח כלכלי, שיכול לטפל בבעיה הזו לבד. צריך לזכור, שיצרני המכוניות לא התנדבו לשים כריות אוויר וחגורות בטיחות במכוניות, כפו את זה עליהם. אני מאמין, שאנו, שיש לנו משרד סייבר בתוך משרד ראש הממשלה, הגוף הזה אמור לקחת אחריות על כל הציבור, לא רק על הגופים הממשלתיים והגופים, שהממשלה רוצה לפקח ולהגן עליהם. כל הציבור זכאי להגנה". 

ד"ר מיכל רוזן צבי, (בתמונד"ר מיכל רוזן צביה משמאל), מרכז המחקר חיפה, IBM: "ב-2011 הצגנו לעולם את ווטסון והוכחנו, שמכונה יכולה לענות על שאלות קשות במהירות, טוב יותר ממומחים. בהמשך הראנו, שהשימוש הטוב ביותר ליכולת הזו הוא בעולם הרפואה. 

הושקע הון עתק לפיתוח הפתרונות הללו. כ-5 מיליארד דולרים הושקעו רק ביחידה לפתרונות רפואיים וזה כלל רכישה של לא מעט חברות ע"י IBM.

הפיתוח המרכזי שלנו היה ונשאר התחום הרפואי והשימוש של ווטסון לעולם הרפואה. המערכת הזו שינתה את עולם הרפואה ויש לה השפעה אדירה על תחומים מקבילים רבים". 

אלכס פבטולוב, (בתמונה אלכס פבטולובמשמאל), מנכ"ל Ola Mundo: "פיתחנו פתרון לאוטיזם.

1 מכל 45 ילדים חולה במחלה הזו. בהיחלט תופעה לא שולית.

פיתחנו אפליקציה גם להורים וגם לילדים, מבוססת על אווטאר היוצר דיאלוגים עם הילדים.

הדיאלוגים מתבצעים לפי רמת ההתפתחות שלהם". 

דפנה פרסלר, (בתמונה משמאל), אוונגליסטית מוצר, Intuuition Robotics: "אנו מפתחים רובוט חברתי היודע לבדר זקנים ומבוגרים בכל גיל ושמו ELLI-Q

הבדידות היא הבעיה הכי כבדהדפנה פרסלר של מבוגרים ולכן אנו מפעילים תכנית חברתית הכוללת הכל. למשל, העברת תמונות וידיאו מהילדים והנכדים וכמובן סיוע בתחום הרפואי לקשיש.

הרובוט הוא יצור פרואקטיבי המציע פעילויות למחזיק בו.

יש ברובוט יכולות של Machine Learning ולכן הוא לומד ומשתפר כל הזמן.

הרובוט מגיע עם טאבלט צמוד ושולט עליו. הטאבלט מאפשר את האינטראקציות החברתיות עם המחזיק במכשיר.

כך, שיש כאן תפיסה שונה ממה שרואים בעולם הרובוטים האנושיים". 

אלון גלדסטון, (בתמונה משמאל), COאלון גלסטוןO, חברת HereO: "פיתחנו מכשיר לאיכון ילד, שהולך לאיבוד. מדובר במכשיר מאוד קטן, שיש בו SIM לחיבור סלולרי, WiFi ובלוטוס'. היתרון שלנו: זה פתרון שעובד.

יש המון פתרונות חכמים כביכול לאיתור ילדים או זקנים, אבל בשטח הם פשוט לא עובדים. 

התחלנו את דרכנו עם גיוס במימון המונים וכיום אנו מוכרים את הפתרון כבר ביותר מ-60 מדינות". 

בועז זילברמן, מנכ"ל, Project Ray: "פיתחנו ממשק עיבוד ודיבור עבור עיוורים. זו מערכת הנמצאת בתחילת דרכה וזוכה להדים חיוביים רבים.

זה למעשה סמארטפון לעיוורים". 

ד"ר יורם לבנון, CSO, חברת Beyond Verbal Communication: "הרגשות משפיעות על הרווחה האישית. לכן פיתחנו מערכת המזהה רגשות.

הפתרון הזה מאפשר לזהות מחלות בזיהוי מוקדם בצורה, ששום כלי איבחוני ה קיים כיום לא מסוגל לזהות. יש לזה המון שימושים, שאנו עובדים עליהם כעת". 
 



 
 
Bookmark and Share