Telecom News - מסך המגע לא הולך להיעלם ומנוע זיהוי דיבור אחד – עדיין חלום

מסך המגע לא הולך להיעלם ומנוע זיהוי דיבור אחד – עדיין חלום

דף הבית >> סקירות טכנולוגיות >> מסך המגע לא הולך להיעלם ומנוע זיהוי דיבור אחד – עדיין חלום
מסך המגע לא הולך להיעלם ומנוע זיהוי דיבור אחד – עדיין חלום
מאת: אבי וייס, 1.7.13, 22:15פרופ' עמי מויאל
 
איך מיישמים במכללה הנדסית תהליכי למידה מתקדמים המייצרים סטודנטים להנדסה טובים יותר עבור התעשייה? וגם: לאן הולך עולם זיהוי הדיבור?
 
"אנו באפקה עברנו הפנמה ביחס למה שהתעשייה רוצה, ואנו מכוונים את עצמנו לשם", מדגיש פרופ' עמי מויאל, ראש המחלקה להנדסת חשמל וראש המרכז לעיבוד שפה במכללת אפקה להנדסה, ת"א. "תהליכי הלמידה המסורתיים של שינון חומר – אבד עליהם הכלח. לימוד פרונטלי ע"י מורה או מרצה, זו שיטה שהגיע הזמן שתעבור מן העולם. המורה הוא לא מרכז ומקור הידע של התלמידים. האינטרנט הוא מקור הידע שלהם".
 
קיימתי ראיון בלעדי עם פרופ' עמי מויאל, שמשמש גם כיו"ר הכנס הבינלאומי [השלישי] לעיבוד דיבור 2013 המתקיים במכללת אפקה ב- 1-2.7.13 (כנס שיסוקר בהרחבה בנפרד), כדי להבין את המגמות החדשות בתחום הכשרת הסטודנטים והתפתחות המחקר בעולם עיבוד הדיבור (Speech Processing).
 
הכנס השנתי השלישי של מכללת אפקה לתחום זיהוי דיבור ריכז סביבו כ- 160 משתתפים מכל רחבי עולם, כולל מרצים בכירים, שהגיעו מכל רחבי העולם. מחצית מהמשתתפים באו מהאקדמיה ומחצית מהתעשייה. יודגש, שיש כיום בישראל תעשייה ענפה בתחום, במיוחד תעשיית אפליקציות חדשות סביב עולם זיהוי הדיבור. במכללת אפקה הוקם לפני כשלוש שנים מרכז המחקר ACLP (ר"ת Afeka Center For Language Processing). זה מרכז מו"פ שעוסק גם במחקר וגם בפיתוח בתחום של עיבוד שפה, בשת"פ מלא עם התעשייה הזו בארץ ובעולם.
 
שאלה: מה המשמעות של המהפכה שאתה מקדם במכללת אפקה?
פרופ' עמי מויאל: "אני באתי לאפקה מהתעשייה ואני מאמין שיש צורך להטות את הדגשים בעולם האקדמי בו אני נמצא, מתחום הקניית הידע לתחומים המעשיים. אני מיישם זאת בכל היבט אפשרי.
 
לאחרונה, לקחתי את הסגל של המחלקה לדיאלוג ישיר מול אחת החברות המובילות בעולם שלנו בתעשייה הישראלית, כדי שישמעו מהם, איך הם רואים את המהנדסים שהם קולטים ומה הם מצפים מהמהנדסים שהם בוחרים.
 
השוק מצפה לקבל בוגר הנדסה עם כישורים של למידה עצמית. זה בעדיפות הראשונה. הם מעוניינים במהנדס עם יכולת לקיים דיאלוג עם עמיתיו, יכולת עבודה בצוות, יכולת לפתח יוזמה. כל אלו תחומים שאינם קשורים לשיטת הקניית הידע שהייתה נהוגה באקדמיה.
 
לכן, מאז שהגעתי, התאמנו את כל תוכניות הלימוד לגישה של המעשיות. שדרגנו את כל המעבדות, כדי שיתנו את היכולת לסטודנטים לבצע דברים במו ידיהם.
 
בנינו 7 תחומי התמחות חדשים, שאושרו כבר ע"י המל"ג, ומהשנה הקרובה הם ייכנסו לפועל בתכניות הלימודים ובמסלולי ההכשרה אצלנו. בנוסף, אני שם דגש חזק מאוד על האנגלית. זה הבסיס של עבודת המהנדס בעולם גלובלי".
 
שאלה: אתה כבר כמה שנים ראש המחלקה. כמה זמן תמשיך כך בביצוע המהפכה?
תשובה: "אני כבר 3 שנים בראש המחלקה להנדסת חשמל ואני מאמין, שיש צורך ב- 5 שנים כדי ליישם, להשלים ולבצע את החזון, שתיארתי בקצרה בפניך. הצוות הבכיר של אפקה, לרבות נשיא המכללה, מאמין בדרך הזו ותומך בה.
 
מכאן, אני סבור ,ששתי קדנציות של 3 שנים יספיקו כדי להשלים את המשימה וזה יהיה זמן סביר ליישם את המהפכה הזו במכללת אפקה".
 
שאלה: אני מבין, שהמהפכה הזו נדרשת לא רק במכללת אפקה?
תשובה: "אכן. אני מאמין שכל מערכת החינוך צריכה לפעול כך.
 
אם הידע נמצא באינטרנט, אזי צריך שיטות חדשות וכלים חדשים כדי לספק לתלמידים כדי להתמודד עם הידע שסביבם.
 
הגישה שלי קרויה PBL, למידה מבוססת פרויקטים. במכללת אפקה אנו נותנים לסטודנטים פרויקטים. כל הזמן. הם צריכים להתמודד בלימודיהם עם בעיות מעשיות. זה המוקד של הלמידה. למידה עצמית. כדי ליישם זאת, יש לנו 10 מעבדות חובה לתואר ראשון ו- 2 מעבדות רשות.
 
רק מי שלומד 'דרך הידיים', יביא תועלת לעצמו ולחברה, כשהוא ייצא לשוק העבודה בסיום לימודיו. כדי להגשים את המטרה הזו, אנו עושים הכשרות שנתיות לסגל. השנה הצגנו ביום עיון את תהליכי הלימוד החדשניים דרך מסלול ההתפתחות של תלמיד תיכון ההולך לאקדמיה ואחר כך לתעשייה. המסלול הזה חייב להיות מעשי ומוכוון לצרכים של התעשייה".  
 
שאלה: איך נראה התלמיד של המחר?
תשובה: "זה לא צריך להיות מחר. זה צריך להיות היום. אני מאמין בטאבלטים עם ספרים דיגיטליים. אין יותר צורך בספריות. כל הידע יהיה בידי התלמיד, ממש בידיו.
 
זה לא תהליך קל או פשוט. אנו משנים את כל סדרי העולם וקופצים בהוראה למאה ה- 21. אנו עושים הכל כדי להקנות לסטודנטים כלים, שישמשו אותם בעת שהם יוצאים בסיום הלימודים לעבודה בתעשייה. למשל: הסטודנט צריך לקבל מיומנות של יכולת הצגה ושכנוע. יכולת ההצגה היא דבר חשוב ובעבר בכלל לא לימדו את הסטודנטים להנדסה דברים כאלו. ההישגים בתחומים הללו לא נמדדים בכלים המסורתיים שהיו למדידת הצלחת סטודנטים".
 
שאלה: איך אתה מיישם את המהפכה הזו עם הסגל של המכללה?
תשובה: "אחוז ניכר מהסגל שלנו, בדיוק כמוני, הוא סגל שבא עם ניסיון מהתעשייה. הם מבינים היטב במה מדובר. אנו פיתחנו מוצרים במו ידינו ואנו מבינים מה נדרש כדי לפתח מוצרים. מכללת אפקה, באסטרטגיה שלה, עובדת בדיוק בכיוון הזה: להכשיר את הסטודנטים לדעת לפתח מוצרים. על בסיס המצע הזה, באתי לסגל ולסטודנטים. הסטודנטים נדרשים לבצע פרויקטים שהם כולם מוכווני תעשייה. אני חושב, שהתוצאות כבר מדברות בעד עצמן".
 
שאלה: מה דעתך על האמרה של מולי אדן מאינטל שמסך המגע עבר זמנו, הוא מיושן והמגע האנושי עם המחשב יהיה בקול?
תשובה: "זו אמרה מאוד מעניינית ויש לי לגביה כמה נקודות מבט:
א. אני איש של זיהוי דיבור ואני מאמין שיש צורך לקדם את האינטראקציה בין האדם למחשב, כך שתהיה כמו שיש בין אדם לאדם. בני אדם מדברים ביניהם בקול, כך גם צריך להיות המגע עם המחשב החכם. זו צורת ההתקשרות שתהיה המובילה.
ב. אולם, זו 'קופסה שחורה' שממירה דיבור לטקסט. אנו במצב שבו אין עדיין מודל אחד הפותר את הבעיה הזו. כשאנשים מדברים ביניהם, הם רואים את העיניים של הדובר, את השפתיים שלו, את תנועות הגוף שלו ורואים וחשים את הרגש שלו. כך הם מבינים ומפרשים את דברי האדם העומד מולם. כשאנו מדברים על מכונות, כדי שכל זה יתקיים, כדי שהקול תהיה הגישה המובילה במגע עם המחשב, עדיין יש צורך בכמה תכונות חשובות:
1) צריך לזהות את הדובר יותר טוב. המכונה צריכה לקבל חיזוקים, מעל הניתוח על סמך הדיבור, כדי להבין את הסיטואציה, את הרגש, את ההתנהגות. לכן הקול צריך להיות מלווה בצילום של הדובר. לא תמיד זה אפשרי. צריך לשלב יכולות עיבוד מידע מהצילום ולהצליב את זה עם זיהוי הדיבור. זה עוד לא בדיוק קיים במחשבים.
2) יש צורך להבין ולנתח תקשורת מרובת אופנים, בהתאם לסיטואציה, והאדם יבחר במה להשתמש. יש משמעויות שונות למשפטים בהקשר של הסיטואציה. המכונה עדיין לא יודעת לבחור בתשובה הנכונה. האדם נדרש לבחור בתשובה.
 
יש מצבים בהם נוח לדבר. למשל, כאשר נוהגים ברכב, נוח לדבר למכשיר המבין אותך. אולם, אם אתה בישיבה, זה לא סביר שתדבר עם המחשב שלך ושכל אלו שסביבך בישיבה ידברו במקביל אליך עם המחשב שלהם. במקרה כזה, עדיף להקליד או להשתמש במסך מגע. כך שהמגע עם המחשב הוא תלוי סיטואציה.
 
הדבר החשוב ביותר כרגע, בהתפתחות הטכנולוגית הנוכחית של זיהוי דיבור, שהמכונה תיתן לך אופציות [לפרש מה נאמר] ותציג לך את האופציות על המסך. זה לא הגיוני, שהמכונה תקריא לך את האופציות ושתבחר ביניהן, כי דיבור זה מידע טורי בעוד שהצגת מידע על המסך זה מידע מקבילי, שהמגע אתו מהיר יותר וטבעי יותר. לכן, הצורך בשימוש במסך מגע לא ייעלם, בוודאי לא בקרוב".
 
שאלה: לאן מתפתח עולם זיהוי הדיבור?
תשובה: "כל אנשי זיהוי הדיבור מאוחדים כנראה סביב חלום אחד. יש לנו חזון, שיהיה מנוע זיהוי דיבור אחד, שיתחבר למנוע אחד, שיזהה את הטקסט ומנוע חכם אחד, שיביא את האינטגרציה של הטקסט עם מאגרי המידע שיש בעולם.
 
החלום שלי הוא, שבמקום שיהיו 7 מנועים, שכל אחד עושה דבר אחד, שנעבור לעולם של Speech Indexer. מנוע אחד, שיוציא מידע שלם ממה שהוא שומע: מי הדובר, מה מינו, מה השפה שלו, באיזה נושא הוא מדבר וכך הלאה. כך, מכונת החיפוש היחידה הזו תהיה מדויקת ותיתן תוצאה נכונה. החלום הזה עדיין רחוק ממימוש".
 
שאלה: היכן עומד הפיתוח של מנוע דיבור אחד?
תשובה: "כיום יש בתעשייה מנוע לכל דבר בנפרד. אפשר להעביר מידע בין המנועים, אבל אין אינטגרציה מלאה בין כל המנועים, וזה פתח לטעויות.
 
המצב האמיתי כרגע הוא, שתחום 'המנוע היחיד' עדיין במחקר בסיסי. האקדמיה תגיע לשם, אבל זה לא יקרה מחר".
 
שאלה: כמה זמן זה ייקח להערכתך?
תשובה: "זה תלוי בתקציבים ובתיאום בין כל מרכזי המחקר והחוקרים. אין כאן חסם טכנולוגי. יש יכולת לבצע את זה תוך שנתיים-שלוש.
 
יש שאלה נוספת: האם התעשייה זקוקה לדבר כזה? האם התעשייה מבקשת מנוע אחד? צריך לברר את הנקודה הזו. אנו בדיאלוג עם התעשייה כרגע בנושא זה".
 
שאלה: אז מה התעשייה עושה בינתיים, כשאין מנוע זיהוי דיבור אחד?
תשובה: "יש בשוק כמה שחקנים גדולים. יש שחקנים המפתחים מנועי דיבור בעצמם. יש כאלו המשתמשים במנועי דיבור של קוד פתוח. יש לא מעט פלטפורמות של קוד פתוח המהוות בסיס לפיתוחים של חברות גדולות.
 
החברות הגדולות הללו נמצאות בדילמה: האם לעבוד עם הפתרונות של ניואנס, שהיא מובילת שוק עולמית, או לפתח פתרונות לצרכים שלהם בעצמם. הדילמה הזו טרם נפתרה".
 
שאלה: לאן הולכים מכאן?
פרופ' עמי מויאל: "יש היום פיתוחים מעניינים בכיוון של שפה טבעית, עם חיבור לאינטליגנציה מלאכותית. אני סבור, שאנו הולכים בכיוון הזה להגיע לפתרונות יותר טובים.
 
יש היום הרבה הפרעות בתחום זיהוי דיבור נכון, למשל רעש סביבתי ורעש על הקו. הפיתוחים החדשים נועדו להבין את השפה בכל התנאים ובכל סוגי המבטאים. אנו בדרך לשם ועוסקים בזה יום יום". 



 
 
Bookmark and Share