מערכת זיהוי דיבור – מדריך פתרונות תקשורת לעסקים
מאת:
מיכאל פנחס, 22.7.13, 21:00
טכנולוגיית זיהוי דיבור (Voice Recognition) מסייעת לעסקים להחליף את העובדים האנושיים במרכזיות ובמוקדי השירות במכונות אוטומטיות המקיימות קשר אינטראקטיבי עם הפונים. כיצד בוחרים את מערכת הזיהוי הדיבור לעסק וחוסכים בהוצאות התקשורת?
שוק
הזיהוי דיבור (
Voice Recognition) הוא אחד השווקים הנמצאים כיום בצמיחה מואצת, גם במגזר העסקי. טכנולוגיה זו, שלא הצליחה להתרומם במשך עשרות שנים (קיימת בשוק מעל ל- 50 שנה), קיבלה תנופה אדירה, כשחברת אפל הכניסה מערכת מתקדמת לזיהוי דיבור בשם סירי (
Siri), של חברה בשם זה, שנרכשה ע"י אפל ב- 2010, לתוך האייפון שלה
4s באוקטובר 2011.
מאז, סירי פועלת על כל האייפונים, האייפודים והאייפדים של אפל לסוגיהם. במקביל, המתחרים גם הם לא "שקטו על השמרים" והציגו מערכות מתקדמות מתחרות. למשל, מערכת
Google Voice הוותיקה שודרגה למערכת המכונה בשמות דוגמת:
S Voice או
Google Now והוכנסה לכל הגרסאות של אנדרואיד מגרסה 4.0 ומעלה. מערכת זו הופיעה בפעם הראשונה בשוק במאי 2012 במכשיר סמסונג גלקסי
S3.
לאילו מערכות מתאימה מערכת זיהוי דיבור במגזר העסקי?
היא מתאימה לכל מקום בו ניתן להחליף מענה אנושי במענה ממוחשב, שמטפל במקבץ סגור של אפשרויות. ככל שכמות האפשרויות למענה וזיהוי הדיבור יותר מצומצמת, כך קטנה האפשרות לטעות בזיהוי ועולה רמת האפקטיביות של מתן השירות בצורה ממוחשבת ולא אנושית למתקשרים.
לכן, המערכות של זיהוי דיבור מצליחות במגזר העסקי כיום בכמה תחומים מאוד מצומצמים, ממוקדים וברורים:
א. לניתוב שיחות קולי במרכזיה לשלוחות של אנשים בארגון. במקרה זה מספר היעדים לניתוב השיחה ידוע ולכן הטעויות הן מינימליות.
ב. כתחליף ל-
IVR הישן. גם במקרה זה, כמות התשובות ידועה ולכן מרווח הטעות בזיהוי די מצומצם.
ג. לאימות דובר במערכות פיננסיות. גם כאן, אם יש את "
חתימת הקול" של האדם הפונה, קל לבצע אימות של קולו, מול "
חתימת הקול" הקיימת כבר במערכת. זה סוג של "אימות ביומטרי", שמאוד מצליח במערכות הפיננסיות.
ד. ביצוע הזמנות או אישורים של רכישות, במקום שיש כמות קטנה של תפריטים ועץ ההחלטות ברור וסגור.
ה. תמיכה טכנית או אחרת במקום בו יש כמות ידועה וסגורה של אפשרויות לתמיכה.
ו. ביצוע פקודות קוליות במקום בו יש כמות ידועה וסגורה של אפשרויות לביצוע הפקודות, וקל להבחין בין הפקודות השונות של הדובר.
כיום טכנולוגיות
זיהוי דיבור נפוצות רק בשני תחומים - טלפונים סלולריים ומרכזי שירות לקוחות. הטכנולוגיה הצליחה לחדור דווקא לתחום המכשירים הסלולריים, מכיוון שהפעלת טלפון ללא מגע יכולה להציל חיים וחוסכת בזמן התפעול. הסיבה לחדירת טכנולוגיות לזיהוי הדיבור למרכזי שירות הלקוחות היא הרצון לייעל את המערכת ולחסוך בכוח אדם אנושי יקר (יחסית).
החיסכון בעלויות למרכזי שירות הלקוחות הוא גדול וכך גם החזר ההשקעה. זאת, כי ניתוח דיבור מספק בסיס לאיזון בין שלושת היעדים העיקריים של מרכזי שירות לקוחות: שביעות רצון הלקוח מאיכות הפתרון המתקבל בפנייה הראשונה, התמודדות עם כמויות גדולות של שיחות, וייצור מכירות באמצעות המערכת הממוחשבת. דיוק של 85% עד 90% מספיק כדי להשיג את היעדים הללו.
בעתיד תהיינה מערכות, שתדענה לזהות ולהבין שאלות המופנות לנציגי מכירות הווירטואליים, ותשלופנה בהתאם ממאגר תשובות קודמות ומניתוח הפנייה את המידע הדרוש לטיפול בבעיות, ותוכלנה לתקשר באופן שוטף עם הלקוחות הפונים. המערכות הקיימות עדיין לא מצויות בנקודה הזו.
מיהם השחקנים המובילים בעולם בתחום זיהוי הדיבור?
המובילה עולמית היא ללא ספק ניואנס (
Nuance), שהיא מעין "מונופול עולמי" בתחום זיהוי הדיבור, עם פתרונות המבוססים על רכישת כמה חברות הזנק ישראליות. רוב הפתרונות, שיש בשוק העולמי, מבוססים על מנועי זיהוי הדיבור של ניואנס. למעשה, החברות הגדולות בעולם כמו גם בישראל נמצאות בדילמה: האם לעבוד עם הפתרונות של ניואנס, שהיא מובילת שוק עולמית, או לפתח פתרונות לצרכים שלהם בעצמם. הדילמה הזו טרם נפתרה. חלק מהארגונים הגדולים מפתחים פתרונות עצמיים בקוד פתוח, כדי לא להיות תלויים בניואנס. למעשה, כל האינטגרטורים הגדולים בישראל פיתחו מערכות כאלו לצרכים ורטיקליים (למשל: לבנק מסוים), בגלל שמדובר בפרויקטים של מאות אלפי ועד מיליוני ₪.
המתחרה השנייה בגודלה בשוק העולמי היא
IBM. בשוליים, יש מגוון עצום של חברות קטנות מתחרות, מתוכן ניתן לציין את חברת
NSC מישראל (כיום חלק מ-
AudioCodes), שיש לה מקום חשוב ובולט בשוק הזה. יש גם מספר לא קטן של חברות הזנק ישראליות צעירות הסבורות, שהן תצלחנה להקדים את ניואנס או
IBM בפתרונות טובים יותר. למשל
NovoSpeech ו-
Speech-Modules.
לקוחות הקצה בעסקים ובארגונים בד"כ אינם רוכשים את הפתרון של זיהוי דיבור ישירות מניואנס או
IBM, אלא מאחד מספקי השירות, שמרכיבים מנוע של שתי הענקיות הללו בתוך המוצר ומספקים שירות ללקוחות הקצה. למעשה, לבעל העסק בכלל לא אכפת של מי המנוע לזיהוי דיבור שיש לו במערכת. הוא מעוניין במערכת שתענה לצורך עסקי שלו. זה הקריטריון היחיד המוביל אותו ברכישת המערכת. בשוק "
זיהוי הדיבור" אין את תופעת "המיתוג" הקיימת בפתרונות בתחומים אחרים בעולם ה-
ICT, שבהם מותג מוביל זוכה לביקוש רק בגלל שמו והמוניטין שזכה בו. מעטים בשוק מכירים את הפתרונות של ניואנס או של
IBM, משום שהם עטופים תחת השם של ספק השירות, או של המערכת שספק השירות מציג.
המוצרים והשירותים הנפוצים ביותר בישראל בשוק זיהוי הדיבור:
א.
O-T-tech. זו מערכת המיועדת בעיקר לשירות לקוחות טלפוני, שמנוהל באמצעות זיהוי דיבור.
חברת O-T-Tech מספקת שירות המופעל כבר אצל לקוחות גדולים וקטנים בארץ ומאפשר ללקוחות לבצע הזמנות, לשלם בכרטיס אשראי, לברר סטטוס ועוד. כל זאת, תוך כדי דיבור רגיל בדומה לשיחה עם נציג. הפניית העבודה היומיומית למערכת נעשית אוטומטית. העובדים האנושיים יכולים להתמקד ולהתפנות לעבודה מקצועית יותר ולטפל באילו שלא קיבלו מענה מהמכונה האוטומטית. הלקוחות יכולים להגיד את מבוקשם ללא צורך בהקשה על מקשי הטלפון.
אין צורך בתהליכי גיוס, הדרכה והכשרה שוטפת לנציגי השירות המתפעלים מערכת כזו. המערכת מתחברת למערכות ה-
CRM וה-
ERP של הארגון לצורך מסירת המידע וביצוע העדכונים הנדרשים.
ל-
O-T-tech יש מערכות, שנבנו עבור עולמות ורטיקליים דוגמת: מערכת הרפואה, מערכת הבנקאות, מערכת בתי המשפט, מערכות תשלומים בכרטיסי אשראי ועוד. למעשה, ניתן להתאים את המערכת לכל שוק ולכל סוג של שירות.
המחיר: כ- 2,500 ₪ לחודש למערכת בסיסית.
ב.
מענה קולי אינטראקטיבי של Gama Operations. זו מערכת לניתוב שיחות אינטראקטיבי, מחליפה
IVR, עם אפשרות ליצירת מודולים בתפירה אישית, בהתאם לצורכי הלקוח. זו מערכת יציבה הקיימת בארגונים ציבוריים ופרטיים בישראל. הפתרון כולל תוכנה ומחולל יישומים, שבעזרתו ניתן לתכנן את היישום המבוקש.
המערכת יכולה להיות מקושרת למגוון רחב של בסיסי נתונים חיצוניים ופנימיים ולהשמיע למתקשרים את המידע הרלוונטי. יישומי
IVR אפשריים: מערכת הפצת הודעות, מודול שעות עבודה, מודול פתיחת שערים, השכמה,
Fax On Demend ועוד. מערכות ה-
IVR של חברת גאמא בנויות לעבוד עד 240 ערוצי קול ופקס (למערכת בודדת). יש תמיכה במספר שפות. המערכת תומכת כרגע ב- 6 שפות: עברית, אנגלית, רוסית, ערבית, צרפתית וגרמנית (בהתאם למחירון שפות).
המחיר: 21,000 ₪, מחיר רכישה. זה כולל אחריות וביטוח לשנה. אחרי שנה משלמים מחיר סמלי יחסית על ביטוח ואחריות לכל שנה נוספת.
ג.
מערכת ניתוב שיחות של Gama Operations. זו מערכת עם יכולת זיהוי דיבור המאפשרת למתקשר להגיע לעובד אותו הוא מבקש בצורה קלה ויעילה. זאת, ע"י אמירת השם הפרטי והמשפחה/מחלקה. ניתן לשלב פתרון זה גם כספר טלפונים ארגוני, שמאפשר חיפוש חכם של אנשים באמצעות זיהוי קולי במס' מקומות כגון: בית, משרד, נייד וכדומה.
יש תמיכה נרחבת לשפה העברית (שפות נוספות בשלבי פיתוח). המוצר נתמך ע"י תוכנה היכולה לזהות גם משפטים שלמים. ניתן לרכוש כמוצר עצמאי או כמוצר משולב במערכת דואר קולי.
המערכת מבוססת על דגימות רבות במבטאים וניבים שונים ובעלת יכולת למידה. המחיר מתייחס למערכת הכוללת 2 ערוצים - ניתן להרחיב את המערכת בהתאם לדרישת הלקוח.
ניתן לרכוש כיישום בתוך מערכת
Prime Voice מתוצרת גאמא או כמערכת עצמאית המסוגלת להתחבר לכל מרכזיה בעלת יכולת ניתוב. אחוזי ההצלחה של הזיהוי הקולי הנם למעלה מ- 90% ומשתפרים ככל שהשימוש במערכת עולה. בנוסף, המוצר כולל יכולת ניתוב מלאה של שיחות.
המחיר: 41,000 ₪, מחיר רכישה. זה כולל אחריות וביטוח לשנה. אחרי שנה משלמים מחיר סמלי יחסית על ביטוח ואחריות לכל שנה נוספת.
ד.
מערכת VOCANOM של NSC מבית AudioCodes. זו מערכת
זיהוי קולי למערכות טלפוניה ושירותים מרובי משתמשים בארגונים. מערכת
VOCANOM מאפשרת ביצוע ניתוב קולי תוך אירגוני לעובדי הארגון ולמתקשרים מזדמנים המתקשרים אל הארגון. המערכת הינה מוצר מדף בעלת ממשקים סטנדרטים, שמאפשרים קיצור זמן התקנה לשעתיים בלבד.
המערכת מספקת יכולת
IVR המשלבת עבודה בדיבור ו/או ב-
DTMF ומייתרת במקרים רבים צורך ב-
IVR נוסף לצרכי הארגון. המוצר מיועד לארגונים בשוק ה-
Enterprise וה-
SMB. לקוחות ה-
VOCANOM הם ממגזרי האקדמיה, ההייטק והמוסדות המוניציפליים. המערכת זכתה להצלחה רבה מאוד במגזר האקדמי, ונכון להיום הוטמעה בטכניון, האוניברסיטה העברית, מכון וייצמן, אוניברסיטת בן-גוריון בנגב ואוניברסיטת בר-אילן.
מחיר המערכת, שתלוי בהיקף הפורטים וכל הציוד הנלווה מסביב הנרכש מאודיוקודס, נע בין עשרות אלפי ₪ למאה אלף ₪. הכרטיס הכי בסיסי של אודיוקודס לעסק קטן כולל שני מעבדים ותומך ב-2-8 ערוצי דיבור במקביל, ואינו מחייב רכישת חומרה או תוכנה חדשות וביצוע שדרוגים למערכות המחשוב הקיימות בארגון. כל שנדרש הוא חריץ
PCI פנוי
ומרכזיית טלפונים. בין השימושים האפשריים לכרטיס, שמחירו כ-1,900 דולרים, נמנים: ניהול ספרי טלפונים קוליים ארגוניים, מערכות דואר ומענה קוליים (
VoiceMail), מוקדי שירות ועוד.
הערה חשובה:
לכל המוצרים הללו יש סדרה שלמה של מוצרים נלווים, שנרכשים בנפרד ובראשם מערכות הקלטה ותיעוד שיחה, תוכנות נלוות ושירותי ערך מוסף רבים, בהתאם לצרכים הייחודיים של העסק. לצורך הפעלת חלק ניכר מהתכונות האפשריות במערכות הללו, נדרשת תוספת רישיון או חומרה \ תוכנה בתשלום נפרד. לעיתים קרובות נדרש תשלום נוסף עבור ביצוע אינטגרציה עם מערכות
CRM,
Call Center,
ERP,
Outlook וכיו"ב, שיש כבר בעסק.
מאת:
מיכאל פנחס, יולי 2013.
מהנדס תקשורת – ומחבר המדריך
לחיסכון בהוצאות התקשורת ולרכישת
מרכזיות טלפון לעסקים