את D-ID הקימו ב-2017 שלושה יזמים: סלע בלונדהיים, גיל פרי ואלירן קוטה. השניים הראשונים הכירו עוד שנים קודם לכן: "היינו לוחמים באותו צוות, ואחרי הצבא נסענו כמו כולם לטיול בדרום אמריקה", מספר היום פרי, מנכ"ל החברה. את שמה של היחידה בה שירתו אסור להזכיר. "זו הייתה ההתחלה של שיתוף התמונות. כולם כל היום מצלמים ומעלים תמונות לפייסבוק, ורק אנחנו לא יכולים".
האיסור נבע כמובן מהתפקיד הצבאי הקודם של השניים, והם חשבו שחייב להיות פתרון לבעיה. המטרה הייתה לאפשר את היכולת לשתף תמונות או להחזיק תמונות במאגר אבל בבטחה: "כך שאלגוריתם זיהוי פנים לא יזהה אותך - לא ידע שזה אותו בן אדם", מסביר פרי. לשניים היה רקע במחשבים מלפני הצבא והמחשבה הייתה למצוא דרך לקחת קובץ תמונה ולהסיר ממנו את האינדיקטורים הביומטריים של פרצוף, אך שהתמונה תיראה עדיין טוב, טבעית לעין האנושית.
ואז קרה מה שקורה בדרך כלל, הרעיון מהטיול חנה בגראז' של הרעיונות כמה שנים והשניים הולכים לצבור ניסיון בהייטק כשכירים. סלע עבד בנטורל אינטלג'נס ופרי בהאוס-פרטי, שם הוא גם פגש את קוטה, יוצא 8200, ומי שהיום הוא ה-CTO של החברה. עוברות עוד כמה שנים עד שמגיע היום והשלושה מחליטים להוציא את הרעיון מהמקפיא ומקימים על בסיסו את D-ID, קיצור של: De-identification.
היזמים הולכים עם הרעיון למאיץ Y קומבינטור הנודע, ומגייסים מומחים מהטובים שיש בעיבוד תמונה. התוכנית העסקית הייתה שאם התבססות המצלמות במרחב ומנועי זיהוי פנים מצד אחד, וחוקי פרטיות כמו ה-GDPR מהצד השני, יהיה צורך במנוע "עירבול" פנים כמו שהחברה פיתחה עבור כל מיני מאגרי מידע. אבל זה לא קרה, וה-GDPR התגלה כיותר חיוור ממה שניתן היה לצפות.
מנכ"ל D-ID גיל פרי: "הבנו ש-Privacy הוא לא איפה שהביזנס ושהשיבוש האמיתי הוא בעולם המדיה. החלטנו להשתמש ביכולות המיוחדות שלנו כדי לסנטז פנים חדשות של אדם כך שהמוח לא יזהה משהו חריג"
ב-2020 החברה מחליטה על "פיווט", שינוי מודל עסקי, ופנייה לתחום המדיה. "הבנו שה-Privacy הוא לא איפה שהביזנס", מספר בכנות פרי. "ושהשיבוש האמיתי הולך להיות בעולם המדיה, במה שמכונה Synthetic media או Generative media. אמרנו, בוא נשתמש ביכולות המיוחדות שלנו כדי לסנטז פנים חדשות של אדם שהמוח לא יזהה משהו חריג". למעשה, החברה לקחה את היכולת שלה לעשות מניפולציה בתמונת פרצוף, צעד אחד הלאה. התוצאה היא טכנולוגיית AI שמסוגלת לקחת תמונת סטילס בודדת או סרטון של אדם או דמות היסטורית, ולייצר על בסיסם הנפשה חדשה שלו.
כעת החברה מכריזה על גיוס הון של 25 מיליון דולר. "היה יום אחד שקיבלתי באותה חצי שעה חמש פניות מקרנות", מספר פרי על תהליך הגיוס . לבסוף בחרה החברה ללכת עם קרן Macquarie Capit האוסטרלית (שהשקיעה בעבר ב-XM סייבר), יחד עם השקעה מצד פיטנגו, חברת הביטוח AXA, פלטפורמת אוור קראוד ומשקיעים אחרים. זהו סבב B לחברה שגייסה עד כה 23 מיליון דולר בסבבים הקודמים.
"אנחנו מספקים למוצר גישה ב-API, יהיו מודלים שלא חשבנו עליהם"
פרי מסתייג מהמונח דיפ פייק, בגלל ההשלכות השליליות שלו, למרות הדמיון במוצרים: "זה מונח שהתחילו להשתמש בו סביב 2017 כאשר היישום הראשון היה בפורנו והיום האוסציאציות זה פייק ניוז - לבלבל את העולם, לעשות השפעות תודעה בין ממשלות וכדומה. אנחנו עושים משהו אחר - אנחנו מנפישים פרצוף ומשתמשים בטכנולוגיה רק לדברים טובים".
הסרטון המצמרר של ארגון "הקשיבי בקולי", שבו נשים ישראליות שנרצחו "מדברות" ומנסות למנוע את הרצח הבא, נעשה דרך מחלקת האימפקט של D-ID
אז מה D-ID עושה? באחד התוצרים ודאי נפגשתם, הסרטון המצמרר של ארגון "הקשיבי בקולי" שבו נשים ישראליות שנרצחו "מדברות" ומנסות למנוע את הרצח הבא. סרטון זה נעשה דרך מחלקת האימפקט שהחברה הקימה בדיוק למשימות מהסוג הזה. סרטון דומה למודעות HIV הופק בצרפתית.
הלקוחה הראשונה של D-ID ביכולות האלו הייתה מיי-הרטיג' שהשיקה כך את Deep Nostalgia - מוצר שהופך תמונה היסטורית לדמות מדברת. "זה הפך להיות הדבר הכי ויראלי בעולם וסייע להם בגדילה ובמכירות", אומר פרי. לקוחות אחרים הם פוטו-מיין הישראלית, שמסייעת בארכוב דיגיטלי של תמונות אלבום, או Good Trust, חברה שמארגנת את ה"מורשת הדיגיטלית" של אדם לקראת מותו.
"אנחנו חברה טכנולוגית שמספקת גישה למוצר בממשק API לכל מי שרוצה. זה אומר שיהיו מודלים עסקיים שלא חשבנו עליהם מראש", אומר פרי. "אבל דמיין למשל שמנכ"ל סמסונג רוצה לשלוח ברכה לחג לשני מיליארד מחזיקי סמסונג, עם פנייה בשם של כל משתמש ובשפה שלו". הפתרון יכול להתאים לעולם המרקטינג אבל גם לעולם הלמידה המקוונת, וכאמור לעוד שימושים.
פרי על המטאוורס: "אנחנו חושבים חמש שנים קדימה. קורה פה משהו גדול ולשם הולך הכסף. אנחנו מתמקדים לא באווטאר של אדם חי אלא ביצירת אווטאר מתמונה אחת, של דמות היסטורית או דמיונית, או מתמונה שלך מלפני 10 שנים"
והעתיד? ובכן, במטאוורס. פרי: "D-ID הולכת להיות חברה גדולה בווידאו ובבידור, גם בלי המטאוורס, אבל אנחנו חושבים גם חמש שנים קדימה וקורה פה משהו שהוא יותר גדול מאיתנו ולשם הולך כל הכסף. במרכז של החוויה הווירטואלית הזו נמצאים האווטרים, שהולכים להיות הייצוג הדיגיטלי שלנו. אנחנו מתמקדים לא באווטאר שלך, אדם חי שיכול לצלם את עצמו מכל כיוון, אלא ביצירת אווטאר מתמונה אחת, של דמות היסטורית, או דמות דמיונית, או תמונה שלך מלפני 10 שנים.
למשל, אם תרצה לפגוש את כל עץ המשפחה שלך במטאוורס. היום כל חברה גדולה, מבנקים ועד חברות אופנה ואפילו מדינות, בונות את הנוכחות מטאוורס שלהן. "כבר שילמו לנו מיליוני דולרים על היכולות שלנו ויש תור למוצר הזה".
בהודעת הגיוס נכתב כך: "שוק ה-Digital Human וה-Metaverse צפויים לגדול פי עשרה במהלך העשור הקרוב, ו-D-ID מוסיפה לשורותיה במהירות לקוחות חדשים בתחומי ה-e-learning, הדרכה ארגונית, תקשורת שיווקית, עוזרי AI וצ'אט בוטים, היסטוריה ומורשת. D-ID משתמשת בבינה מלאכותית לפיתוח מוצרים המאפשרים הנפשה, החל מתמונות פנים ועד ליצירת אווטארים דיגיטליים באיכות גבוהה וכל זאת, מתמונת סטילס בודדת. בין עשרות לקוחות החברה נמנים וורנר, מונדליז, פובלסיס,ו-MyHeritage, איתה ID-D שיתפה פעולה ביצירת Deep Nostalgia שבאמצעותה הופקו 100 מיליון הנפשות מאז השקתה".
ב-D-ID עובדים 33 עובדים, ולטענת פרי, היעד הוא להגיע ל-70 עובדים השנה. "הכסף, שגויס ממשקיעים מובילים המשתרעים על פני שלוש יבשות, יאפשר ל-D-ID להכפיל את מספר מומחי ה-Deep Learning ו-Computer Vision של החברה, ולהרחיב את יכולות הטכנולוגיה הייחודית שלה, בעודה ממשיכה לפתח מוצרים בתחום ה-Digital Human", נכתב בהודעה.