שתי חברות שנוספו בחודש האחרון לרשימת חדי-הקרן של עולם ההייטק דחפו לקדמת הבמה טרנד שהולך וצובר תאוצה בתעשייה: Generative AI: בינה מלאכותית יצירתית (ג'נרטיב AI). החברה הראשונה מבין השתיים, סטייבליטי (Stability AI), שפועלת מלונדון ומסן פרנסיסקו, ביצעה גיוס סיד ענק של 101 מיליון דולר. השנייה, ג'אספר (Jasper), גייסה 125 מיליון דולר בסבב A לפי שווי של 1.25 מיליארד דולר. מאחורי ההשקעות עומדות שורה של קרנות גדולות, בהן קוטאו ולייטספיד בסטייבליטי ובסמר ופאונדיישן בג'אספר.
הגיוסים האלו מסמנים נקודת רתיחה בתחום הג'נרטיב AI, שבחודשים האחרונים היה קשה לחמוק מהידיעות על החידושים בו, בלי שנדע בכלל שכך קוראים לו. את הרשת כבשו יצירות מפיתוחים כמו DALL-E של OpenAI, שמסוגלים לייצר תמונות מדהימות על בסיס פרומפטים - תיאורים טקסטואלים שהמשתמש האנושי מספק ל-AI כהנחיה עבור היצירה הסופית.
אבל מדובר במהפכה גדולה יותר, של שירותי בינה מלאכותית שמסוגלים לייצר תוכן (to generate ומכאן Generative): החל מתמונות וטקסט ועד סרטונים וקוד תוכנה, וקשה לחזות מה עוד, על בסיס הגדרה פשוטה מהמשתמש. כעת נראה שאנחנו נמצאים בנקודת המעבר בין מה שהוא רק מגניב לבין שהוא ממש מוצר מסחרי.
"הבינה המלאכותית שימשה עד היום ככלי לניתוח והסקת מסקנות", מסביר ניר סבתו, משקיע הון סיכון מקרן אנטרי קפיטל ומגיש הפודקאסט "התמונה הגדולה". "היה לך הרבה דאטה , נגיד על הלוואות, ואז ה-AI סייע לעשות חיתום הלוואות עבור המערכת הבנקאית", הוא מדגים. "עד כה ה-AI סייע לזהות מחלות או לתמלל או כל מיני דברים אחרים מבוסס דאטה קיים, אבל עכשיו אנחנו רואים פרויקטים גדולים שעובדים על לעבור משלב של אנליזה לשלב של יצירה של דברים, וזה הג'נרטיב AI.
"יש בג'נרטיב AI אלמנטים שמציתים את הדמיון כי הוא לא שמור רק למהנדסים. לא צריך לדעת שפות תכנות ואפשר פשוט לג'נרט (לייצר - א"ז) מטקסט חופשי. תכתוב 'אני רוצה קוף רוכב על אופנוע בעיר עתידנית על הירח' - וזה יצייר לך בשתי שניות. זה נהיה נגיש למשתמש הסופי, וזה גרם להייפ מאד גדול".
ההבטחה הזו משכה כאמור את תשומת ליבן של קרנות ההון סיכון, מהן הגדולות בעולם, שמיהרו לפרסם פוסטים מפורטים בנושא שכוללים מיפוי וניתוח התחום. סבתו ריכז חלק מהמרכזיים בהם בשרשור בטוויטר.
ניר סבתו מקרן אנטרי: "יש בג'נרטיב AI אלמנטים שמציתים את הדמיון כי זה לא שמור רק למהנדסים. זה נגיש למשתמש וזה גרם להייפ גדול. כמשקיע לא מעניינת אותי התשתית אלא איך הופכים את זה למוצר"
ההייפ הוא נחמד, אבל, כפי שאומר סבתו, האתגר האמיתי לתרגם את היכולות החדשות לכסף. "אותי כמשקיע לא מעניינת שכבת התשתית אלא איך הופכים את זה למוצר", הוא אומר. "כיף לייצר תמונה בדאלי, אבל יש עולמות שבלי מוצר לא יוכלו להשתמש בזה: בוני אתרים, מעצבי פנים, מעצבים גרפים, כותבי טקסט, תעשיית הבידור - כל מיני גופים שכרגע לא יכולים להשתמש בבינה מלאכותית ג'נרטיבית כי הפתרון לא נמצא בקונטקסט הספציפי שלהם".
ענקיות התמונות כבר הצטרפו לחגיגה
"כל מערכות ה-AI המוכרות הן דיסקרימנטיביות (מוציאות פלט על בסיס מידע נתון - א"ז): הן ממליצות לך על שיר בספוטיפיי, מזהות קוקה קולה בתמונה או סנטימנט בטקסט", מסביר יאיר אדטו, בעל דוקטורט בתחום הראייה הממוחשבת ומייסד משותף ומנכ"ל חברת בריאה (Bria.ai), שמשתמשת ב-AI ליצירת תמונות לשימוש מסחרי ואחת מקומץ סטארטאפים ישראלים בתחום הג'נרטיב AI. "מערכות ג'נרטיב AI ממציאות משהו חדש, כי הבינה המלאכותית הגיעה לרמה שהיא יודעת לחקות את המציאות", הוא אומר.
"בריאה מייצרת תמונות באיכות גבוהה לצוותי המרקטינג בארגונים שיש להם פעילות אי-קומרס או שזקוקים לחומרים שיווקיים, מסביר אדטו. האתגר שבריאה מנסה לפתור הוא מורכב, ומוכר לכל מי שהתנסה קצת במערכות ג'נרטיביות: לפעמים התמונה יוצאת קצת מוזרה, בעיקר כשהיא צריכה לייצר פרצופים אנושיים. זו בעיה מוכרת בתחום, שמכונה Uncanny valley ויוצרת אי נוחות אצל הצופה.
"[כשזה קורה] אז אוטומטית רמת ההזדהות יורדת", אומר אדטו. "האתגר הוא איך אתה בודק, שלא באמצעות צופה אנושי, שהדמות באיכות מספיקה". בריאה יכולה לקחת תמונה, למשל של בחור רץ, ולשנות את החיוך, השיוך האתני, הרקע או הכיתוב על החולצה - והכל בממשק גרפי וללא קוד.
בריאה נוסדה ב-2020 וגייסה עד כה 11 מיליון דולר מהקרנות אנטרי ו-IN ונצ'רס וממשקיעים פרטיים. היא גם מדגימה את המעבר שעושה תחום הג'נרטיב AI מקונספט והייפ למוצר ממשי: לחברה כבר יש מספר לקוחות בהם לקוחה חדשה ומעניינת מהשבוע האחרון - ענקית המדיה גטי אימג'ס.
חברות כמו גטי, שמשווקת בנק תמונות ואילוסטרציות ללקוחותיה שלה עצמה, נמצאות באיום קיומי מכיוון חברות הג'נרטיב AI, ולכן נראה שהן מעדיפות להטמיע כלי כזה במקום להתחרות בו. ובאותו יום שבו גטי הכריזה על השותפות עם בריאה, שאטרסטוק המתחרה הודיעה על שותפות משלה עם המנוע הג'נרטיבי של OpeanAI.
לסייע לאנשים בכתיבה של טקסטים, או של קוד
אניוורד (Anyword) הישראלית עוסקת בתחום אחר של עולם הג'נרטיב AI, העוסק, כפי שמרמז שמה, ביצירת טקסטים. "אנשים כותבים די אותו דבר כבר 500 שנה אבל הם לא קוראים באותה צורה", אומר מנכ"ל החברה יניב מקובר. "היום אנחנו כבר יודעים מי אתה כקורא, והקמנו את החברה מתוך כוונה לעזור בכתיבה שמיועדת עבור אנשים ספציפיים".
אניוורד החלה את דרכה כבר ב-2013 בשם keywee עם חזון דומה, אבל כח המחשוב והמודלים פשוט עוד לא היו שם. כיום החברה מוכרת את היכולות שלה למו"לים של אתרי תוכן ולאנשי מרקטינג. "אנחנו כותבים קופי של קמפיין, אימיילים, עמודי נחיתה ובלוג-פוסטים. תבחר נושא, ותוך 10 דקות יהיה לך פוסט מקורי, לא העתקה. כן צריך לעשות עריכה לטקסט", מסביר מקובר.
הדמו של אניוורד מדגים את יכולות המוצר שלה לבחור כותרת לטקסט על פי הנחיית המשתמש, לנסח ראשי פרקים ופסקאות אבל גם לתת לעצמו ציון, לקבוע עבור אילו חיתוכים דמוגרפים הטקסט יתאים וכן הלאה.
תחום מעניין במיוחד שאליו הג'נרטיב AI החלה להיכנס הוא כתיבת קוד, שמאפשרת לקצר ולייעל את עבודת המתכנת. ביוני האחרון, גיטהאב שבבעלות מיקרוסופטת החלה להציע ללקוחות את כלי ה-AI שלה Copilot, שנועד לסייע למפתחים בכתיבה אוטומטית של קוד. בתחום זה פועל גם הסטארט אפ הישראלי קודיום (codium.ai), שמפתח כלי לבדיקת נכונות ואיכות תוכנה.
ביוני האחרון, גיטהאב החלה להציע ללקוחות את כלי ה-AI שלה Copilot, שנועד לסייע למפתחים בכתיבה אוטומטית של קוד. לדברי איתמר פרידמן, היזם מאחורי codium.ai שגם פועלת בתחום זה: "היחס בקהילת המפתחים הפך מסקפטיזם מוחלט לאהבה מטורפת"
לדברי איתמר פרידמן, היזם הסדרתי שמאחורי קודיום, בחודשים שחלפו מאז שגיטהאב הכריזה לראשונה על הגרסה הראשונית של Copilot, הגישה אליו בקהלת המפתחים השתנתה לחלוטין: "היחס הפך מסקפטיזם מוחלט לפני שנה וחצי לאהבה מטורפת עכשיו".
חברות ישראליות נוספות שפועלות בתחום הג'נרטיב AI הן D-Id ו-Hour One שעוסקות בהנפשת דמויות; Tabnine שפועלת אף היא בתחום הקוד; ו-AI21, שמפתחת את Wordtune בתחום הטקסט. בתחום הגנ'רטיב הוויזואלי הוקם לאחרונה מיזם בשם Astria, וצוותים נוספים פועלים בשדה זה.
"שינוי בסדר הגודל של האייפון"
ההתעוררות בתחום הג'נרטיב AI לוותה כמעט מיומה הראשון בחשש שמלווה כמעט כל התפתחות בתחום הבינה המלאכותית: האם מקצועות קיימים והעובדים בהם מצויים בסכנה. "אני מסכים עם מה שמכונה Amara law, לפיו אנחנו נוטים לבצע הערכת יתר לטכנולוגיה בטווח הקצר והערכת חסר בטווח הארוך", אומר על כך פרידמן, וטוען כי הסיכון ש-AI יגזול עבודות אנושיות פחות מיידי משאולי ניתן היה לחשוב.
"גם כשאני התחלתי לפתח העולם נראה אחרת, לא היה ענן למשל", הוא אומר. "היום, אדם אחד עושה מה ש-50 איש עשו לפני 20 שנה - האם חסרה עבודה למפתחים? לא. גם עוד חמש שנים תהיה עבודה למפתחים, היא פשוט תראה אחרת. מה יהיה עוד 50 שנים? אנחנו מוגבלים בדמיון שלנו בשביל להשיב".
"כל טכנולוגיה שראינו ושמענו לגביה את תחזיות ה'מומחים' מסבירים איך היא תשנה את חיינו, בדרך כלל הם טעו. לפעמים ב-10 מעלות, לפעמים ב-180 מעלות", אומרת חמוטל מרידור, משקיעה מקרן וינטג'. "כך גם צריך להתייחס למה שאני חושבת על ג'נרטיב AI. לא היה לנו מושג איך למשל האייפון ישנה את חיינו, אבל אני חושבת שג'נרטיב AI יכולה לעשות שינוי בסדר גודל כזה ואף יותר.
"למרות ההייפ סביב התמונות, שאנחנו מתלהבים מהן כי אנשים הם יצורים מאד ויזואלים, אני חושבת שטקסט יותר מעניין", אומרת מרידור. "הג'נרטיב AI יכול להחליף הרבה דברים שנעשים היום באופן ידני וסזיפי, כמו שאילתת SQL או ניתוח אקסל על בסיס שפה חופשית. אלו משימות שחורות שאנחנו לא טובים בהם ויוחלפו בידי מכונות. כתוצאה מזה העבודה תהפוך באופן אירוני ליותר אנושית: כל מה שקשור לאינטואיציה, אתיקה, מוסר, פרטיות - שם עדיין מותר האדם מן המכונה".
גם מקובר, שהמוצר שלו מאיים לכאורה על מנסחי הקופי, משוכנע שהאדם יישאר חלק מתהליך היצירה: "בסופו של דבר ה-AI הוא מחשבון, אבל הבנאדם כותב את המשוואות. בעוד שנתיים אף אחד לא יכתוב קופי עם מטרה אובייקטיבית בלי AI, זה יהיה לא הגיוני שאתה סתם 'מנחש'. האדם תמיד יהיה חלק מהפידבק-לופ, פשוט יתקצר הזמן משלב הרעיון לביצוע".
בשלב זה הג'נרטיב AI רלוונטי לתחומים ויזואליים כתמונות וסרטונים, ובעתיד כנראה ישמש גם למידול תלת מימד (וד"ש מהמטאוורס) ולגיימינג. פיתוחים בתחום פנים גם לטקסט, בעיקר לשיווק ומכירות אך לא באופן בלעדי; וכן לכתיבת קוד, סאונד (כולל חיקוי קולות אנושיים) וגם יצירת שירים. יש אפילו מיזם שעוסק ביצירת תרופות.
אבל כמו כל תחום, גם הג'נרטיב AI צריך להיזהר מבועתיות. "זה קצת מרגיש כמו תעשיית הקריפטו והבלוקצ'יין שיש בה טכנולוגיה מגניבה, הייפ וקרנות הון סיכון שמחפשות השקעות", אומר סבתו, "אבל בניגוד לימים המוקדמים של הקריפטו, שהיישום העיקרי בהם היה לקנות מטבעות, בג'נרטיב AI אנשים ממש משתמשים במוצרים.
"אנשים משתמשים בכלי ג'נרטיב AI כדי ליצור איורים בשמינית מחיר מהעלות של מאייר אנושי ותוך שניות במקום שעות. הם משתמשים בזה כדי ליצור ניוזלטר או מסמך שיווקי, וכן הלאה. הג'נרטיב AI מייצר ערך כבר מהמודלים הראשונים, לכן אני טוען שזה לא סתם הייפ".
להעמקה נוספת: מייסד וממנכ"ל Stability בראיון לפוקדאסט הטכנולוגיה Hard Fork של הניו יורק טיימס