ענקיות הטכנולוגיה הסיניות נמצאות במרוץ להדבקת הפער שפתח המערב בתחום הבינה המלאכותית. החברות, ובהן Baidu, עלי באבא ו־NetEase, מקוות שהפרויקטים החדשים שעליהם הכריזו יתקבלו באותה מידה של התלהבות כמו ChatGPT.
אחרי חודשים של קיצוצים בעלויות ובכוח האדם, חברות טכנולוגיה גדולות מציגות כעת באופטימיות תוכניות השקעה שנועדו להתחרות בצ'אטבוט של OpenAI - תוכנה המייצרת תשובות טקסטואליות מציאותיות לשאלות שמציגים בפניה בני אדם. במקביל, טרולים של סימנים מסחריים עומדים בתור כדי לנכס מילים שקשורות להישגיו של ChatGPT.
ג'ואו הונגיי, ראש חברת אבטחת האינטרנט Qihoo 360, הגדיר את ChatGPT כתחילתה של מהפכת הבינה המלאכותית. "יש לה חסרונות, אבל גם פוטנציאל לא מוגבל", הוא אמר בטוק שואו טלוויזיוני בשבוע שעבר.
המרוץ להשתוות ל־ChatGPT יצא לדרך אחרי קרוב לשנתיים שבמהלכן חברות הטכנולוגיה הסיניות מלקקות את פצעיהן בעקבות מתקפות רגולטוריות, ונלחמות להשיג צמיחה על רקע ההאטה הכלכלית הנובעת ממגפת הקורונה.
Baidu מתכננת להשיק צ'אטבוט בשם אֶרְני בתוך מנוע החיפוש שלה בחודשים הקרובים. "סביר להניח שהיא בונה את אחת מפלטפורמות ה־GPT המובילות בסין", אמר אנליסט Bernstein בוריס ואן, "ההשקה הזאת היא בעלת חשיבות גדולה בשבילה"
חברת Baidu (באידו) נוקטת את הצעדים הראשוניים המשמעותיים ביותר, ומתכננת להשיק צ'אטבוט בשם אֶרְני (Ernie) בתוך מנוע החיפוש שלה בחודשים הקרובים, בדומה ל־BingChat של מיקרוסופט ו־OpenAI.
מודל הבינה המלאכותית שעליו מושתת הבוט נמצא בפיתוח מאז 2019, והדור האחרון שלו התאמן על 260 מיליארד פרמטרים – שקול בגודלו ל־GPT3, הטכנולוגיה שבבסיס ChatGPT, אף שהאימון של ארני נערך על בסיס נתונים הרבה יותר קטן.
אדם המקורב לחברה טוען כי Baidu מתכננת לחשוף השבוע פרטים חדשים בנוגע לשילובו של הצ'אטבוט שלה במוצריה, כולל מנוע החיפוש, כלי רכב חשמליים ועוזרים חכמים.
"Baidu השקיעה בזה כוח אדם וכסף, אז סביר להניח שהיא בונה את אחת מפלטפורמות ה־GPT המובילות בסין", אמר בוריס ואן, אנליסט מ־Bernstein שעוקב אחרי הפעילות הסינית בתחום הבינה המלאכותית. "ההשקה הזאת היא בעלת חשיבות גדולה בשבילה".
חשש מבועת מניות ספקולטיביות
הידיעה על השקתו האפשרית של ארני הבוט כבר בחודש הבא הקפיצה את המניה של Baidu ביותר מ־15%. וגם עליבאבא ו־NetEase קיבלו דחיפה מהתפתחויות במחקר הבינה המלאכותית הגנרטיבית שהן עורכות.
המניות של חברות בינה מלאכותית קטנות יותר, כמו Hanwang Technology ו־CloudWalk Technology, קפצו השנה בערך פי שניים. כלי התקשורת הסינית התריעו החודש מפני בהלה ספקולטיבית.
במקביל, מאז דצמבר יותר מתריסר חברות מיהרו לרשום כסימן מסחרי את “ChatGPT” או מילים אחרות עם המשלבות את הביטוי GPT. זאת למגוון שימושים שאינם קשורים לכלים מדעיים, כמו ביגוד ופרסום, לפי ספקית הנתונים Tianyancha.
עיריית בייג'ינג בישרה החודש שהיא תעביר מימון לחברות הבונות מודלים מתחרים ל־ChatGPT, ופוּדאן, האוניברסיטה המובילה בשנחאי, קיבצה יחד מספר דו־ספרתי של מנהלי חברות בינה מלאכותית ואקדמאים כדי לנתח את ההישג של ChatGPT, את סיכוני האבטחה ואת השימושים האפשריים בו.
אבל אנליסטים ומומחים אומרים שההתלהבות והנסיקה במחירי המניות שאנו עדים להן עם כל הכרזה חדשה, מסוות את העובדה שהולך להיות קשה מאוד לחברות הסיניות לשחזר במהירות את הישגיה של תוכנה שנבנתה על ידי חברות כמו OpenAI וגוגל.
הואן לי, יוצר הצ'אטבוט הסיני WeChaty: "כולם רוצים עכשיו לייצר ChatGPT, אבל זה קשה מאוד, בייחוד עבור חברות סיניות, שלא יכולות להשיג את השבבים החדשים של Nvidia, ושברשותן בסיסי נתונים מוגבלים בלבד לאימון מודלים של בינה מלאכותית"
"כולם רוצים עכשיו לייצר ChatGPT, אבל זה קשה מאוד, בייחוד עבור חברות סיניות, שלא יכולות להשיג את השבבים החדשים של Nvidia, ושברשותן בסיסי נתונים מוגבלים בלבד לאימון מודלים של בינה מלאכותית", אמר הואן לי, היוצר של WeChaty, אחת מתוכנות הצ'אטבוט הפופולריות בסין. "צריך הרבה כסף כדי לאמן מודל, ואם חלק אחד בו לא עובד כמו שצריך, המודל כולו לא יעבוד כמו שצריך", אמר.
לא בטוח שמאגר השבבים יספיק לאורך זמן
אמנם סין ידועה בכך שיש לה שפע נתונים לאימון אלגוריתמים, אך רוב פעילותה התרכזה עד כה במשימות מעקב, כמו זיהוי ואיתור אובייקטים, פעולות או פרצופים - זאת לפי סקירה של מאמרי בינה מלאכותית סיניים בדו"ח State of AI Report 2022 שפרסמו משקיעים במגזר.
Baidu התקשתה בניסיונה הקודם לפתח צ'אטבוט, פרויקט בשם Plato ("אפלטון"), שלפי האנליסטים אפילו לא הצליח לענות על שאלה פשוטה כמו "מתי יום ההולדת של מייסד עליבאבא, ג'ק מא?"
האנליסטים אומרים שאחד המחסומים לאימון תוכנת בינה מלאכותית סינית היא היעדרם של טקסטים איכותיים בשפה הסינית באינטרנט ובבסיסי נתונים אחרים.
GPT, התוכנה שבבסיס ChatGPT, שאבה לתוכה מאות אלפי טקסטים באנגלית, כולל מאמרים אקדמיים, כתבות, ספרים ופוסטים ברשתות החברתיות, כדי ללמוד את תבניותיה של השפה. ארני של Baidu התאמן בעיקר על נתונים בסינית, לצד נתונים באנגלית מוויקיפדיה ומרדיט.
יתרה מזו, אימון והרצה של מודלי שפה גדולים (LLM) - המוחות שבבסיס כלים כ-ChatGPT - כרוכים בעלויות מחשוב גבוהות מאוד. ההערכות אומרות שעלות הפעלת ChatGPT עבור מספר מוערך של 10 מיליון משתמשים בחודש, עומדת על כמיליון דולר ליום. מנהל מחברת בינה מלאכותית סינית מובילה, שביקש להישאר בעילום שם, ציין שהחברה שלו מתכננת למקד את מאמציה בתחומים מוגדרים כמו שירות לקוחות, ולא להמר על צ'אבוט שיחתי כללי.
החרם האמריקאי על יצור שבבים מתקדמים לסין יקשה מן הסתם על החברות הסיניות לייצר די כוח מחשוב להפעלת תוכנות בינה מלאכותית. תקנות אמריקאיות חדשות מונעות ייבוא לסין של מעבדים כמו A100 של Nvidia, מה שמייקר ומאט את תהליך אימון המודלים.
האנליסטים מ־Bernstein מעריכים שהחברות הסיניות כנראה אגרו מספיק שבבים לטווח הזמן הקרוב. אך הם מוסיפים שבגלל התקרה שמציבה וושינגטון על מהירות ייצוא השבבים לסין, החברות יישארו מאחור ככל שהחומרה תתקדם.
"יהיה קשה לחברות הסיניות להתחרות ברמה הגלובלית", אמר ואן מ־Bernstein. "אז חברות רבות מכריזות עכשיו על פיתוח של מתחרים ל־ChatGPT, אבל זה לא אומר שיש להן מוצר. יהיה קשה לשפוט עד שננסה את הבוטים שלהן".
© The Financial Times Limited 2023. All Rights Reserved. Not to be redistributed, copied or modified in anyway. tech12 is solely responsible for providing this translation and the Financial Times Limited does not accept any liability for the accuracy or quality of the translation