תחילת העבודה עם AI מובנה

פורסם: 12 בדצמבר 2024, עדכון אחרון: 20 במאי 2025

באמצעות ממשקי API מובנים של AI, אפליקציית האינטרנט יכולה לבצע משימות מבוססות-AI בלי לפרוס או לנהל מודלים משלה של AI.

דרישות

אנחנו פועלים כדי ליצור סטנדרטיזציה של ממשקי ה-API האלה בדפדפנים שונים.

דגמים

ממשקי ה-API של ההנחיות, הסיכום, הכתיבה והשינוי מורידים מודל שפה גדול שנועד לפעול באופן מקומי במחשבים שולחניים ובמחשבים ניידים. ממשקי ה-API האלה לא פועלים במכשירים ניידים. לפני שמשתמשים בממשקי ה-API האלה, צריך לאשר את המדיניות של Google בנושא שימוש אסור ב-AI גנרטיבי.

נכון לעכשיו, ממשקי ה-API של Summarizer,‏ Writer ו-Rewriter תומכים רק במודאליות של טקסט לטקסט. ל-Prompt API יש יכולות מולטימודאליות שזמינות למשתתפים בתוכנית הגישה המוקדמת ליצירת אבות טיפוס מקומיים.

חומרה

הדרישות הבאות חלות על מפתחים ועל משתמשים שמפעילים תכונות באמצעות ממשקי ה-API האלה ב-Chrome. בדפדפנים אחרים עשויות להיות דרישות הפעלה שונות.

ממשקי ה-API של כלי זיהוי השפה והתרגום פועלים ב-Chrome במחשב. ממשקי ה-API האלה לא פועלים במכשירים ניידים. ממשקי Prompt API,‏ Summarizer API,‏ Writer API ו-Rewriter API פועלים ב-Chrome כשמתקיימים התנאים הבאים:

  • מערכת הפעלה: Windows 10 או 11;‏ macOS מגרסה 13 ואילך (Ventura ואילך); או Linux. ‫Chrome ל-Android, ל-iOS ול-ChromeOS עדיין לא נתמך על ידי ממשקי ה-API שמשתמשים ב-Gemini Nano.
  • אחסון: לפחות 22 GB בכרך שמכיל את פרופיל Chrome.
  • מעבד גרפי (GPU): יותר מ-4 GB של VRAM.
  • רשת: נתונים ללא הגבלה או חיבור ללא מדידה.

הגודל המדויק של Gemini Nano עשוי להשתנות מעט. כדי לראות את הגודל הנוכחי, נכנסים אל chrome://on-device-internals ועוברים אל Model status (סטטוס המודל). פותחים את נתיב הקובץ שמופיע ברשימה כדי לקבוע את גודל המודל.

אני רוצה להתחיל לפתח

יש כמה ממשקי AI API מובנים שזמינים בשלבי פיתוח שונים. חלק מהתכונות האלה נמצאות בגרסה היציבה של Chrome, חלקן זמינות למשתתפים בניסויים מקוריים וחלקן זמינות רק למשתתפים בתוכנית Early Preview.

לכל ממשק API יש קבוצה משלו של הוראות להתחלה ולהורדה של המודל, גם ליצירת אב טיפוס מקומי וגם בסביבות ייצור עם ניסויי המקור.

אפשר להשתמש בכל ממשקי ה-API האלה כשמפתחים תוספים ל-Chrome.

שימוש בממשקי API ב-localhost

כל ממשקי ה-API זמינים ב-localhost ב-Chrome.

  1. לעבור אל chrome://flags/#prompt-api-for-gemini-nano.
  2. בוחרים באפשרות מופעל.
  3. לוחצים על הפעלה מחדש או מפעילים מחדש את Chrome.

כדי לוודא ש-Gemini Nano הורד ופועל כמצופה, פותחים את כלי הפיתוח ומקלידים await LanguageModel.availability(); במסוף. הפונקציה הזו אמורה להחזיר available.

פתרון בעיות ב-localhost

אם המודל לא פועל כצפוי, אפשר לנסות את השלבים הבאים:

  1. מפעילים מחדש את Chrome.
  2. לעבור אל chrome://components.
  3. מוודאים שמופיע Optimization Guide On Device Model. המשמעות היא ש-Gemini Nano זמין או נמצא בהורדה.
    • אם לא מופיע מספר גרסה, לוחצים על חיפוש עדכונים כדי לאלץ את ההורדה.
  4. פותחים את כלי הפיתוח ומקלידים LanguageModel.availability(); במסוף. הפלט צריך להיות available.

אם צריך, מחכים קצת וחוזרים על השלבים האלה.

תהליך התקנים

אנחנו פועלים כדי ליצור סטנדרטיזציה של ממשקי ה-API האלה, כדי שהם יפעלו בכל הדפדפנים. המשמעות היא שהצענו את ממשקי ה-API לקהילת פלטפורמות האינטרנט, והעברנו אותם לW3C Web Incubator Community Group להמשך דיון.

אנחנו מבקשים משוב מ-W3C, מ-Mozilla ומ-WebKit לגבי כל API.

במסמכי התיעוד המתאימים אפשר לקרוא מידע נוסף על התהליך הזה לכל API.

השתתפות ושיתוף משוב

אם ניסיתם את ה-AI המובנה ויש לכם משוב, נשמח לשמוע אותו.