דיגיטל וטק
גוגל מציגה: זה השדרוג הגדול שיגיע ל-Gemini בקרוב?
גרסת הבטא של Gemini כוללת רמזים לפיצ’ר חדש שיאפשר העלאת קבצי קול לצ'אט. המטרה - להבין הקלטות, לנתח שיחות ולספק תשובות מדויקות בזמן אמת. זה הצעד שישדרג את ה-AI של גוגל?
גרסת הבטא האחרונה של אפליקציית Gemini לאנדרואיד כוללת סימנים ראשונים לפיצ’ר חדש שיכלול תמיכה בהעלאת קבצי אודיו לצ’אט, כולל פורמטים כמו MP3. הפיצ’ר עדיין לא פעיל במלואו, אך מעיד על כיוון ההתפתחות של צ'אטבוט הבינה המלאכותית, משימוש בטקסט בלבד לממשק מולטי מודאלי אמיתי.
גרסת הבטא כוללת כפתור חדש המאפשר לצרף קבצי קול לשיחה עם הצ'אטבוט. לאחר ההעלאה מופיעה האפשרות "לדבר על זה עכשיו", שמרמזת על שיחה חיה בהסתמך על הקובץ. עם זאת, בשלב זה, המודל לא מצליח לפענח את הקבצים או להגיב להם בצורה עקבית, ולעיתים אף מספק תשובות שגויות או מנותקות מהתוכן.
היכולות שמפותחות כעת באפליקציה מתבססות על פונקציונליות קיימת בממשק המפתחים (API) של Gemini, שם כבר ניתן להזין קבצי אודיו, לקבל תיאור או תמלול שלהם, ואף להפיק מענה לפי זמנים מדויקים מתוך הקובץ.
עוד ב-
בגוגל טרם הודיעו מתי יושק הפיצ'ר רשמית, אולם בעוד שתמיכה מלאה באודיו טרם זמינה באפליקציה, ההתקדמות העקבית בפיצ’רים כמו תמיכה בהעלאת תמונות, מצביעה על כך שאודיו הוא ככל הנראה הצעד הבא.
הכתבות החמות
תגובות לכתבה(0):
תגובתך התקבלה ותפורסם בכפוף למדיניות המערכת.
תודה.
לתגובה חדשה
תודה.
לתגובה חדשה
תגובתך לא נשלחה בשל בעיית תקשורת, אנא נסה שנית.
חזור לתגובה
חזור לתגובה



