GPT‑4o
משנה את חוקי המשחק ביצירת תמונות
הכירו מודל תמונות נייטיב-מולטימודלי, שמסמן קפיצה דרמטית מיכולות דמיון מרהיבות בלבד – ליצירת תמונות שימושיות, מדויקות ועמוקות הקשר
📷 בתחום הוויזואל
עד היום, רוב מודלי התמונה התמקדו ביצירת סצנות יפהפיות, לעיתים סוריאליסטיות – אך התקשו לייצר דימויים אינפורמטיביים, מדויקים, עם משמעות ברורה. המודל החדש מביא יכולות חדשות הכוללות
יצירת טקסטים מדויקים בתוך תמונות – שלטים, גרפים, תפריטים והזמנות חתונה, עם טיפוגרפיה מושלמת והקשר חזותי חכם
עיבוד תמונה בהקשר לשיחה – המודל "מבין" את הדיון, מסוגל להתייחס לתמונה קודמת בשיחה, ולייצר גרסאות המשך קוהרנטיות
למידה מתוך תמונות שהמשתמש מעלה – ניתן לצרף תמונה קיימת, והמודל יבין אותה ויתבסס עליה
רמת דיוק מדהימה בפרטים קטנים – אפילו רמות זום, שקיפות, טקסטים זעירים, צללים והשתקפויות
🧠 הבנה עמוקה של העולם
המודל החדש עבר אימון על מיליוני זוגות של טקסטים ותמונות – לא רק כדי "לדעת לצייר" אלא כדי להבין מהי משמעות של תמונה, איך מידע ויזואלי מתקשר לעולם האמיתי, ואיך ניתן לייצר ממנו ערך קונקרטי
למשל
בדיחה ויזואלית בקומיקס בין מוח אנושי למוח של בינה מלאכותית
✏️ טקסט
במקום לראות תמונה וטקסט ככלים נפרדים, המודל החדש מסוגל לשלב מילים בתוך דימוי – באופן טבעי, קריא ומדויק, החל ממשפטים עדינים על לוח מגנטי במטבח ועד שלטים מצחיקים בכביש איילון
קרדיט ליצירת הפרומפט והתמונה: אורי בז׳ראנו
🧩 שליטה, הקשר, ועיבוד רב-שלבי
המודל החדש מעניק לנו את היכולת לבנות דימוי של דמות למשחק מחשב – ולהמשיך לפתח אותה בשיחה עם הבוט, עם מראה אחיד בכל גרסאות העיצוב, תפריטים, פרופילים ומשימות. זהו מעבר לעיצוב אינטראקטיבי מתמשך
🎨 סגנון וריאליזם חסרי תקדים
המודל יודע לא רק לצייר – אלא לצלם במילים. תמונות בסגנון פולארויד, אנימציה ריזוגרפית, צילום חתונה, ואפילו צילום פפראצי של קרל מרקס בקניון עם שקיות שופינג. הדיוק בפרטים והעיבוד הסגנוני מגיעים לרמה שכמעט בלתי ניתן להבחין שמדובר ביצירה מלאכותית
🚨 מגבלות זמניות
חיתוך מוגזם של תמונות גבוהות
טקסטים מורכבים בשפה העברית
קושי ביצירת דיאגרמות צפופות עם נתונים קטנים
קפיצה בין גרסאות עריכה שאינה תמיד עקבית