חיפוש
סגור את תיבת החיפוש

מיקרוסופט מציגה AI חדש: Phi-2 בעל 2.7 מיליארד פרמטרים שונים

מיקרוסופט הציגה היום את Phi-2, דגם שפה חדש בעל 2.7 מיליארד פרמטרים שונים. הדגם, שפותח על גבי מערכת האימון הגדולה ביותר של מיקרוסופט, מסוגל לבצע מגוון רחב של משימות, כולל תרגום שפות, כתיבת קוד, ויצירת תוכן יצירתי, האם יצליח להתחרות בChatGPT ו-Gemini של גוגל?

תגיות
תצלום של הצגת הבינה המלאכותית החדשה של מיקרוסופט
מקור: Microsoft Phi 2

מה זה Phi-2 של מיקרוסופט?

דגם השפה Phi-2 הוא מודל חדשני של מיקרוסופט, שמאפשר לעבד ולייצר טקסט וקוד באופן אוטומטי. המודל הוא חלק מסדרת המודלים הקטנים של מיקרוסופט, שנקראים “Phi”, שמציגים ביצועים מדהימים במגוון מבחנים. המודל הראשון, בעל 1.3 מיליארד פרמטרים, הגיע לרמה הגבוהה ביותר בין המודלים הקטנים בתכנות פייתון.

המודל השני, בעל 1.3 מיליארד פרמטרים גם הוא, הראה יכולות גבוהות בהבנת שפה ובהגיון יסודי. המודל השלישי, שמוצג עכשיו, הוא בעל 2.7 מיליארד פרמטרים, והוא מציג יכולות מופלאות בהבנת שפה, בהגיון מורכב, במתמטיקה, בתכנות, ובהגיון יומיומי. המודל מגיע לרמה הגבוהה ביותר בין המודלים הבסיסיים של פחות מ-13 מיליארד פרמטרים, ומשתווה או מעלה על מודלים גדולים בהרבה ממנו.

איך עובד דגם השפה Phi-2?

דגם השפה Phi-2 מבוסס על טכנולוגיית ה-Transformer, שהיא ארכיטקטורה של רשתות נוירונים עמוקות, שמאפשרת למודל ללמוד מהקשרים בין המילים בטקסט. המודל מקבל כקלט טקסט או קוד, ומייצר כפלט טקסט או קוד המשלים או מענה על הקלט. המודל משתמש במנגנון הקרוי “אטנשן”, שמאפשר לו להתמקד בחלקים החשובים ביותר של הקלט, ולהתעלם מהחלקים המיותרים.

המודל מורכב משני חלקים: המקודד והמפענח. המקודד אחראי להבנת הקלט, והמפענח אחראי לייצור הפלט. המודל משתמש בטכניקות שונות לשיפור הביצועים, כגון הגדלת המודל, הגדלת הנתונים, והעברת ידע.

מה היתרונות של דגם השפה Phi-2?

דגם השפה Phi-2 מציג יתרונות רבים לעומת מודלים אחרים בגודלו או גדולים ממנו. 

היתרונות העיקריים הם:

יכולת להתמודד עם משימות מורכבות ומגוונות בתחומים שונים, כגון הגיון, מתמטיקה, תכנות, והגיון יומיומי. המודל מראה ביצועים גבוהים במבחנים שונים, שמעידים על היכולת שלו להבין ולייצר טקסט וקוד באופן יצירתי ומדויק. המודל משתווה או מעלה על מודלים גדולים בהרבה ממנו, כגון ה-7 מיליארד Mistral, ה-13 מיליארד Llama-2, ואפילו ה-70 מיליארד Llama-2, בחלק מהמבחנים. המודל משתווה או מעלה גם על המודל החדש של גוגל, Gemini Nano 2, שבעל 3.2 מיליארד פרמטרים.

יעילות וחסכוניות בחשבון ובאנרגיה. המודל הוא קטן יחסית למודלים המובילים בתחום, ולכן הוא דורש פחות משאבים להכשרה ולהפעלה. המודל יכול לרוץ על מחשבים רגילים, ולא על סביבות חישוב מיוחדות. המודל גם יוצר פחות זיהום וטביעת רגל פחמן, ותורם לחסכון בסביבה.

יציבות ובטיחות בהתנהגות. המודל משתמש במנגנונים שונים למניעת התקלות ולשמירה על רמת האיכות של הטקסט והקוד שהוא מייצר. המודל משתמש בטכניקות של בדיקה, תיקון, והגנה, שמבטיחות שהמודל לא יפיק טקסט או קוד שגוי, לא הגיוני, או מסוכן. המודל גם משתמש בטכניקות של הגבלה, פילטרציה, והתאמה, שמונעות מהמודל לייצר טקסט או קוד שעלול להיות פוגעני, מעורר מחלוקת, או לא רצוי. המודל גם מציג את המקורות של המידע שהוא משתמש בהם, ומספק את ההסברים וההנחיות המתאימים לשימוש בטקסט או בקוד שהוא מייצר.

תגיות

אהבתם את הכתבה? שתפו

כתבות אחרונות

בינה מלאכותית ו-AI

חדשות רכב

מודעה