טביעות אצבע ראשוניות ש DeepSeek הסינית השתמשו ב chatgpt במודל

OpenAI ומיקרוסופט חוקרות: האם DeepSeek השתמשה בנתוני OpenAI כדי לאמן את המודלים שלה?

מאת משה סבאג
עודכן 29.01.2025 13:22

כדי לעשות פעולה זו עליך להתחבר

בהצטרפותכם למערכת, תוכלו ליהנות מהיתרונות הבאים:

גישה לתוכן ללא פרסומות.

אפשרות לשנות את שפת הממשק לשפה שאתם מעדיפים.

אפשרות להתאים את גודל הטקסט.

הזדמנות לדווח על תוכן לא הולם או פרסום לא מתאים.

אפשרות לשמור מאמרים ותוכן שאתם אוהבים לקריאה מאוחרת.

הזדמנות להתבטא ולהגיב על המאמרים שתקראו.

התחבר עם סיסמה

התאמת גודל טקסט

מצאתם טעות בכתבה? ספרו לנו

האשמות חמורות על גניבת נתונים במרוץ הבינה המלאכותית

חברת הבינה המלאכותית הסינית DeepSeek חוללה סערה בעמק הסיליקון עם השקת מודלים מוזלים שמתחרים בהצעות המובילות של OpenAI – אך כעת ייתכן שהתבססו על נתוני OpenAI עצמה.

על פי דיווחים של Bloomberg, OpenAI ומיקרוסופט פתחו בחקירה כדי לבדוק האם DeepSeek השתמשה ב-API של OpenAI כדי להטמיע את המודלים שלה בתוך המערכות של DeepSeek. מקורות מסרו כי חוקרי אבטחה במיקרוסופט זיהו כמויות גדולות של נתונים שזלגו דרך חשבונות מפתחים של OpenAI בסוף 2024 – חשבונות שלטענתם קשורים ל-DeepSeek.

שימוש בטכניקת "דיסטילציה" להעתקת נתונים

OpenAI מסרה ל-Financial Times כי היא מצאה עדויות לכך ש-DeepSeek השתמשה בטכניקת דיסטילציה – שיטה נפוצה שבאמצעותה מפתחים מאמנים מודלים קטנים יותר על בסיס נתוני פלט של מודלים גדולים יותר. מדובר בגישה חסכונית שמאפשרת לבנות מודלים מתחרים בעלות נמוכה משמעותית מההשקעה של 100 מיליון דולר ש-OpenAI הוציאה על אימון GPT-4.

למרות שמפתחים רשאים להשתמש ב-API של OpenAI כדי לשלב את היכולות של מודליה באפליקציות שלהם, שימוש בפלט של המודלים ליצירת מתחרים מהווה הפרה של תנאי השימוש של OpenAI. עם זאת, החברה טרם חשפה את הפרטים המלאים של הראיות שברשותה.

אירוניה במרוץ הבינה המלאכותית

המצב הנוכחי טעון באירוניה: OpenAI עצמה התקדמה משמעותית בפיתוחי ה-GPT שלה בזכות גישה נרחבת לתוכן האינטרנטי הקיים ללא אישור. כעת, היא מוצאת את עצמה בצד המאשים כאשר מתחרה סינית עושה לכאורה מהלך דומה.

תגובות מהקהילה והמעורבות הממשלתית

דייויד זקס, "הצאר של הבינה המלאכותית" תחת ממשלו של דונלד טראמפ, אמר ל-Fox News כי "ייתכן מאוד שהתרחשה גניבת קניין רוחני".

"יש ראיות משמעותיות לכך ש-DeepSeek השתמשה בדיסטילציה כדי להוציא ידע ממודלים של OpenAI, וזה בהחלט לא משהו שהחברה רואה בעין יפה."

OpenAI הגיבה לטענות בהצהרה ל-Bloomberg:

"אנו יודעים כי חברות מבוססות סין (PRC) – וכן גורמים אחרים – מנסות ללא הרף לבצע דיסטילציה של המודלים של חברות הבינה המלאכותית המובילות בארה"ב. כחלוצים בתחום, אנו נוקטים אמצעים נגדיים להגנת הקניין הרוחני שלנו. אנו פועלים בתהליך קפדני לקביעת אילו יכולות ישולבו במודלים המוצעים לציבור, ומאמינים כי שיתוף פעולה הדוק עם ממשלת ארה"ב הוא קריטי להגנה על הטכנולוגיות המתקדמות ביותר מפני יריבים ומתחרים שמנסים להשתלט עליהן."

השלכות עתידיות

חקירה זו עשויה לגרור השלכות משפטיות משמעותיות ולהשפיע על יחסי ארה"ב-סין בתחום הבינה המלאכותית. אם יוכח כי DeepSeek הפרה את תנאי השימוש של OpenAI, ייתכן ויהיו לכך השלכות רגולטוריות משמעותיות על שוק הבינה המלאכותית העולמי.

מקור : בלומברג

מקור נוסף : Financial Times

האשמות חמורות על גניבת נתונים במרוץ הבינה המלאכותית

שימוש בטכניקת "דיסטילציה" להעתקת נתונים

אירוניה במרוץ הבינה המלאכותית

תגובות מהקהילה והמעורבות הממשלתית

השלכות עתידיות

תגובות 1