
پاولو گونچار | راکت | گتی ایماژ
ایلان ماسک، مدیرعامل توییتر تهدید به شکایت کرد مایکروسافت روز چهارشنبه، غول نرم افزاری را به استفاده غیرقانونی از داده های این شرکت رسانه های اجتماعی برای آموزش مدل هوش مصنوعی خود متهم کرد.
تهدید ماسک از طریق توییت پس از آن منتشر شد که Mashable و سایر نشریات گزارش دادند مایکروسافت توییتر را از پلتفرم تبلیغاتی خود حذف می کند، که به خریداران تبلیغات امکان می دهد تمام حساب های رسانه های اجتماعی خود را در یک مکان مدیریت کنند.
ماسک در توییتی نوشت: «آنها به طور غیرقانونی با استفاده از داده های توییتر آموزش دیدند. “زمان دعوا”.
ماسک که مدیر عامل شرکت است تسلا و اسپیس ایکس، اغلب در مورد برنامه هایی که هرگز به نتیجه نمی رسند، توئیت می کنند و به نظر می رسد که هیچ شکایتی در این زمینه مطرح نشده است. خط مطبوعاتی توییتر به درخواست برای اظهار نظر پاسخ معناداری نداد و نماینده مایکروسافت از اظهار نظر خودداری کرد.
تهدید ماسک جدیدترین نشانه ای است که نشان می دهد مالکیت داده ها به سرعت در حال تبدیل شدن به یک میدان جنگ پرآشوب در هجوم هوش مصنوعی مولد است. شرکتهای بزرگ فناوری در حال کار بر روی توسعه مدلهای پیشرفته هوش مصنوعی مانند GPT OpenAI هستند و صاحبان دادهها به دنبال متوقف کردن آنها یا هزینه استفاده از محتوای آنها هستند.
مایکروسافت مدل های به اصطلاح زبان بزرگ (LLM) خود را توسعه می دهد و دسترسی به مدل های OpenAI را می فروشد. مایکروسافت سال گذشته 10 میلیارد دلار در OpenAI در یک معامله غیرمعمول با ساختار سرمایه گذاری کرد. ماسک قبل از ترک هیئت مدیره آن در سال 2018 یکی از بنیانگذاران OpenAI بود و اخیراً از انتقال این شرکت از یک مدل غیرانتفاعی به یک تجارت بسیار ارزشمند تحت تأثیر مایکروسافت شکایت کرده است.
LLM هایی مانند GPT برای آموزش به ترابایت داده نیاز دارند که بیشتر آن از وب سایت هایی مانند Reddit، StackOverflow و Twitter حذف می شود. داده های آموزشی از شبکه های اجتماعی ارزشمند است زیرا مکالمات غیررسمی و پشت سر هم را ضبط می کند.
همانطور که این مدلهای جدید هوش مصنوعی از آزمایشگاهها و دانشگاههای تحقیقاتی به دنیای شرکتها منتقل میشوند، صاحبان دادهها شروع به طرح خواستهها میکنند.
به عنوان مثال، Reddit اوایل این هفته گفت که از شرکتها برای دسترسی به رابط برنامهنویسی خود که برای تغذیه مکالمات بین Redditors به نرمافزار آموزشی هوش مصنوعی استفاده میشود، هزینه دریافت میکند. گروه موسیقی یونیورسال همچنین در این هفته گفت که چنین آموزش موسیقی هنرمندان در پاسخ به ویدیویی ویروسی از آهنگی که ادعا میکرد از هوش مصنوعی برای تقلید از رپر دریک استفاده میکند، «هم نقض توافقنامههای ما و هم نقض قانون کپی رایت» است.
و پایگاه داده عکس استوک Getty Images از Stable Diffusion شکایت کرده و ادعا می کند که این شرکت محتوای آن را برای آموزش تولید کننده تصویر هوش مصنوعی خود کپی کرده است.
ماسک در ماه دسامبر گفت که توییتر دسترسی OpenAI به پایگاه داده خود را “مکث” خواهد کرد. او همچنین اعلام کرده است که قصد دارد مدل زبان بزرگ خود را در یکی از شرکت هایش به نام TruthGPT بسازد.
تماشا کردن: ایلان ماسک می خواست در سال 2018 مسئولیت OpenAI را بر عهده بگیرد
