
OpenAI اکنون ممکن است مترادف با یادگیری ماشینی باشد و گوگل تمام تلاش خود را می کند تا خود را از زمین خارج کند، اما هر دو به زودی با یک تهدید جدید روبرو خواهند شد: تکثیر سریع پروژه های منبع باز که در حال پیشرفت هستند و به جیب های عمیق می پردازند، اما باعث می شوند که چوب بری شود. شرکت ها در غبار خود. این تهدید زرگ مانند ممکن است وجودی نباشد، اما مطمئناً بازیکنان مسلط را در خط دفاعی نگه میدارد.
این فکر بسیار جدید نیست – در جامعه هوش مصنوعی سریع، انتظار می رود این نوع اشکالات به صورت هفتگی دیده شوند – اما این وضعیت توسط یک چشم انداز مورد توجه قرار گرفته است. سند پرکاربرد ظاهراً از گوگل آمده است. در این یادداشت آمده است: «ما نه خندق داریم و نه OpenAI.
من بار خواننده را با خلاصهای طولانی از این مقاله کاملاً خواندنی و جالب نمیبرم، اما اصل ماجرا این است که اگرچه GPT-4 و سایر مدلهای اختصاصی سهم بزرگی از توجه و درآمد واقعی را به خود اختصاص دادند، اما با نگاههای مالی و زیرساختها به برتری رسیدند. روز به روز لاغرتر
در حالی که سرعت انتشار OpenAI ممکن است با توجه به استانداردهای نسخههای نرمافزار اصلی معمولی در حال انفجار به نظر برسد، GPT-3، ChatGPT و GPT-4 مطمئناً در مقایسه با نسخههای iOS یا Photoshop داغتر بودند. اما هنوز هم به ترتیب ماه ها و سال ها رخ می دهند.
این یادداشت اشاره می کند که در ماه مارس یک مدل زبان پایه فاش شده متا به نام LLaMA به شکل نسبتاً خام فاش شد. در داخل هفته هاافرادی که با لپتاپها و سرورهای یک پنی در دقیقه سر و کله میزنند، ویژگیهای اصلی مانند رایگیری دستورالعمل، روشهای متعدد و یادگیری تقویتی از بازخورد انسانی را اضافه کردهاند. OpenAI و Google نیز احتمالاً به دنبال کد هستند، اما آنها می توانند – نمی توانند – سطح همکاری و آزمایشی را که در subreddit ها و اختلافات رخ می دهد تکرار کنند.
آیا واقعاً ممکن است مشکل محاسباتی غول پیکری که به نظر می رسید مانعی غیرقابل عبور – یک گودال – را برای رقبا ایجاد کند، در حال حاضر یادگاری از دوران دیگری از توسعه هوش مصنوعی باشد؟
سام آلتمن قبلاً اشاره کرده است که وقتی پارامترها را روی مشکل می اندازیم، باید انتظار بازدهی کاهشی داشته باشیم. مطمئناً بزرگتر همیشه بهتر نیست – اما تعداد کمی از آنها کوچکتر را حدس می زنند.
GPT-4 یک Walmart است و هیچ کس واقعاً Walmart را دوست ندارد
پارادایم تجاری که در حال حاضر توسط OpenAI و دیگران دنبال می شود، از نسل مستقیم مدل SaaS است. آنها دارای یک نرم افزار یا سرویس با ارزش بالا هستند و از طریق یک API یا موارد مشابه دسترسی محافظت شده به آن را ارائه می دهند. این یک رویکرد ساده و اثبات شده است که زمانی کاملاً منطقی است که صدها میلیون دلار برای توسعه یک محصول یکپارچه و در عین حال همه کاره مانند یک مدل زبان بزرگ سرمایه گذاری کرده باشید.
اگر GPT-4 برای پاسخ به سؤالات مربوط به سابقه در حقوق قراردادها به خوبی تعمیم دهد، بسیار عالی است – اگرچه بیشتر «عقل» آن به تقلید از سبک هر نویسنده ای اختصاص دارد که تا به حال اثری را به زبان انگلیسی منتشر کرده است. GPT-4 مانند Walmart است. در واقع هیچکس خواستن رفتن به آنجا، بنابراین شرکت مطمئن است که گزینه دیگری وجود ندارد.
اما مشتریان شروع به تعجب کرده اند که چرا من در 50 راهروی آشغال قدم می زنم تا مقداری سیب بخرم؟ چرا بزرگترین و جهانی ترین مدل هوش مصنوعی را استخدام می کنم که تا به حال ساخته شده است، در حالی که تنها کاری که می خواهم انجام دهم این است که از کمی هوش برای تطبیق زبان این قرارداد با چند صد مورد دیگر استفاده کنم؟ در خطر شکنجه استعاره (غیر از ذکر خواننده)، اگر GPT-4 والمارتی است که برای آن سیب می خرید، وقتی میوه فروشی در پارکینگ باز می شود چه اتفاقی می افتد؟
در دنیای هوش مصنوعی، طولی نکشید که یک مدل زبان بزرگ، البته به شکل بسیار مختصر، بر روی (به طور مناسب) Raspberry Pi اجرا شود. برای شرکتی مانند OpenAI، مایکروسافت، گوگل، یا هر شخص دیگری در دنیای هوش مصنوعی، این امر به طور موثر کل پیشفرض کسب و کار آنها را به چالش میکشد: ساخت و راهاندازی این سیستمها آنقدر دشوار است که مجبورند آن را برای شما انجام دهد. در واقع، به نظر می رسد که این شرکت ها نسخه ای از هوش مصنوعی را انتخاب کرده و توسعه داده اند که متناسب با مدل کسب و کار موجود آنها باشد و نه برعکس!
قبلاً مجبور بودید محاسبات مربوط به پردازش کلمه را در یک رایانه اصلی بارگذاری کنید—ترمینال شما فقط یک نمایشگر بود. البته آن زمان متفاوت بود، و ما مدت هاست که می توانستیم کل برنامه را روی یک کامپیوتر شخصی قرار دهیم. این فرآیند از آن زمان تاکنون بارها اتفاق افتاده است، زیرا دستگاه های ما به طور مکرر و به طور تصاعدی قدرت محاسباتی خود را افزایش داده اند. امروزه، زمانی که باید کاری در یک ابر کامپیوتر انجام شود، همه می فهمند که این فقط یک مسئله زمان و بهینه سازی است.
برای گوگل و OpenAI، زمان بسیار سریعتر از حد انتظار فرا رسید. و آنها کسانی نبودند که این تغییرات را انجام می دادند – و ممکن است هرگز آن را با این سرعت انجام ندهند.
خوب، این به این معنی نیست که آنها بدشانس هستند. گوگل نتوانست بهترین باشد – حداقل برای مدت طولانی. والمارت بودن مزایای خود را دارد. کسبوکارها نمیخواهند راهحل سفارشیای را بیابند که کار را 30 درصد سریعتر انجام میدهد، وقتی میتوانند قیمت مناسبی را از فروشنده فعلیشان دریافت کنند و قایق را زیاد تکان ندهند. هرگز ارزش تنبلی در تجارت را دست کم نگیرید!
مطمئناً، مردم آنقدر سریع LLaMA را تکرار میکنند که شترهایشان تمام میشود تا نام آنها را بگذارند. به هر حال، میخواهم از توسعهدهندگان تشکر کنم که بهانهای برای مرور صدها عکس از عکسهای بامزههای بامزه دارند. ویکوناس به جای کار کردن اما تعداد کمی از دپارتمانهای فناوری اطلاعات سازمانی، پیادهسازی مشتق منبع باز Stability را در یک فرامدل لو رفته شبه قانونی از طریق API ساده و مؤثر OpenAI ترکیب میکنند. شما یک تجارت دارید که باید اداره کنید!
اما در همان زمان استفاده از فتوشاپ را برای ویرایش و ایجاد تصویر سالها پیش متوقف کردم، زیرا گزینههای منبع باز مانند Gimp و Paint.net بسیار خوب شدهاند. در این مرحله بحث به سمت دیگری می رود. چقدر برای فتوشاپ پرداخت کنید؟ به هیچ وجه، ما یک تجارت داریم!
چیزی که نویسندگان ناشناس گوگل به وضوح نگران آن هستند این است که فاصله موقعیت اول تا موقعیت دوم بسیار کمتر از آن چیزی است که هر کسی فکر می کرد، و به نظر نمی رسد کسی بتواند در مورد آن کاری انجام دهد.
مگر اینکه یادداشت استدلال کند: آن را بپذیر. باز کردن، انتشار، همکاری، اشتراک گذاری، سازش. وقتی بسته می شوند:
گوگل باید خود را به عنوان یک رهبر در جامعه منبع باز تثبیت کند و با همکاری با بحث گسترده تر، رهبری را به عهده بگیرد، نه نادیده گرفتن آن. این احتمالاً به معنای برداشتن برخی اقدامات ناخوشایند است، مانند: ب. انتشار وزن مدل برای انواع کوچک ULM. این به ناچار به معنای کنار گذاشتن کنترل مدل هایمان است. اما این سازش اجتناب ناپذیر است. ما نمی توانیم امیدوار باشیم که همزمان نوآوری را هدایت کنیم و آن را کنترل کنیم.