هوش مصنوعی چینی کاخ سفید را ترساند افت سهام انویدیا و رمزارزها

نقشه: کاخ سفید تصمیم دارد درباره ی هوش مصنوعی چینی دیپ سیک مطالعه کند اما شواهد حاکی از آنست که این فناوری بسیار ساده تر و کم هزینه تر از مدلهای آمریکایی است.

به گزارش نقشه به نقل از مهر، بگفته کارولین لیویت، سخنگوی کاخ سفید، مقامات آمریکایی مشغول بررسی نتایج امنیت ملی هوش مصنوعی چینی «دیپ سیک» هستند. این درحالی است که تزار رمزارز دونالد ترامپ اعلام نمود دراین خصوص احتمالاً سرقت مالکیت معنوی رخ داده است! لیویت در این زمینه اضافه کرد: این یک زنگ هوشیار برای صنعت هوش مصنوعی آمریکا است. سخنان او انعکاسی از اظهارات ترامپ است. وی همین طور اظهار نمود کاخ سفید تلاش می کند تا تسلط هوش مصنوعی آمریکا بر بازار را تضمین کند. رویترز با انتشار این مطلب آورده است: سرمایه گذاران بازار سهام در سرتاسر جهان روز دوشنبه سهام شرکت های فناوری را به سبب نگرانی ها درباره ی ظهور یک مدل هوش مصنوعی چین ارزان که تهدیدی برای سلطه رهبران آمریکایی بازار هوش مصنوعی (مانند اوپن ای آی و گوگل) به شمار می روند، فروختند. «دیوید ساکس» تزار هوش مصنوعی و رمزارز کاخ سفید در جواب سوال شبکه خبری فاکس نیوز درباره ی آنکه سرقت مالکیت معنوی در اوج گیری دیپ سیک نقشی داشته یا خیر، اظهار داشت: خب این امر امکان دارد. در هوش مصنوعی تکنیکی به نام عصاره گیری وجود دارد که درباره ی آن مطالب زیادی خواهید شنید و این زمانی اتفاق می افتد که یک مدل از مدل دیگر می آموزد. ایشان سپس اضافه کرد: تصور می کنم یکی از مواردی که در چند ماه آتی مشاهده می کنید آنست که شرکت های برتر هوش مصنوعی ما با اتخاذ گام هایی اهتمام در ممانعت از پروسه عصاره گیری می کنند. این امر به طور قطع تعدادی از مدلهای کپی شده را کندتر می کند. اما در این بین نمی توان صحبت های تزار هوش مصنوعی کاخ سفید را کاملا صحیح دانست. بی گمان، رونمایی از مدل DeepSeek R۱ داغ ترین اتفاق چند روز گذشته هوش مصنوعی بود. زلزله ای که لرزه هایش به هوش مصنوعی محدود نماند و پس لرزه هایش موجب ریزش ۲۰ درصدی قیمت سهام انویدیا در ۵ روز گذشته شده و این افت قیمت سهام هم مثل دومینو موجب ریزش قیمت بیتکوین و سایر رمزارزها شد اما اهمیت DeepSeek R۱ چیست.
نخست آنکه این نخستین جهش DeepSeek نیست. حدود ۲۰ روز پیش این شرکت چینی، مدل DeepSeek V۳ خودرا را بصورت منبع باز منتشر نمود. مدلی که در عملکرد بالاتر از Llama و در رقابت نزدیک با GPT-۴o قرار می گیرد و البته طبق ادعاهایش تنها با ۵.۵ میلیون دلار آموزش دیده است. اهمیت DeepSeek V۳ در این بود که آموزش مدل در چنین ابعادی، بخصوص با درنظر گرفتن تحریم GPU های H۱۰۰ که آمریکا بر چین تحمیل کرده، کار راحتی نیست. در حقیقت برای آموزش LLM هایی در این ابعاد باید تعداد بسیار زیادی H۱۰۰ به هم متصل شوند و با هم آموزش ببینند. حال آنکه آمریکا هم فروش H۱۰۰ به چین را ممنوع کرده است. در همین جهت انویدیا یک نسخه دستکاری شده از H۱۰۰ به نام H۸۰۰ را که نرخ انتقال داده کمتری دارد برای شرکت های چینی می سازد و به آنها می فروشد. به این علت حدس زده شد که چینی ها GPU های H۸۰۰ را به هم متصل کردند و سپس در سطحی پایین تر از Cuda آنها را برنامه ریزی کردند تا بتوانند به چنین عملکردی دست یابند.
اما این روند به DeepSeek V۳ ختم نشد و چین بعد از پنجه در پنجه انداختن با GPT-۴o این دفعه سراغ زورآزمایی با GPT-o۱ رفت و از مدل DeepSeek R۱ رونمایی نمود. نکته این مدل آنست که قدرت استدلال در سطح o۱ دارد، با فقط ۶ میلیون دلار هزینه درست شده است. همین طور قیمت اینفرنس آن هم نسبت به o۱ پایین تر است.
در درجه سوم نکته فنی که نمی توان از آن عبور کرد، نوآوری R۱ در نحوه آموزش هست. مغز نوآوری که چینی ها برای این مدل به خرج دادند آنست که بجای استفاده از SFT مستقیما از RL استفاده کردند. یعنی مدل را فقط در یک ستینگ RL آن هم با دو ریوارد مدل ساده ای که یکی از آنها مقرر است جواب غائی را چک می کند و دیگری مدل را ملزم به خروجی داده در یک فرمت خاص کند، آموزش دادند. نکته جالب اینه که این ریوارد مدلها بسیار ساده هستند و فقط می توان آنها را Rule-Based دید.
براساس گزارش روزنامه شریف، در درجه چهارم، چرا سیلیکون ولی و انویدیا گرفتار شوک شدند؟ حرف و حدیث دراین خصوص زیاد است. بعضی ها تحلیل کرده اند که شاید اینکه روش R۱ توانسته بدون تکیه بر مهارتهای Inference Time Compute که مستلزم استفاده بیش از قدرت محاسباتی هستند، به AGI نزدیک شود از اهمیت GPU ها کاسته است.
آنچه قابل توجه است این است که این یک شوک موقتی است و از ۳ امر ناشی می شود. نخست آنکه بالاخره چینی ها توانستند در حوزه مدلهای زبانی به رقابت نزدیک به آمریکا برسند و در صورتیکه همیشه لابراتوار های هوش مصنوعی چینی عقب تر از آمریکایی ها بودند، R۳ را می توان به مثابه یک شوک و نقطه عطف برای مونوپلی آمریکا در هوش مصنوعی به حساب آورد. دوما اینکه قیمت پایین آموزش و اینفرنس R۱ ممکنست موجب یک تکانه به وابستگی به nvidia باشد که البته فقط در حد یک شوک موقت خواهد بود. در درجه سوم از این زاویه می توان این مساله را نگاه کرد که DeepSeek توانسته تحریم های آمریکا در حوزه GPU را کم اثرتر کند و شاید این روند در آینده ادامه دار باشد.
پنجم، آیا DeepSeek برنده شده است؟ هنوز نه. چونکه o۳ هنوز عملکرد بسیار بهتری نسبت به R۱ دارد، با این وجود R۱ کاراتر است و می تواند روی دیوایس ها اجرا شود و هم هزینه اینفرنس پایین تری دارد. از طرف دیگر با منبع باز کردن آن فشار برای کاهش قیمت به مدل هایی مثل o۱ و o۱-mini وارد میکند. باید دید رقابت بین آمریکایی ها و چینی ها در ادامه چه خواهد شد.

1403/11/10

11:48:23

5.0 از 5

تگهای خبر: آموزش , بازار , زلزله , فناوری

این مطلب Go Map را می پسندید؟

(1)

(0)

تازه ترین مطالب مرتبط در نقشه

نظرات بینندگان نقشه در مورد این مطلب

لطفا شما هم در مورد این مطلب نظر دهید

= ۳ بعلاوه ۴

ارسال نظر