«دیپ‌سیک»«دیپ‌سیک»

تحقیقات یک شرکت تحقیقاتی مستقل نشان می‌دهد که هزینه آموزش هوش مصنوعی چینی «دیپ‌سیک»(DeepSeek) به جای ۶ میلیون دلار اعلامی، ۱.۳ میلیارد دلار بوده است.

به گزارش مرزاقتصاد _ یکی از جالب توجه‌ترین ادعاهایی که به تازگی مطرح شده، این است که هوش مصنوعی چینی DeepSeek V3 تنها با حدود ۶ میلیون دلار، آموزش دیده است.

اکنون یک شرکت تحقیقاتی مستقل به نام سمی‌آنالایزیس(SemiAnalysis) در آخرین گزارش خود، «دیپ‌سیک» را زیر ذره‌بین برده است.

این شرکت تحقیقاتی، برخی از روایت‌های رایج در مورد هزینه‌های صرف شده برای توسعه «دیپ‌سیک» را به چالش می‌کشد و آنها را با فناوری‌های رقیب در بازار مقایسه می‌کند.

یکی از برجسته‌ترین ادعاهایی که در جریان است، این است که مدل هوش مصنوعی DeepSeek V3 حدود ۶ میلیون دلار هزینه آموزش را متحمل شده است. با این حال، گزارش این شرکت تحقیقاتی این رقم را تحلیل و بیان می‌کند که چندین عامل مهم در نظر گرفته نشده است.

افسانه ۶ میلیون دلاری «دیپ‌سیک»

برآورد ۶ میلیون دلاری در درجه اول، هزینه‌های پیش‌آموزشی پردازنده‌های گرافیکی(GPU) را در نظر می‌گیرد و از سرمایه‌گذاری‌های قابل توجه در تحقیق و توسعه، زیرساخت‌ها و سایر هزینه‌های ضروری که به شرکت تحمیل می‌شود، غفلت می‌کند.

این گزارش نشان می‌دهد که کل هزینه سرور دیپ‌سیک(CapEx) بالغ بر ۱.۳ میلیارد دلار است که اغلب این تعهد مالی به سمت راه‌اندازی و حفظ خوشه‌های GPU گسترده آن که ستون فقرات قدرت محاسباتی آن هستند، هدایت می‌شود.

گزارش شده است که «دیپ‌سیک» به حدود ۵۰ هزار پردازنده گرافیکی هاپر(Hopper) دسترسی دارد که منجر به برخی تصورات غلط شده است.

شرکت SemiAnalysis روشن می‌کند که این معادل داشتن ۵۰ هزار تراشه H100 نیست، بلکه در عوض، ترکیبی از مدل‌ها از جمله تراشه‌های H800، H100 و به خصوص H20‌ است که توسط شرکت انویدیا(NVIDIA) در واکنش به محدودیت‌های صادراتی ایالات متحده تولید می‌شوند.

این درک دقیق از موجودی سخت افزاری چینی‌ها بر تصمیمات استراتژیک در منبع‌یابی و بهره‌وری عملیاتی در «دیپ‌سیک» تاکید می‌کند.

یکی از جنبه‌های قابل توجه این گزارش، بازتاب آن بر ساختار سازمانی «دیپ‌سیک» است. برخلاف برخی از آزمایشگاه‌های بزرگ‌تر هوش مصنوعی، «دیپ‌سیک» مراکز داده خود را، خودش راه‌اندازی و مدیریت می‌کند و از یک مدل ساده استفاده می‌کند که به چابکی و کارایی آن کمک می‌کند. همانطور که چشم انداز هوش مصنوعی به طور فزاینده‌ای به صورت رقابتی رشد می‌کند، این توانایی برای انطباق سریع، به یک دارایی حیاتی تبدیل می‌شود.

قابلیت استدلال بهتر

از نظر عملکرد، تجزیه و تحلیل جدید نشان می‌دهد که مدل DeepSeek R1قابلیت‌های استدلال قابل مقایسه با مدل o1  شرکت اوپن‌ای‌آی(OpenAI) را نشان می‌دهد. با این حال، از برچسب زدن به «دیپ‌سیک» به عنوان پیشتاز بلامنازع در تمام معیارهای عملکردی خودداری می‌کند.

در حالی که استراتژی هزینه و قیمت‌گذاری «دیپ‌سیک»، توجهات و تحسین‌های بسیاری را به خود جلب کرده است، یک نکته مهم وجود دارد و آن اینکه هوش مصنوعی جمینای Flash 2.0 گوگل که از نظر قابلیت مشابه با «دیپ‌سیک» است، زمانی که از طریق سرویس‌های API به آن دسترسی داشته باشید، مقرون به صرفه‌تر است. این امر، «دیپ‌سیک» را در چهارراهی قرار می‌دهد که تعادل عملکرد و هزینه، کلید موفقیت آینده آن است.

فناوری «توجه نهفته چند سر»(MLA) «دیپ‌سیک»، یک نوآوری پیشگامانه است که در این گزارش به آن اشاره شده است.

این رویکرد پیشرفته به طور قابل توجهی هزینه‌های استنباط هوش مصنوعی را به میزان قابل توجهی، یعنی تا ۹۳.۳ درصد از طریق کاهش استفاده از حافظه پنهان(KV) کاهش می‌دهد که نشان دهنده یک جهش بزرگ به سمت راه حل‌های مقرون به صرفه در حوزه هوش مصنوعی است.

کارشناسان می‌گویند نوآوری‌هایی که از «دیپ‌سیک» پدیدار شده‌اند، احتمالاً به سرعت توسط آزمایشگاه‌های هوش مصنوعی غربی که مشتاق به ماندن در این رقابت هستند، پذیرفته می‌شوند.

در حالی که خوش‌بینی در مورد بهبودهای بالقوه و دستاوردهای کارایی «دیپ‌سیک» وجود دارد، شرکت تحقیقاتی SemiAnalysis در مورد چالش‌های خارجی آن نیز هشدار می‌دهد.

این گزارش حدس می‌زند که هزینه‌های عملیاتی می‌تواند تا پایان سال پنج برابر دیگر کاهش یابد که ناشی از توانایی «دیپ‌سیک» برای انطباق سریع در مقایسه با همتایان بزرگتر و بوروکراتیک‌تر خود است.

با این وجود، عملیات مقیاس‌پذیری در میان تشدید کنترل‌های صادراتی ایالات متحده، مانع مهمی است که «دیپ‌سیک» باید با دقت از آن عبور کند.

در پایان، شرکت SemiAnalysis تصویر پیچیده‌ای از جایگاه فعلی «دیپ‌سیک» در قلمرو هوش مصنوعی ترسیم می‌کند.

افشای ساختار هزینه، استفاده از GPU و قابلیت‌های نوآورانه، «دیپ‌سیک» را به عنوان یک بازیکن قدرتمند معرفی می‌کند.

همانطور که این شرکت چینی به تکامل خود ادامه می‌دهد، صنعت هوش مصنوعی از نزدیک، آن را تماشا می‌کند و مشتاق است ببیند چگونه به چالش‌ها و فرصت‌های در حال ظهور در یک چشم انداز همیشه در حال تغییر واکنش نشان می‌دهد.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *