DeepSeek به ترند جهانی تبدیل شد
آزمایشگاه هوش مصنوعی چینی DeepSeek این هفته با صعود چتبات خود به صدر دانلودهای اپ استور اپل و گوگل پلی، به شهرت بینالمللی رسید. مدلهای پیشرفته این شرکت که با بهینهسازی محاسباتی آموزش دیدهاند، موجب نگرانی تحلیلگران والاستریت و متخصصان فناوری شدهاند. آنها اکنون درباره توانایی آمریکا در حفظ برتری خود در رقابت هوش مصنوعی و پایداری تقاضا برای تراشههای AI تردید دارند.
اما DeepSeek از کجا آمده و چگونه به این سرعت به شهرت جهانی دست یافته است؟
ریشههای DeepSeek در بازارهای مالی
شرکت DeepSeek تحت حمایت High-Flyer Capital Management، یک صندوق پوشش ریسک (Hedge Fund) چینی با رویکرد کوانتیتیو است که از هوش مصنوعی در معاملات مالی بهره میبرد.
لیانگ ونفنگ، علاقهمند به هوش مصنوعی، در سال ۲۰۱۵ شرکت High-Flyer را بنیان گذاشت. او که از دوران دانشجویی در دانشگاه ژجیانگ به معاملات مالی علاقهمند بود، در سال ۲۰۱۹ صندوق High-Flyer Capital Management را راهاندازی کرد تا روی توسعه و پیادهسازی الگوریتمهای هوش مصنوعی مالی تمرکز کند.
در سال ۲۰۲۳، این صندوق DeepSeek را بهعنوان یک آزمایشگاه اختصاصی برای تحقیق و توسعه ابزارهای هوش مصنوعی تأسیس کرد. DeepSeek در ابتدا زیرمجموعه High-Flyer بود، اما بعدها بهعنوان شرکتی مستقل به فعالیت خود ادامه داد.
از همان ابتدا، DeepSeek مراکز داده اختصاصی خود را برای آموزش مدلهای هوش مصنوعی راهاندازی کرد. بااینحال، مانند سایر شرکتهای هوش مصنوعی چین، این شرکت نیز تحت تأثیر تحریمهای صادراتی ایالات متحده بر سختافزار قرار گرفت. برای مثال، بهدلیل محدودیتها، این شرکت مجبور شد از تراشههای Nvidia H800 (نسخه ضعیفتر H100 که برای شرکتهای آمریکایی قابلدسترسی است) استفاده کند.
تیم فنی DeepSeek عمدتاً از نیروهای جوان تشکیل شده است. این شرکت بهطور گسترده محققان دکترای هوش مصنوعی را از دانشگاههای برتر چین جذب میکند و همچنین افرادی را که پیشزمینهای در علوم کامپیوتر ندارند، برای بهبود درک مدلهای خود از موضوعات مختلف به کار میگیرد.
فناوری پیشرفته DeepSeek
در نوامبر ۲۰۲۳، DeepSeek نخستین مجموعه مدلهای خود، شامل DeepSeek Coder، DeepSeek LLM و DeepSeek Chat را معرفی کرد. اما نقطه عطف این شرکت زمانی رقم خورد که در بهار ۲۰۲۴ از مدلهای DeepSeek-V2 رونمایی کرد و توجه صنعت هوش مصنوعی را به خود جلب نمود.
DeepSeek-V2 که یک سیستم تحلیل متن و تصویر چندمنظوره است، در آزمونهای هوش مصنوعی عملکرد فوقالعادهای داشت و هزینه اجرای آن نیز بهمراتب کمتر از مدلهای مشابه بود. این موفقیت باعث شد شرکتهای چینی رقیب مانند ByteDance و Alibaba قیمت استفاده از برخی مدلهای خود را کاهش دهند یا برخی دیگر را بهصورت رایگان در اختیار کاربران قرار دهند.
در دسامبر ۲۰۲۴، DeepSeek با عرضه مدل DeepSeek-V3 به شهرت بیشتری دست یافت.
آزمایشهای داخلی DeepSeek نشان میدهد که مدل DeepSeek-V3 از مدلهای قابلدانلودی مانند Llama متا و حتی مدلهای «بسته» نظیر GPT-4o از OpenAI که فقط از طریق API ارائه میشوند، عملکرد بهتری دارد.
یکی دیگر از مدلهای چشمگیر DeepSeek، مدل R1 است که بهعنوان یک مدل «استدلالی» معرفی شده است. این مدل که در ژانویه ۲۰۲۵ منتشر شد، به گفته DeepSeek، در آزمونهای کلیدی به اندازه مدل o1 از OpenAI عملکرد خوبی دارد.
ویژگی اصلی مدل R1 توانایی خودارزیابی و تصحیح پاسخهای خود است، که باعث میشود از برخی مشکلات رایج مدلهای معمولی جلوگیری کند. البته، مدلهای استدلالی معمولاً برای رسیدن به پاسخ به زمان بیشتری نیاز دارند، اما در حوزههایی مانند فیزیک، علوم و ریاضیات دقت بالاتری دارند.
با این حال، یکی از چالشهای مدلهای DeepSeek، از جمله R1 و DeepSeek-V3، این است که تحت نظارت نهادهای دولتی چین قرار دارند و باید با ارزشهای سوسیالیستی همخوانی داشته باشند. بهعنوان مثال، چتبات DeepSeek به سؤالاتی درباره رویداد میدان تیانآنمن یا خودمختاری تایوان پاسخی ارائه نمیدهد.
رویکردی متفاوت و چالشبرانگیز
مدل کسبوکار DeepSeek هنوز ابهاماتی دارد. این شرکت برخی خدمات خود را کاملاً رایگان ارائه میدهد و سایر محصولات را با قیمتی بسیار پایینتر از رقبا عرضه میکند.
DeepSeek مدعی است که با دستیابی به پیشرفتهای چشمگیر در بهینهسازی محاسباتی، توانسته است هزینههای خود را بهطور قابلتوجهی کاهش دهد. اما برخی کارشناسان در صحت اعداد و ارقام ارائهشده توسط این شرکت تردید دارند.
بااینحال، توسعهدهندگان استقبال گستردهای از مدلهای DeepSeek داشتهاند. اگرچه این مدلها کاملاً متنباز نیستند، اما تحت مجوزهایی عرضه شدهاند که امکان استفاده تجاری را فراهم میکنند.
موفقیت DeepSeek در برابر رقبای بزرگ و باسابقه، بهعنوان «تحولی در صنعت هوش مصنوعی» یا «تبلیغ بیشازحد» توصیف شده است. این شرکت حتی بر قیمت سهام Nvidia نیز تأثیر گذاشت و در ژانویه ۲۰۲۵ باعث افت ۱۸ درصدی آن شد، همچنین واکنش عمومی سم آلتمن، مدیرعامل OpenAI را برانگیخت.
مایکروسافت اعلام کرده که DeepSeek از طریق سرویس Azure AI Foundry در دسترس است. در همین حال، مارک زاکربرگ، مدیرعامل متا، در گزارش مالی فصل اول ۲۰۲۵ اشاره کرد که سرمایهگذاری در زیرساختهای هوش مصنوعی همچنان یک «مزیت استراتژیک» برای متا خواهد بود.
در مقابل، برخی شرکتها و حتی کشورها استفاده از DeepSeek را ممنوع کردهاند. برای مثال، دولت کره جنوبی و ایالت نیویورک استفاده از این چتبات را در دستگاههای دولتی مسدود کردهاند.
آینده DeepSeek هنوز مبهم است، اما به نظر میرسد این شرکت برنامههای جاهطلبانهای برای عرضه مدلهای پیشرفتهتر در آینده دارد.
source