انتشار مدل هوش مصنوعی R1/ DeepSeek در پلتفرم Hugging Face – تجارت نیوز
استارتاپ چینی DeepSeek نسخه جدیدی از مدل هوش مصنوعی R1 را در پلتفرم Hugging Face منتشر کرد.
به گزارش تجارت نیوز، استارتاپ چینی DeepSeek نسخه بهروزرسانی شده مدل هوش مصنوعی R1 را در پلتفرم توسعهدهندگان Hugging Face منتشر کرد. این خبر در پیام ویدئویی که روز چهارشنبه در ویچت اعلام شد، منتشر گردید. این نسخه جدید R1 که تحت مجوز MIT قرار دارد، به این معنی است که میتواند بهطور تجاری مورد استفاده قرار گیرد. طبق اعلام DeepSeek، این بهروزرسانی جزئی محسوب میشود. در مخزن Hugging Face، توضیحاتی درباره مدل موجود نیست و فقط فایلهای پیکربندی و وزنها، که اجزای داخلی یک مدل را هدایت میکنند، در دسترس قرار گرفتهاند.
مدل سنگین با 685 میلیارد پارامتر
مدل بهروزرسانی شده R1 با سایز 685 میلیارد پارامتر به شدت سنگین است. در اینجا، «پارامترها» معادل «وزنها» هستند. بدون تغییرات لازم، احتمالاً این مدل نمیتواند بر روی سختافزارهای مصرفی اجرا شود.
DeepSeek در سال جاری پس از انتشار مدل R1 به شهرت رسید. این مدل توانست رقابت جدی با مدلهای OpenAI ایجاد کند. با این حال، استارتاپ چینی باعث جلب توجه برخی از مقامات نظارتی در ایالات متحده شده است. این مقامات معتقدند که فناوری DeepSeek ممکن است تهدیدی برای امنیت ملی محسوب شود.
افزایش نگرانیها درباره امنیت ملی
این نگرانیها در حالی مطرح میشود که DeepSeek به سرعت در حال گسترش و توسعه فناوریهای جدید است. برخی از تحلیلگران بر این باورند که پیشرفتهای این استارتاپ میتواند منجر به ایجاد فناوریهایی شود که قابلیتهای آنها از حد انتظار فراتر میرود.
در بیانیهای که DeepSeek در ویچت منتشر کرد، تأکید شد که این بهروزرسانی بر روی بهبود عملکرد و قابلیتهای مدل تمرکز دارد. با این حال، عملکرد این مدل بدون دسترسی به سختافزار مناسب به شدت محدود خواهد بود.
یکی از مقامات DeepSeek در این خصوص بیان کرد: «ما همواره در تلاش هستیم تا مدلهای هوش مصنوعی خود را بهبود بخشیم و قابلیتهای جدیدی به آنها اضافه کنیم. بهروزرسانی جدید R1 نیز بخشی از این تلاشهاست.»
فرصتهای تجاری جدید
مدل جدید R1 با مجوز MIT، فرصتهای تجاری جدیدی را برای توسعهدهندگان فراهم میآورد. این مدل میتواند بهطور تجاری در پروژههای مختلفی مورد استفاده قرار گیرد. چنین استفادههایی میتواند شامل توسعه اپلیکیشنهای هوش مصنوعی، تحلیل دادهها و حتی ایجاد سیستمهای مشاورهای هوشمند باشد.
به نظر میرسد که DeepSeek به عنوان یکی از رقبای اصلی در عرصه هوش مصنوعی، در حال شکلدهی به آینده این صنعت است. با توجه به سرعت پیشرفت و تواناییهای این استارتاپ، انتظار میرود که در آینده نزدیک شاهد تولید مدلهای هوش مصنوعی با قابلیتهای بسیار بالاتر از آنچه که امروز داریم، باشیم.