نیلی بلاگ‌

انتشار مدل هوش مصنوعی R1/ DeepSeek در پلتفرم Hugging Face – تجارت نیوز

استارتاپ چینی DeepSeek نسخه جدیدی از مدل هوش مصنوعی R1 را در پلتفرم Hugging Face منتشر کرد.

به گزارش تجارت نیوز، استارتاپ چینی DeepSeek نسخه به‌روزرسانی شده مدل هوش مصنوعی R1 را در پلتفرم توسعه‌دهندگان Hugging Face منتشر کرد. این خبر در پیام ویدئویی که روز چهارشنبه در وی‌چت اعلام شد، منتشر گردید. این نسخه جدید R1 که تحت مجوز MIT قرار دارد، به این معنی است که می‌تواند به‌طور تجاری مورد استفاده قرار گیرد. طبق اعلام DeepSeek، این به‌روزرسانی جزئی محسوب می‌شود. در مخزن Hugging Face، توضیحاتی درباره مدل موجود نیست و فقط فایل‌های پیکربندی و وزن‌ها، که اجزای داخلی یک مدل را هدایت می‌کنند، در دسترس قرار گرفته‌اند.

مدل سنگین با 685 میلیارد پارامتر

مدل به‌روزرسانی شده R1 با سایز 685 میلیارد پارامتر به شدت سنگین است. در اینجا، «پارامترها» معادل «وزن‌ها» هستند. بدون تغییرات لازم، احتمالاً این مدل نمی‌تواند بر روی سخت‌افزارهای مصرفی اجرا شود.

DeepSeek در سال جاری پس از انتشار مدل R1 به شهرت رسید. این مدل توانست رقابت جدی با مدل‌های OpenAI ایجاد کند. با این حال، استارتاپ چینی باعث جلب توجه برخی از مقامات نظارتی در ایالات متحده شده است. این مقامات معتقدند که فناوری DeepSeek ممکن است تهدیدی برای امنیت ملی محسوب شود.

افزایش نگرانی‌ها درباره امنیت ملی

این نگرانی‌ها در حالی مطرح می‌شود که DeepSeek به سرعت در حال گسترش و توسعه فناوری‌های جدید است. برخی از تحلیلگران بر این باورند که پیشرفت‌های این استارتاپ می‌تواند منجر به ایجاد فناوری‌هایی شود که قابلیت‌های آن‌ها از حد انتظار فراتر می‌رود.

در بیانیه‌ای که DeepSeek در وی‌چت منتشر کرد، تأکید شد که این به‌روزرسانی بر روی بهبود عملکرد و قابلیت‌های مدل تمرکز دارد. با این حال، عملکرد این مدل بدون دسترسی به سخت‌افزار مناسب به شدت محدود خواهد بود.

یکی از مقامات DeepSeek در این خصوص بیان کرد: «ما همواره در تلاش هستیم تا مدل‌های هوش مصنوعی خود را بهبود بخشیم و قابلیت‌های جدیدی به آن‌ها اضافه کنیم. به‌روزرسانی جدید R1 نیز بخشی از این تلاش‌هاست.»

فرصت‌های تجاری جدید

مدل جدید R1 با مجوز MIT، فرصت‌های تجاری جدیدی را برای توسعه‌دهندگان فراهم می‌آورد. این مدل می‌تواند به‌طور تجاری در پروژه‌های مختلفی مورد استفاده قرار گیرد. چنین استفاده‌هایی می‌تواند شامل توسعه اپلیکیشن‌های هوش مصنوعی، تحلیل داده‌ها و حتی ایجاد سیستم‌های مشاوره‌ای هوشمند باشد.

به نظر می‌رسد که DeepSeek به عنوان یکی از رقبای اصلی در عرصه هوش مصنوعی، در حال شکل‌دهی به آینده این صنعت است. با توجه به سرعت پیشرفت و توانایی‌های این استارتاپ، انتظار می‌رود که در آینده نزدیک شاهد تولید مدل‌های هوش مصنوعی با قابلیت‌های بسیار بالاتر از آنچه که امروز داریم، باشیم.

منبع خبر

مطالب مشابه را ببینید!