ابزارهای هوش مصنوعی جدید گوگل برای توسعهدهندگان – تجارت نیوز
گوگل در کنفرانس I/O ابزارهای هوش مصنوعی جدیدی برای توسعهدهندگان معرفی خواهد کرد که به استفاده محلی از قابلیتهای Gemini Nano مربوط میشود.
به گزارش تجارت نیوز، رشد سریع هوش مصنوعی مولد، نحوه طراحی محصولات گوگل و دیگر غولهای فناوری را تغییر داده است. بیشتر ویژگیهای هوش مصنوعی که تاکنون استفاده کردهاید، بر روی سرورهای دور با قدرت پردازش بالا اجرا میشوند. در حالی که گوشی شما توان پردازش کمتری دارد، به نظر میرسد گوگل در حال آمادهسازی ابزارهای جدید و مهمی برای توسعهدهندگان در حوزه هوش مصنوعی موبایل است. در کنفرانس I/O هفته آینده، انتظار میرود گوگل مجموعهای جدید از APIها را معرفی کند که به توسعهدهندگان اجازه میدهد از قابلیتهای Gemini Nano برای هوش مصنوعی در دستگاه استفاده کنند.
گوگل از قابلیتهای جدید رونمایی میکند
گوگل به آرامی مستنداتی درباره ویژگیهای جدید هوش مصنوعی برای توسعهدهندگان منتشر کرده است. به گفته وبسایت Android Authority، بروزرسانی جدیدی برای ML Kit SDK منتشر خواهد شد که به APIهای هوش مصنوعی مولد در دستگاه از طریق Gemini Nano پشتیبانی میکند. این ابزار بر پایه AI Core ساخته شده و مشابه SDK هوش مصنوعی Edge است، اما به یک مدل موجود متصل میشود که دارای مجموعهای از ویژگیهای از پیش تعریف شده است که باید برای توسعهدهندگان پیادهسازی آن آسان باشد.
گوگل اعلام کرده است که APIهای GenAI ML Kit به اپلیکیشنها این امکان را میدهد که بدون ارسال دادهها به ابر، کارهایی نظیر خلاصهسازی، ویرایش، بازنویسی و توصیف تصویر را انجام دهند. با این حال، Gemini Nano به اندازه نسخه ابر قدرت ندارد، بنابراین انتظار میرود محدودیتهایی وجود داشته باشد. به عنوان مثال، گوگل اشاره کرده است که خلاصهها نمیتوانند بیشتر از سه نکته داشته باشند و توصیفهای تصویری فقط به زبان انگلیسی ارائه میشوند. کیفیت خروجیها همچنین ممکن است بر اساس نسخه Gemini Nano در گوشی متفاوت باشد. نسخه استاندارد (Gemini Nano XS) حدود 100 مگابایت اندازه دارد، در حالی که Gemini Nano XXS که در Pixel 9a دیده شده است، یک چهارم اندازه آن است و فقط متنی بوده و دارای پنجره محتوای بسیار کوچکتری است.
گام مثبت برای اندروید
این اقدام به طور کلی برای سیستمعامل اندروید مثبت است زیرا ML Kit بر روی دستگاههای غیر از خط تولید Pixel گوگل نیز کار میکند. در حالی که دستگاههای Pixel به طور گسترده از Gemini Nano استفاده میکنند، چندین گوشی دیگر نیز به طور خاص برای اجرای این مدل طراحی شدهاند، از جمله OnePlus 13، Samsung Galaxy S25 و Xiaomi 15. با افزایش تعداد گوشیهایی که از مدل هوش مصنوعی گوگل پشتیبانی میکنند، توسعهدهندگان قادر خواهند بود ویژگیهای هوش مصنوعی مولد را برای این دستگاهها هدف قرار دهند.
مستندات در حال حاضر برای توسعهدهندگان در دسترس است، اما انتظار میرود گوگل در کنفرانس I/O درهای APIها را به روی علاقهمندان باز کند. این شرکت همچنین یک جلسه در I/O با عنوان «Gemini Nano در اندروید: ساخت با هوش مصنوعی مولد در دستگاه» را تأیید کرده است. توضیحات این جلسه وعده APIهای جدیدی را میدهد که قادر به «خلاصهسازی، ویرایش و بازنویسی متن، و همچنین تولید توصیفهای تصویری» خواهند بود که دقیقاً مشابه قابلیتهای جدید APIهای ML Kit است.
تسهیل در پیادهسازی هوش مصنوعی محلی
توسعهدهندگان اپلیکیشن که به دنبال اضافه کردن ویژگیهای هوش مصنوعی مولد در دستگاه به اندروید هستند، در حال حاضر در موقعیت دشواری قرار دارند. گوگل SDK هوش مصنوعی Edge را ارائه میدهد که میتواند دسترسی به سختافزار NPU برای اجرای مدلها را فراهم کند، اما این ابزارها آزمایشی بوده و در حال حاضر فقط بر روی سری Pixel 9 کار میکنند. همچنین این ابزارها محدود به متن هستند. هر دو شرکت Qualcomm و MediaTek APIهایی برای اجرای بارهای کاری هوش مصنوعی ارائه میدهند، اما ویژگیها و قابلیتها بسته به دستگاه متفاوت است که این امر ریسک اتکای طولانیمدت به آنها را افزایش میدهد. همچنین اجرای مدل خود نیاز به دانش عمیق از سیستمهای هوش مصنوعی مولد دارد. APIهای جدید باید پیادهسازی هوش مصنوعی محلی را به طرز قابل توجهی سریع و آسان کند.
با وجود محدودیتهای عملکردی مدل محلی، این یک بخش مهم از چگونگی کمک هوش مصنوعی به افراد است. بیشتر افراد احتمالاً تمایل ندارند تمام دادههای شخصی خود را به یک سرور دور ارسال کنند، اما مدل محلی میتواند این اطلاعات را به شیوهای امنتر پردازش کند. به عنوان مثال، ویژگی تصاویر صفحه گوگل، تمام تصاویر صفحه شما را مشاهده میکند، اما همه پردازشها بر روی گوشی شما انجام میشود. به طور مشابه، موتورولا در گوشی جدید Razr Ultra نوتیفیکیشنها را به صورت محلی خلاصه میکند. در حالی که مدل پایه Razr که قابلیت کمتری دارد، نوتیفیکیشنها را به سرور برای پردازش ارسال میکند.
انتشار APIهایی که به Gemini Nano متصل میشوند، میتواند به هوش مصنوعی موبایل ثبات و انسجام مورد نیاز را ببخشد. با این حال، این امر به همکاری گوگل و تولیدکنندگان اصلی تجهیزات (OEMs) در پشتیبانی از Gemini Nano بستگی دارد. برخی شرکتها ممکن است تصمیم بگیرند به مسیر خود بروند و گوشیهای زیادی وجود دارند که قدرت کافی برای اجرای هوش مصنوعی به صورت محلی را ندارند.