ابزارهای هوش مصنوعی جدید گوگل برای توسعه‌دهندگان – تجارت نیوز

گوگل در کنفرانس I/O ابزارهای هوش مصنوعی جدیدی برای توسعه‌دهندگان معرفی خواهد کرد که به استفاده محلی از قابلیت‌های Gemini Nano مربوط می‌شود.

به گزارش تجارت نیوز، رشد سریع هوش مصنوعی مولد، نحوه طراحی محصولات گوگل و دیگر غول‌های فناوری را تغییر داده است. بیشتر ویژگی‌های هوش مصنوعی که تاکنون استفاده کرده‌اید، بر روی سرورهای دور با قدرت پردازش بالا اجرا می‌شوند. در حالی که گوشی شما توان پردازش کمتری دارد، به نظر می‌رسد گوگل در حال آماده‌سازی ابزارهای جدید و مهمی برای توسعه‌دهندگان در حوزه هوش مصنوعی موبایل است. در کنفرانس I/O هفته آینده، انتظار می‌رود گوگل مجموعه‌ای جدید از APIها را معرفی کند که به توسعه‌دهندگان اجازه می‌دهد از قابلیت‌های Gemini Nano برای هوش مصنوعی در دستگاه استفاده کنند.

گوگل از قابلیت‌های جدید رونمایی می‌کند

گوگل به آرامی مستنداتی درباره ویژگی‌های جدید هوش مصنوعی برای توسعه‌دهندگان منتشر کرده است. به گفته وب‌سایت Android Authority، بروزرسانی جدیدی برای ML Kit SDK منتشر خواهد شد که به APIهای هوش مصنوعی مولد در دستگاه از طریق Gemini Nano پشتیبانی می‌کند. این ابزار بر پایه AI Core ساخته شده و مشابه SDK هوش مصنوعی Edge است، اما به یک مدل موجود متصل می‌شود که دارای مجموعه‌ای از ویژگی‌های از پیش تعریف شده است که باید برای توسعه‌دهندگان پیاده‌سازی آن آسان باشد.

گوگل اعلام کرده است که APIهای GenAI ML Kit به اپلیکیشن‌ها این امکان را می‌دهد که بدون ارسال داده‌ها به ابر، کارهایی نظیر خلاصه‌سازی، ویرایش، بازنویسی و توصیف تصویر را انجام دهند. با این حال، Gemini Nano به اندازه نسخه ابر قدرت ندارد، بنابراین انتظار می‌رود محدودیت‌هایی وجود داشته باشد. به عنوان مثال، گوگل اشاره کرده است که خلاصه‌ها نمی‌توانند بیشتر از سه نکته داشته باشند و توصیف‌های تصویری فقط به زبان انگلیسی ارائه می‌شوند. کیفیت خروجی‌ها همچنین ممکن است بر اساس نسخه Gemini Nano در گوشی متفاوت باشد. نسخه استاندارد (Gemini Nano XS) حدود 100 مگابایت اندازه دارد، در حالی که Gemini Nano XXS که در Pixel 9a دیده شده است، یک چهارم اندازه آن است و فقط متنی بوده و دارای پنجره محتوای بسیار کوچکتری است.

گام مثبت برای اندروید

این اقدام به طور کلی برای سیستم‌عامل اندروید مثبت است زیرا ML Kit بر روی دستگاه‌های غیر از خط تولید Pixel گوگل نیز کار می‌کند. در حالی که دستگاه‌های Pixel به طور گسترده از Gemini Nano استفاده می‌کنند، چندین گوشی دیگر نیز به طور خاص برای اجرای این مدل طراحی شده‌اند، از جمله OnePlus 13، Samsung Galaxy S25 و Xiaomi 15. با افزایش تعداد گوشی‌هایی که از مدل هوش مصنوعی گوگل پشتیبانی می‌کنند، توسعه‌دهندگان قادر خواهند بود ویژگی‌های هوش مصنوعی مولد را برای این دستگاه‌ها هدف قرار دهند.

مستندات در حال حاضر برای توسعه‌دهندگان در دسترس است، اما انتظار می‌رود گوگل در کنفرانس I/O درهای APIها را به روی علاقه‌مندان باز کند. این شرکت همچنین یک جلسه در I/O با عنوان «Gemini Nano در اندروید: ساخت با هوش مصنوعی مولد در دستگاه» را تأیید کرده است. توضیحات این جلسه وعده APIهای جدیدی را می‌دهد که قادر به «خلاصه‌سازی، ویرایش و بازنویسی متن، و همچنین تولید توصیف‌های تصویری» خواهند بود که دقیقاً مشابه قابلیت‌های جدید APIهای ML Kit است.

تسهیل در پیاده‌سازی هوش مصنوعی محلی

توسعه‌دهندگان اپلیکیشن که به دنبال اضافه کردن ویژگی‌های هوش مصنوعی مولد در دستگاه به اندروید هستند، در حال حاضر در موقعیت دشواری قرار دارند. گوگل SDK هوش مصنوعی Edge را ارائه می‌دهد که می‌تواند دسترسی به سخت‌افزار NPU برای اجرای مدل‌ها را فراهم کند، اما این ابزارها آزمایشی بوده و در حال حاضر فقط بر روی سری Pixel 9 کار می‌کنند. همچنین این ابزارها محدود به متن هستند. هر دو شرکت Qualcomm و MediaTek APIهایی برای اجرای بارهای کاری هوش مصنوعی ارائه می‌دهند، اما ویژگی‌ها و قابلیت‌ها بسته به دستگاه متفاوت است که این امر ریسک اتکای طولانی‌مدت به آن‌ها را افزایش می‌دهد. همچنین اجرای مدل خود نیاز به دانش عمیق از سیستم‌های هوش مصنوعی مولد دارد. APIهای جدید باید پیاده‌سازی هوش مصنوعی محلی را به طرز قابل توجهی سریع و آسان کند.

با وجود محدودیت‌های عملکردی مدل محلی، این یک بخش مهم از چگونگی کمک هوش مصنوعی به افراد است. بیشتر افراد احتمالاً تمایل ندارند تمام داده‌های شخصی خود را به یک سرور دور ارسال کنند، اما مدل محلی می‌تواند این اطلاعات را به شیوه‌ای امن‌تر پردازش کند. به عنوان مثال، ویژگی تصاویر صفحه گوگل، تمام تصاویر صفحه شما را مشاهده می‌کند، اما همه پردازش‌ها بر روی گوشی شما انجام می‌شود. به طور مشابه، موتورولا در گوشی جدید Razr Ultra نوتیفیکیشن‌ها را به صورت محلی خلاصه می‌کند. در حالی که مدل پایه Razr که قابلیت کمتری دارد، نوتیفیکیشن‌ها را به سرور برای پردازش ارسال می‌کند.

انتشار APIهایی که به Gemini Nano متصل می‌شوند، می‌تواند به هوش مصنوعی موبایل ثبات و انسجام مورد نیاز را ببخشد. با این حال، این امر به همکاری گوگل و تولیدکنندگان اصلی تجهیزات (OEMs) در پشتیبانی از Gemini Nano بستگی دارد. برخی شرکت‌ها ممکن است تصمیم بگیرند به مسیر خود بروند و گوشی‌های زیادی وجود دارند که قدرت کافی برای اجرای هوش مصنوعی به صورت محلی را ندارند.

منبع خبر