رقابت میان بازیگران عرصه فناوری برای اضافه کردن ابزارهای هوش مصنوعی همچون ChatGPT به تلفنهای هوشمند کاربران آغاز شده و شاید گام بعدی در پیشرفتهای هوش مصنوعی، تغییر ارتباطات و پردازشهای موبایلی باشد به نحوی که این فرآیندهای سریعتر از قبل انجام شود.
اما اضافه کردن هوش مصنوعی به نرمافزارها و سرویسها، میتواند نیاز به توان محاسباتی بیشتر را افزایش دهد و همین مسئله، برای گوگل به نوعی چالش بدل شده است.
موضوعی که وال استریت ژورنال در گزارشی به آن پرداخت و هشدار داد در صورتی که کاربران انتظار محتوای تولیدشده توسط هوش مصنوعی را در نتایج جستوجوی خود داشته باشند، ممکن است حاشیه سود این شرکت کاهش یابد.
در واقع، اجرای هوش مصنوعی مولد روی گوشیهای هوشمند به جای استفاده از فضای ابری که روی سرورهایی که توسط شرکتهای بزرگ فناوری پشتیبانی میشود، میتواند به یکی از بزرگترین سوالات اقتصادی مطرح شده مبنی بر چرایی شتاب شرکتها به تعبیه هوش مصنوعی در گوشیهای هوشمند پاسخ دهد.
گوگل هفته گذشته از موفقیت خود در اجرای نسخهای از آخرین مدل زبانی بزرگ خود یعنی PaLM2 روی یک گوشی سامسونگ گلگسی خبر داد. اگرچه این شرکت، مدل مدنظر را که با نام Gecko شناخته میشود، به طور عمومیبه نمایش نگذاشت اما رشد و توسعه نوعی از هوش مصنوعی را نشان میدهد که به جای چند دیتاسنتر، با منابع محاسباتی موجود در یک دیتاسنتر قادر به فعالیت است. این تغییر میتواند به ارزانتر شدن چتباتها برای شرکتها بینجامد و راه را برای برنامههای متحولتر با استفاده از هوش مصنوعی مولد هموار کند.
کریستانو آمون، مدیر مدیرعامل کوالکام به فایننشال تایمز گفت: شما باید هوش مصنوعی را به گونهای ترکیبی بسازید که هم در مرکز داده اجرا میشود و هم به صورت محلی؛ در غیر این صورت، هزینه زیادی در پی خواهد داشت. او گفت که استفاده از توان پردازشی استفاده نشده در گوشیهای هوشمند بهترین راه برای تحقق این هدف است.
زمانی که ChatGPT در سال گذشته بر سر زبانها افتاد و توجهات را به خود جلب کرد، چشمانداز آوردن این فناوری به گوشیهای هوشمند دور به نظر میرسید. به بیانی دیگر، آموزش مدلهای به اصطلاح زبانی بزرگ برای ارائه چنین خدمتی و همچنین اجرای مدلها برای تولید نتایج، از نظر محاسباتی کار سختی است و گوشیهای هوشمند نیز فاقد حافظه کافی برای نگهداری مدلهای بزرگ مانند آنچه در ChatGPT وجود دارد، هستند. همچنین از قدرت پردازشی لازم برای اجرای این مدلها برخوردار نیستند.
با این حال، تولید پاسخ به یک سوال در یک دستگاه همچون گوشی هوشمند، به جای انتظار یافتن پاسخ از یک دیتاسنتر، میتواند مدت زمان تاخیر را کاهش دهد. همچنین وقتی از دادههای شخصی کاربر برای پاسخهای تولیدی استفاده و تمامیپردازشها در یک گوشی نگهداری میشود، از حریم خصوصی کاربر نیز بیشتر محافظت میشود.
افزون بر این، هوش مصنوعی مولد میتواند اجرای کارهای روتین در گوشیهای هوشمند را آسانتر کند. به گفته مدیرعامل کوالکام، شما میتوانید هوش مصنوعی را در هر برنامهای جاسازی کنید: برای مثال وقتی ایمیلی دریافت میکنید، پاسخی را برای آن تنظیم میکند.
اگرچه پیشرفتهای سریع در برخی مدلهای زبانی پیشرفته همانند PaLM2 گوگل و GPT-4 شرکت OpenAI، معادلات را تغییر داده اما رشد مدلهای کوچکتر، برخی از این قابلیتهای مهم را در مقیاسی کوچکتر فراهم کرده و در دسترس قرار داده است.
به گفته آرویند کریشنا، مدیرعامل شرکت IBM، اکثر شرکتهایی که به دنبال استفاده از هوش مصنوعی مولد در سرویسهای خود هستند، از طریق ترکیب تعدادی از این مدلهای کوچکتر میتوانند به بسیاری از خواستههای خود دست یابند.
در همین رابطه، برخی از مدلهای کوچکتر قابلیتهای شگفتانگیزی را نشان دادهاند؛ از جمله این مدلها میتوان به LLaMa اشاره کرد که یک مدل زبانی منبعباز از سوی شرکت متاست که گفته میشود بسیاری از قابلیتهای بزرگترین سیستمها را در خود دارد.
مدل LLaMa در چند اندازه عرضه میشود که کوچکترین آن تنها 7 میلیارد پارامتر دارد. برای مقایسه بد نیست بدانید که GPT-3 متعلق به OpenAI که در سال 2020 عرضه شد، از 175 میلیارد پارامتر بهره میبرد. اگرچه نسخه GPT-4 هم عرضه شده اما هنوز جزییات پارامترهای آن منتشر نشده است.
علاوه بر اندازه کوچکتر، ماهیت منبعباز بودن مدلهایی از این دست، کار را برای محققان و توسعهدهندگان راحتتر کرده است. کوالکام در اوایل سال جاری میلادی، از نخستین گوشی اندرویدی مجهز به مدل تولید تصویر Stable Diffusion را خبر داد که از چیزی حدود یک میلیارد پارامتر بهره میبرد.
بن باجارین، تحلیلگر مرکز تحقیقاتی Creative Strategies میگوید: با توجه به آنکه فعلا مرحله تطبیق مدلها روی گوشیهای هوشمند در فاز آزمایشی است، برای ارزیابی اینکه آیا این تلاشها منجر به عرضه یک اپلیکیشن موبایلی مفید خواهد شد، خیلی زود است.
با این حال، او پیشبینی کرد که برخی برنامههای نسبتا ساده و ابتدایی همانند اپلیکیشنهای ویرایش عکس با کنترل صدا و پاسخگویی ساده به سوالات را در موج نخست حضور این مدلها در گوشیهای هوشمند با پارامترهایی بین 1 تا 10 میلیارد خواهیم دید.
زوبین قهرمانی، معاون گوگل دیپمایند، که بازوی تحقیقاتی هوش مصنوعی این شرکت محسوب میشود، گفت که مدل موبایلی Gecko از قدرت پردازشی 16 توکن در ثانیه برخوردار است. حال با توجه به آنکه اکثر مدلهای زبانی بزرگ، برای تولید هر کلمه دو توکن استفاده میکنند، این نشان میدهد که Gecko میتواند در هر ثانیه، بین 10 تا 15 کلمه تولید خواهد کرد که برای پیشنهاد پیامهای متنی یا پاسخهای ایمیلی کوتاه مناسب باشد.
به گفته کوالکام، در گوشیهای هوشمند احتمالا تمرکز به مدلهایی به اصطلاح چندوجهی معطوف خواهد شد تا بتوانند با طیف وسیعی از تصویر، متن و سایر ورودها کار کنند.
سرعت بیحد و حصری که هوش مصنوعی مولد به سمت گوشیهای هوشمند حرکت میکند، احتمالا نظر مدیران اپل را نیز به خود جلب کرده و علیرغم آنکه این شرکت هنوز ورودی جدی به این حوزه نداشته، انتظار میرود که در آینده نزدیک، شاهد این امر باشیم.
به گفته مرکز Creative Strategies، نواقصی که تاکنون در هوش مصنوعی مولد شناسایی و گزارش شده، احتمالا اپل را در استفاده از این فناوری در سرویسها و محصولات خود مردد کرده؛ اما گفته میشود این شرکت به دنبال راهکارهایی است که بتواند امکان آزمایش این فناوری در محصولات خود را برای توسعهدهندگان اپلیکیشنها فراهم کند.
به گفته باجارین، این شرایط درباره گوگل و مایکروسافت نیز صدق میکند؛ همه این شرکتها میخواهند ابزارهایی را به توسعهدهندگان بدهند تا بتوانند با یکدیگر در عرضه خدمات مبتنی بر هوش مصنوعی مولد رقابت کنند.
با توجه به اینکه کنفرانس توسعهدهندگان اپل روز 5 ژوئن آغاز میشود و رویداد توسعهدهندگان مایکروسافت نیز برای روزهای 23 تا 25 میبرنامهریزی شده، رقابت میان این دو غول دنیای فناوری برای جلب توجه توسعهدهندگان اپلیکیشنها شدت گرفته است. با این که هوش مصنوعی مولد در آغاز مسیر خود قرار دارد، اما علاقه و عجله زیادی میان شرکتها برای گنجاندن این فناوری در دستان و البته جیبهای کاربران وجود دارد.
افزودن نظر