ورود هوش مصنوعی به فاز پراگماتیسم

 به گزارش تک‌کرانچ، این مسیر در حوالی سال۲۰۲۰ به اوج خود رسید؛ زمانی که اوپن‌ای‌آی مدل جی‌پی‌تی-۳ را معرفی کرد و نشان داد که تنها با ۱۰۰برابر بزرگ‌تر کردن مدل، قابلیت‌هایی مانند برنامه‌نویسی و استدلال بدون نیاز به آموزش صریح به‌دست می‌آید. این نقطه آغازی بود بر آنچه کیان کتان‌فروش، مدیرعامل و بنیان‌گذار پلتفرم عامل‌های هوشمند Workera، آن را عصر مقیاس‌گذاری می‌نامد. دوره‌ای که با باور به این تعریف می‌شود که محاسبات بیشتر، داده‌های بیشتر و مدل‌های ترنسفورمر بزرگ‌تر به‌طور اجتناب‌ناپذیری به شکوفایی بزرگ بعدی در هوش مصنوعی منجر خواهند شد.

امروزه بسیاری از پژوهشگران معتقدند صنعت هوش مصنوعی در حال نزدیک شدن به محدودیت‌های قوانین مقیاس‌گذاری است و دوباره وارد دوره‌ای خواهد شد که محور آن پژوهش و نوآوری خواهد بود. یان لوکان، دانشمند ارشد پیشین هوش مصنوعی متا، سال‌هاست بر ضرورت کاهش اتکا به مقیاس‌گذاری تاکید کرده است و بر نیاز به توسعه‌ معماری‌های بهتر تاکید دارد. سوتسکِور نیز در مصاحبه‌ای اخیر گفته است که مدل‌های کنونی در حال رسیدن به سطح اشباع هستند و نتایج پیش‌آموزش تثبیت شده‌اند که این موضوع نشان‌دهنده نیاز به ایده‌های نوین است. کتان‌فروش گفت: «به نظر من محتمل‌ترین اتفاق در پنج سال آینده این است که معماری بهتری پیدا کنیم که نسبت به ترنسفورمرها پیشرفت قابل‌توجهی داشته باشد و اگر چنین اتفاقی نیفتد نمی‌توانیم انتظار پیشرفت زیادی در مدل‌ها داشته باشیم.»

گاهی کم، بیشتر است

مدل‌های زبان بزرگ در تعمیم دانش عملکرد فوق‌العاده‌ای دارند، اما بسیاری از کارشناسان معتقدند موج بعدی پذیرش هوش مصنوعی سازمانی با مدل‌های زبان کوچک‌تر و چابک‌تر پیش خواهد رفت، مدل‌هایی که می‌توان آنها را برای راه‌حل‌های حوزه‌محور به‌طور دقیق تنظیم کرد.

مدل‌های کوچک و دقیق‌شده (SLM) روند بزرگ آینده خواهند بود و در سال ۲۰۲۶ به یکی از ابزارهای اصلی شرکت‌های پیشرفته هوش مصنوعی تبدیل می‌شوند، زیرا مزایای هزینه و عملکرد باعث ترجیح آنها نسبت به مدل‌های بزرگ آماده به‌کار خواهد شد. اندی مارکوس، مدیر ارشد داده‌های شرکت AT&T گفت: «ما شاهد هستیم که کسب‌وکارها بیش از پیش روی مدل‌های کوچک و دقیق حساب می‌کنند، چراکه اگر به‌خوبی تنظیم شوند در دقت برای کاربردهای سازمانی با مدل‌های بزرگ و عمومی برابری می‌کنند و از نظر هزینه و سرعت نیز عالی هستند.»

 این استدلال پیش‌تر از سوی استارت‌آپ فرانسوی «میسترال» نیز مطرح شده است؛ آنها معتقدند مدل‌های کوچک پس از تنظیم دقیق، در چند معیار عملکرد، حتی بهتر از مدل‌های بزرگ عمل می‌کنند. جان نیسلی، استراتژیست هوش مصنوعی شرکت «اَبی» مستقر در آستین، می‌گوید: «کارایی، صرفه‌جویی در هزینه و تطبیق‌پذیری مدل‌های کوچک، آنها را برای کاربردهای خاص و دقیق ایده‌آل می‌کند.»

درحالی‌که مارکوس معتقد است مدل‌های کوچک و دقیق در عصر عامل‌ها کلیدی خواهند بود، نیسلی می‌گوید طبیعت مدل‌های کوچک باعث می‌شود آنها برای پیاده‌سازی روی دستگاه‌های محلی بهتر باشند، روندی که با پیشرفت‌های محاسبات لبه‌ای تسریع شده است.

یادگیری از طریق تجربه

انسان‌ها تنها از طریق زبان یاد نمی‌گیرند. ما از تجربه‌ نحوه‌ عملکرد جهان نیز می‌آموزیم. اما مدل‌های زبان بزرگ واقعا جهان را درک نمی‌کنند؛ آنها صرفا پیش‌بینی می‌کنند که کلمه یا ایده‌ بعدی چه خواهد بود. به همین دلیل بسیاری از پژوهشگران معتقدند که جهش بزرگ بعدی از طریق مدل‌های جهان رخ خواهد داد؛ سیستم‌های هوش مصنوعی که یاد می‌گیرند چگونه اجسام در فضاهای سه‌بعدی حرکت و تعامل می‌کنند تا بتوانند پیش‌بینی کنند و اقدامات مناسبی انجام دهند.

نشانه‌هایی وجود دارد که سال ۲۰۲۶ می‌تواند سال مهمی برای مدل‌های جهان باشد. یان لوکان ، متا را ترک کرد تا آزمایشگاه مدل‌های جهان خود را راه‌اندازی کند و گفته می‌شود به دنبال ارزش‌گذاری ۵‌میلیارد دلاری است. شرکت دیپ‌مایند گوگل نیز مشغول توسعه «جینی» است و در ماه اوت آخرین مدل خود را معرفی کرد که مدل‌های جهان تعاملی و عمومی در زمان واقعی می‌سازد. 

همراه با دموهای استارت‌آپ‌هایی مانند «دکارت» و «اودیسه»، آزمایشگاه «ورلد لبز» به رهبری فی‌فی لی اولین مدل جهان تجاری خود «ماربل» را عرضه کرده است. تازه‌واردانی مانند General Intuition در اکتبر توانستند با جذب ۱۳۴‌میلیون دلار سرمایه اولیه به آموزش استدلال فضایی به عامل‌ها بپردازند و استارت‌آپ تولید ویدئو «ران‌وی» در دسامبر اولین مدل جهان خود GWM-۱ را منتشر کرد.

اگرچه پژوهشگران پتانسیل بلندمدت این فناوری را در رباتیک و خودران‌ها می‌بینند، تاثیر کوتاه‌مدت احتمالا ابتدا در بازی‌های ویدئویی مشاهده خواهد شد. 

«پیچ‌بوک» پیش‌بینی می‌کند بازار مدل‌های جهان در بازی‌های ویدئویی می‌تواند از ۱.۲‌میلیارد دلار در بازه ۲۰۲۲ تا ۲۰۲۵ به ۲۷۶‌میلیارد دلار در سال ۲۰۳۰ برسد که این رشد ناشی از توانایی فناوری در تولید جهان‌های تعاملی و شخصیت‌های غیرقابل‌کنترل واقع‌گرایانه‌تر است.

پیم دِ ویت، بنیان‌گذار General Intuition گفت: «محیط‌های مجازی نه‌تنها ممکن است بازی‌ها را دگرگون کنند، بلکه به میدان‌های آزمایشی حیاتی برای نسل بعدی مدل‌های بنیادین تبدیل خواهند شد.»

ملت عامل‌محور

عامل‌ها در سال ۲۰۲۵ نتوانستند آن‌طور که انتظار می‌رفت عمل کنند، اما یکی از دلایل اصلی این شکست سخت بودن اتصال آنها به سیستم‌هایی است که واقعا کار در آنها انجام می‌شود. بدون دسترسی به ابزارها و زمینه‌ کاری بیشتر عامل‌ها در جریان‌های آزمایشی محدود باقی ماندند.

پروتکل Model Context شرکت آنتروپیک (MCP) که به آن USB-C برای هوش مصنوعی می‌گویند و به عامل‌های هوش مصنوعی امکان می‌دهد با ابزارهای خارجی مانند پایگاه‌های داده، موتورهای جست‌وجو و APIها ارتباط برقرار کنند، نقش اتصال گمشده را ایفا کرده و به سرعت در حال تبدیل شدن به استاندارد است. 

اوپن‌ای‌آی و مایکروسافت به‌صورت علنی از MCP پشتیبانی کرده‌اند و آتروپیک اخیرا آن را به بنیاد «هوش مصنوعیِ لینوکس» اهدا کرده است تا به استانداردسازی ابزارهای عامل‌محور متن‌باز کمک کند. گوگل نیز در حال راه‌اندازی سرورهای MCP مدیریتی خود برای اتصال عامل‌های هوش مصنوعی به محصولات و خدماتش است.

با کاهش اصطکاک اتصال عامل‌ها به سیستم‌های واقعی توسط MCP سال ۲۰۲۶ احتمالا سالی خواهد بود که جریان‌های کاری عامل‌محور بالاخره از مرحله دمو به فعالیت روزمره منتقل شوند. راجیو دِهِم، شریک Sapphire Ventures، می‌گوید این پیشرفت‌ها باعث خواهند شد راهکارهای مبتنی بر عامل نقش‌های «سیستم ثبت رسمی» را در صنایع مختلف بر عهده بگیرند.

دهم می‌گوید: «همزمان که عامل‌های صوتی وظایف «اند-تو-اند» مانند دریافت اطلاعات و ارتباط با مشتری را انجام می‌دهند شروع به شکل‌دهی به سیستم‌های زیرساختی اصلی خواهند کرد. این روند را در بخش‌های متنوعی مانند خدمات خانگی، فناوری املاک و سلامت و همچنین در عملکردهای افقی مانند فروش، آی‌تی و پشتیبانی مشاهده خواهیم کرد.»

تقویت انسان، نه خودکارسازی

کتان‌فروش گفت: «سال ۲۰۲۶ سال انسان‌ها خواهد بود. متوجه خواهیم شد که هوش مصنوعی به اندازه‌ای که فکر می‌کردیم مستقل عمل نکرده است و گفت‌وگو بیشتر حول این خواهد بود که چگونه هوش مصنوعی جریان‌های کاری انسانی را تقویت می‌کند، نه اینکه جایگزین آنها شود.»

او افزود: «فکر می‌کنم بسیاری از شرکت‌ها شروع به استخدام خواهند کرد»، و اشاره کرد که انتظار دارد نقش‌های جدیدی در زمینه هوش مصنوعی، شفافیت، ایمنی و مدیریت داده‌ها ایجاد شود. «من نسبت به میانگین نرخ بیکاری زیر ۴ درصد در سال آینده خوش‌بین هستم.»

در سال ۲۰۲۴ هر شرکت هوش مصنوعی پیش‌بینی می‌کرد که مشاغل را بدون نیاز به انسان‌ها خودکار خواهد کرد. اما فناوری هنوز به آن مرحله نرسیده است و در اقتصادی ناپایدار این نوع گفتار محبوب نیست. پیم دِ ویت نیز گفت: «مردم می‌خواهند بالای API باشند نه زیر آن و فکر می‌کنم سال ۲۰۲۶ سال مهمی برای این موضوع خواهد بود.»

ورود به دنیای فیزیکی

به گفته کارشناسان پیشرفت‌هایی در فناوری‌هایی مانند مدل‌های کوچک، مدل‌های جهان و محاسبات لبه‌ای امکان کاربردهای فیزیکی بیشتر یادگیری ماشین را فراهم می‌کند. 

ویکرام تانجا، رئیس «ای‌تی-اند-تی ونچرز» گفت: «هوش مصنوعی فیزیکی در سال ۲۰۲۶ وارد جریان اصلی خواهد شد، زیرا دسته‌های جدیدی از دستگاه‌های مجهز به هوش مصنوعی از جمله ربات‌ها، خودروهای خودران، پهپادها و گجت‌های پوشیدنی وارد بازار می‌شوند.»

اگرچه خودروهای خودران و ربات‌ها نمونه‌های آشکار کاربرد هوش مصنوعی فیزیکی هستند که بی‌تردید در سال ۲۰۲۶ رشد خواهند کرد، اما آموزش و پیاده‌سازی آنها هنوز هزینه‌بر است. از سوی دیگر، گجت‌های پوشیدنی مسیر کم‌هزینه‌تری با پذیرش مصرف‌کننده ارائه می‌دهند. عینک‌های هوشمند مانند ری‌بن متا اکنون دستیارهایی دارند که می‌توانند به سوالات درباره آنچه می‌بینید پاسخ دهند و فرم‌های جدیدی مانند حلقه‌های سلامت مجهز به هوش مصنوعی و ساعت‌های هوشمند استفاده از تحلیل‌های لحظه‌ای و همیشگی روی بدن را عادی می‌کنند.

تانجا افزود: «ارائه‌دهندگان خدمات ارتباطی برای بهینه‌سازی زیرساخت شبکه خود به منظور پشتیبانی از این موج جدید دستگاه‌ها تلاش خواهند کرد و آن‌هایی که انعطاف بیشتری در ارائه اتصال دارند بهترین موقعیت را خواهند داشت.»