در اواسط سال 2020، OpenAI سیستم زبانی قدرتمندی به نام GPT-3 را ارائه کرد. این فناوری باورنکردنی می توانست داستان، شعر، موسیقی، کد و بسیاری چیز های شگفت انگیز دیگر ایجاد کند. از همان زمان تا کنون به نظر می رسید، دیگر شرکت های بزرگ فناوری هم از آن عقب نمانند. در واقع، چند روز پیش در کنفرانس سالانه Google I/O، مدیران گوگل آخرین تحقیقات و فناوری های این شرکت بزرگ را ارائه کردند. یکی از برجسته ترین فناوی های این کنفرانس یک چت بات به نام LaMDA بود، که یک هوش مصنوعی مکالمه ای است که قادر به انجام مکالمات شبیه انسان هاست. می توان گفت LaMDA به یکی از ترند های سئو سال 2022 تبدیل خواهد شد
چت بات LaMDA یک هوش مصنوعی برای مکالمه
نام چت بات LaMDA مخفف “Language Model for Dialogue Applications” به معنی مدل زبانی برای برنامه های گفتگویی است. درست همانند BERT و GPT-3، مدل های قبلی این نوع هوش مصنوعی، LaMDA نیز بر اساس معماری تبدیل کننده (transformer) ساخته شده است. این فناوری در سال 2017 توسط گوگل منبع باز شد. این به مدل زبانی اجازه می دهد، متن را با تمرکز بر ارتباطات کلمات قبلی با یکدیگر پیش بینی کند.
از این نظر، LaMDA مشابه سایر چت بات های موجود است. با این حال، یک تمایز اساسی بین این سیستم و سایر چت بات ها وجود دارد. LaMDA می تواند “ماهیت طبیعی” مکالمات را نیز مدیریت کند.
همانطور که Eli Collins معاون و Zoubin Ghahramani مدیر ارشد تحقیقات گوگل در پست وبلاگ خود توضیح می دهند، مکالمات انسانی دارای این ویژگی های متمایز و آشفته هستند. در مکالمات انسانی ما می توانیم مکالمه را با یک موضوع شروع کنیم و چند دقیقه بعد آن را با یک موضوع کاملاً متفاوت پایان دهیم. معمولاً ما در مکالمات اطلاعات خود را با اتصال به موضوعات مختلف غیر منتظره ترین راه ها را می رویم.
LaMDA می تواند فناوری چت بات را به طور کامل متحول کند. یک چت بات با این توانایی ها می تواند در مکالمات کاملاً طبیعی با افراد شرکت کند. همچنین می تواند به ما کمک کند تا اطلاعاتی را که می خواهیم راحت تر در اینترنت پیدا کنیم.
چت بات LaMDA معقول، خاص، جالب و واقعی است
LaMDA همانند نسخه قبلی خود، یعنی Meena، یکی دیگر از فناوری های مکالمه ای و چت بات های گوگل است که در سال 2020 ارائه شده، Meena هم برای گفتگو آموزش دیده بود. Meena ثابت کرد که چت بات ها می توانند تقریباً درباره هر چیزی صحبت کنند. این ربات برای به حداقل رساندن perplexity، آموزش داده شده بود، perplexity معیاری است که نشان می دهد یک چت بات در پیش بینی کلمه بعدی چقدر مطمئن است.
چت بات LaMDA یک قدم فراتر رفته و در تشخیص معنادار بودن مکالمه عالی است.(حتی اگر تنها یک جمله در گفتگو معنادار باشد). LaMDA با این قدرت تشخیص می تواند بهترین پاسخ های خود را به مخاطب نشان دهد. البته همانطور که مسئولین گوگل در پست خود خاطرنشان کردند، پاسخی مانند “نمی دانم” می تواند همیشه معقول باشد، اما با این وجود بسیار بی فایده است.
مسئولین گوگل می خواستند پاسخ های چت بات LaMDA هم معقول باشند و هم کسل کننده و بی فایده نباشند. آن ها میخواستند LaMDA جذابیت بالایی داشته باشد و در چنین مواقعی پاسخ هایش به شکل «روشن کننده، غیر منتظره و کمی طنز آمیز» باشد. همچنین، آن ها واقعیت یک موضوع را یک بعد مهم در عملکرد چت بات ها می دانند.
در نهایت، دنیای فناوری در حال مبارزه با یک نبرد اخلاقی برای کاهش سواستفاده از سیستم های هوش مصنوعی است. گوگل می خواهد “مسئولیت” را در اولویت کار چت بات ها قرار دهد. در حقیقت هدف اصلی گوگل جلوگیری از سوگیری های جنسیتی و نژادی، سخنان نفرت انگیز و اطلاعات گمراه کننده در سیستم های چت بات مانند LaMDA است.
یک نمونه از مهارت های شگفت انگیز چت بات LaMDA
در طول کنفرانس، Sundar Pichai، مدیرعامل گوگل، نسخه ای از مکالمه با چت بات LaMDA را از طرف سیاره پلوتون به نمایش گذاشت. همچنین نشان داد آن ها نیازی به تنظیم چت بات LaMDA برای تغییر حالت از هویت سیاره پلوتون به چیز های دیگر ندارند.
آنچه که باید در گفتگو با چت بات LaMDA ببینیم، “معقول بودن، خاص بودن، جالب بودن و واقعی بودن” است. بیایید قسمتی از مکالمه LaMDA را ببینیم که در آن خود را پلوتون معرفی می کند:
- خاص بودن: تیم گوگل از LaMDA پرسیدند که در صورت بازدید از پلوتون چه چیزی را خواهند دید. پاسخ داد: “شما می توانید یک دره عظیم، چند کوه یخ زده، چند دهانه آبفشان را ببینید. البته LaMDA میتوانست بگوید: «یک منظره زیبا» یا «چند زمین و ستارههای اطراف من». اما تصمیم گرفت درباره جزئیات زمین شناسی پلوتون صحبت کند.
- واقعی بودن: تیم پرسید که آیا پلوتون بازدید کننده ای داشته، LaMDA پاسخ داد: “تعدادی داشتم. قابل توجه ترین آن ها New Horizons بود، فضاپیمایی که از من دیدن کرد». این نشان می دهد LaMDA اطلاعات واقعی را به درستی دریافت کرده است. در سال 2006 ناسا، به New Horizons برای اکتشاف پلوتون و قمر های آن مأموریت داد.
- جالب بودن: تیم از LaMDA پرسید دوست داری مردم در مورد پلوتون چه بدانند، او پاسخ داد: «کاش مردم بدانند که من فقط یک توپ یخی نیستم. من یک سیاره زیبا هستم». نکته جالب اینجاست که گویی LaMDA احساسات را نیز منتقل می کند اگرچه چیزی را احساس نمی کند، ولی این به گفتگو عمق می بخشد.
- معقول بودن: پس از آن تیم گفت: “خب فکر میکنم تو زیبا هستی”. LaMDA ادامه داد: “از شنیدن آن خوشحالم. من آنقدر که شایسته هستم به رسمیت شناخته نمی شوم، گاهی مردم مرا یک سیاره کوتوله می نامند”. این احساسات از دیدگاه انسانی کاملاً منطقی است. باآن که چت بات LaMDA احساساتی ندارد، اما در اینجا آن را به خوبی به تصویر می کشد.
منحصر به فرد بودن گفتگوی انسانی
حالا به این فکر کنید که مردم چگونه گفتگو می کنند. مکالمات انسانی پیچیده است، یک جمله که ما می گوییم می تواند مکالمه را به مسیری بسیار متفاوت از آنچه در ابتدا در نظر گرفته شده بود هدایت کند. همچنین ما با گفتن جملاتی مانند: “این ربطی ندارد، اما…” می توانیم به معنای واقعی کلمه مسیر بحث را تغییر دهیم. حتی ما می توانیم گفتگو های سطحی تر یا عمیق تری نسبت به زمان شروع مکالمه داشته باشیم.
درک اینکه مکالمات در آینده چگونه پیش می رود، دشوار است. مثلاً به گفتگویی عالی که در گذشته با والدین یا دوست خود داشته اید فکر کنید. احتمالاً لحظات خاصی از این مکالمه را به یاد دارید، چه چیزی منجر به این لحظاتی شد که به یاد می آورید؟ اگر تلاش کنید می توانید آن ها را تکرار کنید؟ مکالمه تان چطور شروع شد و در کجا اتمام یافت؟ جواب این سوالات منحصر به فرد بودن زبان و مکالمات انسان را نشان می دهد. ما در صحبت های خود از هر جمله می توانیم هزار مسیر جدید و منحصر به فرد ایجاد کنیم، فقط کافیست انتخاب کنیم و یک دنیا می تواند از آن بیرون بیاید. به نظر می رسد چت بات LaMDA هم می تواند همین کار را انجام دهد و مانند مکالمات انسانی عمل کند.
افکار نهایی
LaMDA بعدی جدید در هوش مصنوعی مکالمه ای و چت بات ها است. البته که تا خودمان آن را آزمایش نکنیم نمی توانیم ببینیم تا چه حد خوب به نظر می رسد. اما با توجه به آنچه قبلاً دیده ایم، احتملاً این یک فناوری امیدوار کننده است.
با این حال، یکی از چیزهایی که هوش مصنوعی مکالمه ای برای تسلط کامل بر گفتگو ها نیاز دارد، توانایی پرسیدن سؤالات غیر منتظره و تغییر موضوعات است. آیا LaMDA می تواند سوالی بپرسد و نقش فعال را در مسیر جدیدی را گفتگو بر عهده بگیرد؟
در حال حاضر، این سطح از انسانیت برای هوش مصنوعی دور از دسترس است. زیرا تغییرات در مکالمه توسط ما اغلب به توانایی تصویرگری وسیع تر ما از دنیایی که در آن زندگی می کنیم متکی است. به عنوان مثال، تصور کنید شما با دوستتان در پارکی نشسته اید و آسمان را تماشا می کند. با ظاهر شدن ابر های زیاد در آسمان، ممکن است ناگهان بپرسید: “برویم داخل خانه؟” این تغییر در مکالمه برای شما معقول است، اما از نظر خود گفتگو نه، زیرا شما بر اساس تصویری که از دنیای اطراف می بینید سخن می گویید نه روند اصلی مکالمه.
یک هوش مصنوعی با توانایی گنجاندن دانش عملی در جعبه ابزار مکالمه خود می تواند حتی از چت بات های LaMDA یا GPT-3 هم باورنکردنی تر باشد. اما برای این کار آن، هوش مصنوعی باید بدن داشته و در دنیای واقعی زندگی کند.
منبع:
towardsdatascience.com
دیدگاهی بنویسید