گوگل به تازگی Bard را در رقابت با ChatGPT منتشر کرده است و کاربران در حال آشنایی با این هوش مصنوعی و مقایسه آن با OpenAI هستند.
نام Bard صرفاً برای بازاریابی است، زیرا هیچ الگوریتمی به نام Bard وجود ندارد، اما ما می دانیم که چت بات توسط LaMDA طراحی شده است.
گوگل بارد چیست؟
Bard یک چت بات آزمایشی گوگل است که از مدل زبان بزرگ LaMDA پشتیبانی میکند. بارد این یک هوش مصنوعی مولد است که دستورات را میپذیرد و تسک های مبتنی بر متن مانند پاسخها و خلاصهها و اشکال مختلف محتوا را تحویل می دهد.
بارد همچنین با خلاصه کردن اطلاعات موجود در اینترنت و ارائه لینک سایت ها به کاوش در موضوعات کمک می کند.
چرا گوگل بارد را منتشر کرد؟
گوگل Bard را پس از راهاندازی موفقیتآمیز ChatGPT OpenAI منتشر کرد که این تصور را ایجاد کرد که گوگل از نظر فناوری عقب مانده است.ChatGPT به عنوان یک فناوری انقلابی با پتانسیل ایجاد اختلال در صنعت جستجو گوگل تلقی شد.
در 21 دسامبر 2022 سه هفته پس از راه اندازی ChatGPT نیویورک تایمز گزارش داد که گوگل یک “کد قرمز” اعلام کرده است. چهل و هفت روز پس از تعدیل استراتژی کد قرمز گوگل راه اندازی Bard را در 6 فوریه 2023 اعلام کرد.
مشکل Google Bard چه بود؟
اعلام Bard یک شکست بزرگ بود زیرا نسخه ی نمایشی که قرار بود هوش مصنوعی چت بات گوگل را به نمایش بگذارد حاوی یک خطای واقعی بود.
سهام گوگل متعاقباً صد میلیارد دلار از ارزش بازار خود را در یک روز از دست داد که نشان دهنده از دست دادن اعتماد مردم به توانایی گوگل برای حرکت در عصر آینده هوش مصنوعی است.
Google Bard چگونه کار می کند؟
Bard از نسخه “سبک” LaMDA تغذیه می شود. LaMDA یک مدل زبان بزرگ است که بر روی مجموعه داده های متشکل از گفتگوی عمومی و داده های وب آموزش داده شده است. در این جا دو فاکتور مهم وجود دارد و شامل موارد زیر است:
ایمنی: مدل با داده هایی که توسط گروه ها تفسیر شده است، به سطح از ایمنی دست می یابد.
پایه و مبنا : LaMDA به طور واقعی بر منابع دانش خارجی (از طریق بازیابی اطلاعات همان جستجو است) متکی است.
گوگل از سه معیار برای ارزیابی خروجی های LaMDA استفاده کرد:
منطقی بودن: اندازه گیری اینکه آیا یک پاسخ منطقی است یا نه.
اختصاصی بودن : اندازه گیری می کند که آیا پاسخ کلی است یا اختصاصی.
جالب بودن: این معیار اندازه گیری می کند که آیا پاسخ های LaMDA هوشمندانه هستند یا ایده می دهند.
هر سه معیار توسط ارزیابهای دیگر و جمع سپاری مورد قضاوت قرار گرفتند و این دادهها برای ادامه بهبود هوش مصنوعی به دستگاه بازگردانده شدند.
مقاله تحقیقاتی LaMDA با بیان اینکه بررسیهای جمعسپاری و توانایی سیستم برای بررسی واقعیت با موتور جستجو، تکنیکهای مفیدی بودند، به پایان میرسد.
برنامه ریزی گوگل برای استفاده از Bard در جستجو چگونه است؟
آینده بارد در حال حاضر به عنوان یک ویژگی در جستجو متصور شده است. اعلامیه گوگل در ماه فوریه در مورد نحوه اجرای Bard به اندازه کافی مشخص نبود. جزئیات کلیدی در یک پاراگراف آخر اعلامیه وبلاگ Bard قرار داده است. این عدم وضوح این تصور را تقویت کرد که بارد در جستجو ادغام خواهد شد، که هرگز چنین نبود.
اعلامیه بارد در فوریه 2023 گوگل بیان می کند که گوگل در برخی موارد ویژگی های هوش مصنوعی را در جستجو ادغام خواهد کرد:
“به زودی ویژگیهای مبتنی بر هوش مصنوعی را در “جستجو” خواهید دید که اطلاعات پیچیده و دیدگاههای متعدد را در قالبهای قابل درک تری ارائه می دهد، بنابراین میتوانید از وب بیشتر بیاموزید. مانند وبلاگهای افرادی که هم پیانو و هم گیتار مینوازند. این ویژگیهای جدید هوش مصنوعی به زودی در جستجوی Google منتشر خواهند شد.”
واضح است که بارد گزینه ای برای جستجو نیست. در عوض در نظر گرفته شده است که یک ویژگی در جستجو باشد و نه جایگزینی برای جستجو.
فیچر یا ویژگی جستجو چیست؟
یک فیچر چیزی شبیه به پانل دانش گوگل است که اطلاعاتی در مورد افراد، مکان ها و غیره را ارائه می دهد.
صفحه وب “جستجو چگونه کار میکند” درباره فیچرها توضیح میدهد:
“فیچرهای جستجوی Google تضمین میکند که اطلاعات مناسب را در زمان مناسب در قالبی که برای درخواست شما مفیدتر است، دریافت میکنید.”
گاهی اوقات این اطلاعات یک صفحه وب است و گاهی اوقات نقشه یا محصولی در یک فروشگاه محلی است. در یک جلسه داخلی در گوگل (که توسط CNBC گزارش شده است)، کارمندان استفاده از Bard در جستجو را زیر سوال بردند.
یکی از کارمندان اشاره کرد که مدل های زبان بزرگ مانند ChatGPT و Bard منابع اطلاعاتی مبتنی بر واقعیت نیستند.
Jack Krawczyk مدیر محصول Google Bard گفت بارد جستجوگر نیست.
در همان رویداد داخلی الیزابت رید معاون مهندسی جستجوی گوگل تکرار کرد که بارد جستجوگر نیست. او گفت: بارد واقعا از جستجو جداست..
چیزی که می توانیم با اطمینان نتیجه بگیریم این است که Bard تکرار جدیدی از جستجوی گوگل نیست. در واقع یک فیچر است.
بارد یک روش تعاملی برای کاوش موضوعات است
اعلامیه Google درباره Bard کاملاً صریح بود که Bard جستجوگر نمیشود. در واقع بارد به کاربران کمک میکند دانش و اطلاعات را بررسی کنند.
در این اطلاعیه توضیح داده شده است:
مردم برای پاسخهای واقعی سریع به گوگل مراجعه می کنند، مانند اینکه یک پیانو چند کلید دارد؟
همچنین مردم برای دریافت بینش و درک عمیقتر به Google روی میآورند. مثلاً آیا یادگیری پیانو یا گیتار آسانتر است و هر کدام چقدر تمرین نیاز دارند؟ مردم اغلب می خواهند طیف متنوعی از نظرات یا دیدگاه ها را بررسی کنند. بهتر است بارد را روشی تعاملی برای دستیابی به دانش بدانیم.
نمونه اطلاعات بارد
مشکل مدلهای زبان بزرگ این است که پاسخها را تقلید میکنند، که میتواند منجر به خطاهای واقعی شود. محققانی که LaMDA را ایجاد کردند اظهار داشتند که رویکردهایی مانند افزایش اندازه مدل می تواند به آن کمک کند اطلاعات واقعی بیشتری به دست آورد.
محققان می گویند این رویکرد در مناطقی که واقعیت ها به طور مداوم در طول زمان در حال تغییر هستند، شکست می خورد که از آن به عنوان “مشکل تعمیم زمانی” یاد می شود.
راه حلی که LaMDA دنبال کرد، پرسش در سیستم های بازیابی اطلاعات بود. یک سیستم بازیابی اطلاعات یک موتور جستجو است، بنابراین LaMDA نتایج جستجو را بررسی می کند.
به نظر می رسد این ویژگی از LaMDA یکی از ویژگی های Bard باشد. اعلامیه Google Bard توضیح می دهد بارد به دنبال ترکیب وسعت دانش جهان با قدرت، هوش و خلاقیت مدلهای بزرگ زبان ما است. از اطلاعات وب استفاده می کند تا پاسخ های تازه و باکیفیت ارائه دهد.
LaMDA و بارد با آنچه مجموعه ابزار نرم افزاری یا TS نامیده می شود به این امر دست می یابند.
مجموعه ابزار در مقاله LaMDA توضیح داده شده است:
ما یک مجموعه ابزار (TS) ایجاد می کنیم که شامل یک سیستم بازیابی اطلاعات، یک ماشین حساب و یک مترجم است. TS یک رشته را به عنوان ورودی می گیرد و لیستی از یک یا چند رشته را تولید می کند. هر ابزار در TS یک رشته را می پذیرد و لیستی از رشته ها را برمی گرداند.
برای مثال ماشین حساب “135+7721” را می گیرد و لیستی شامل [“7856”] را تولید میکند. به طور مشابه مترجم میتواند Hello in French را بگیرد و Bonjour را خروجی بدهد.
در نهایت سیستم بازیابی اطلاعات می تواند رافائل نادال چند ساله است؟ را دریافت کرده و خروجی [«رافائل نادال / سن / 35»] تولید کند.
سیستم بازیابی اطلاعات همچنین میتواند قطعههایی از محتوا را از وب باز به همراه URLهای مربوطه بازگرداند.TS یک رشته ورودی را روی تمام ابزارهای خود امتحان میکند و یک لیست خروجی نهایی از رشتهها را به ترتیب ماشین حساب، مترجم و سیستم بازیابی اطلاعات تولید میکند.
اگر ابزاری نتواند ورودی را آنالیز کند، فهرستی خالی از نتایج را برمیگرداند (به عنوان مثال ماشینحساب نمیتواند رافائل نادال چند ساله است؟ را آنالیز کند).
سیستم های پرسش و پاسخ محاوره ای
هیچ مقاله تحقیقاتی که نام “بارد” را ذکر کرده باشد وجود ندارد. با این حال تحقیقات اخیر در رابطه با هوش مصنوعی از جمله توسط دانشمندان مرتبط با LaMDA وجود دارد که ممکن است بر بارد تأثیر بگذارد.
مقالات ادعا نمی کنند که گوگل از این الگوریتم ها استفاده می کند. ما نمی توانیم به طور قطع بگوییم که هیچ یک از این فناوری ها در Bard استفاده می شود. الگوریتمهای مربوط به سیستمهای پاسخگویی به پرسش مبتنی بر هوش مصنوعی هستند.
یکی از نویسندگان LaMDA روی پروژه ای کار کرد که در مورد ایجاد داده های آموزشی برای یک سیستم بازیابی اطلاعات محاوره ای است.
مشکل آموزش سیستمی مانند Bard این است که مجموعه دادههای پرسش و پاسخ (مانند مجموعه دادههای متشکل از پرسشها و پاسخهای موجود در Reddit محدود به نحوه رفتار افراد در Reddit است. و شامل نحوه رفتار افراد خارج از آن محیط و انواع سؤالاتی که می پرسند نمی شود.
محققان ایجاد یک سیستم خواندن صفحات وب را مورد بررسی قرار دادند، سپس از یک ” dialog inpainter ” برای پیش بینی اینکه هر قطعه معینی در آنچه ماشین می خواند به چه سوالاتی پاسخ داده می شود، استفاده کردند.
قسمتی از یک صفحه اینترنتی معتبر ویکیپدیا که میگوید: “آسمان آبی است” را میتوان به این سوال تبدیل کرد که “آسمان چه رنگی است؟”
محققان مجموعه داده های پرسش و پاسخ خود را با استفاده از ویکی پدیا و سایر صفحات وب ایجاد کردند. آنها مجموعه داده ها را WikiDialog و WebDialog نامیدند.
WikiDialog مجموعهای از پرسشها و پاسخها است که از دادههای ویکیپدیا به دست میآید.
WebDialog مجموعه داده ای است که از گفتگوی صفحه وب در اینترنت مشتق شده است.
این مجموعه داده های جدید 1000 برابر بزرگتر از مجموعه داده های موجود هستند. اهمیت آن در این است که به مدل های زبان مکالمه فرصتی برای یادگیری بیشتر می دهد.
محققان گزارش دادند که این مجموعه داده جدید به بهبود سیستمهای پاسخگویی به سؤالات مکالمه تا بیش از 40 درصد کمک کرده است.
مقاله تحقیقاتی موفقیت این رویکرد را شرح می دهد:
ما متوجه شدیم که مجموعه داده های ما منابع قدرتمند داده های آموزشی برای سیستم های ConvQA هستند. هنگامی که برای پیشآموزش معماریهای بازیابی استاندارد و رتبهبندی مجدد استفاده میشوند، آنها پیشرفتهترین روشها را در سه معیار بازیابی ConvQA مختلف(QRECC, OR-QUAC, TREC-CAST) ارتقا میدهند، که تا 40 درصد سود نسبی را در معیارهای ارزیابی استاندارد ارائه میدهند.
آیا ممکن است Google Bard با استفاده از مجموعه داده های WikiDialog و WebDialog آموزش دیده باشد؟
تصور سناریویی که در آن گوگل آموزش هوش مصنوعی مکالمهای را بر روی مجموعه دادهای که بیش از 1000 برابر بزرگتر است، دشوار است. اما ما به طور قطع نمی دانیم زیرا گوگل اغلب در مورد فناوری های اساسی خود به جز در موارد نادر مانند Bard یا LaMDA اظهار نظر نمی کند.
مدلهای زبان بزرگ که به منابع پیوند دارند
گوگل اخیراً یک مقاله تحقیقاتی جالب در مورد روشی منتشر کرده است که مدل های زبان بزرگ را برای اطلاعات خود به منابع استناد می کند. نسخه اولیه مقاله در دسامبر 2022 منتشر شد و نسخه دوم در فوریه 2023 به روز شد. این فناوری از دسامبر 2022 به عنوان آزمایشی شناخته می شود.
مقاله تحقیقاتی هدف این فناوری را اینگونه بیان می کند:
مدلهای زبان بزرگ (LLM) نتایج چشمگیری را نشان دادهاند در حالی که نیاز به نظارت مستقیم یا کمی دارند. علاوه بر این شواهد زیادی وجود دارد که نشان می دهد LLM ها ممکن است در سناریوهای جستجوی اطلاعات دارای پتانسیل باشند.
ما QA نسبت داده شده را به عنوان اولین گام کلیدی در توسعه LLM های منتسب، فرموله و مطالعه می کنیم. ما یک چارچوب ارزیابی تکرارپذیر برای این کار پیشنهاد میکنیم.
این فناوری به طور خاص برای پاسخگویی به سؤالات است. هدف آن ایجاد پاسخهای بهتر است. چیزی که گوگل بهطور قابلتوجهی برای بارد میخواهد.
Attribution به کاربران و توسعه دهندگان این امکان را می دهد که قابلیت اعتماد و تفاوت پاسخ ها را ارزیابی کنند.
Attribution به توسعه دهندگان این امکان را می دهد که به سرعت کیفیت پاسخ ها را از آنجایی که منابع ارائه شده است بررسی کنند.
یکی از نکات جالب فناوری جدیدی به نام AutoAIS است که به شدت با ارزیابیکنندگان انسانی مرتبط است. به عبارت دیگر این فناوری میتواند کار ارزیابی انسانی را خودکار کند و فرآیند رتبهبندی پاسخهای دادهشده توسط یک مدل زبان بزرگ (مانند بارد) را مقیاسبندی کند.
ما رتبهبندی انسانی را استاندارد طلایی برای ارزیابی سیستم میدانیم، اما متوجه میشویم که AutoAIS به خوبی با قضاوت انسان در سطح سیستم همبستگی دارد و به عنوان یک معیار توسعه که در آن رتبهبندی انسانی غیرممکن است.
این فناوری تجربی است. احتمالا مورد استفاده نیست اما یکی از مسیرهایی را نشان می دهد که گوگل در حال بررسی برای تولید پاسخ های قابل اعتماد است.
چگونه می توان به Google Bard دسترسی پیدا کرد؟
Google در حال حاضر کاربران جدیدی را برای آزمایش Bard می پذیرد. گوگل در میگوید که بارد جستوجوگر نیست، ما در نقطه عطف بزرگی هستیم. درک بارد برای هر کسی که در وب محتوا منتشر میکند یا سئو را انجام میدهد مفید است.
نظرات کاربران