Google Bard

هر آنچه که باید درباره Google Bard بدانید

زمان مطالعه 8 دقیقه

گوگل به تازگی Bard را در رقابت با ChatGPT منتشر کرده است و کاربران در حال آشنایی با این هوش مصنوعی و مقایسه آن با OpenAI هستند.

نام Bard صرفاً برای بازاریابی است، زیرا هیچ الگوریتمی به نام Bard وجود ندارد، اما ما می دانیم که چت بات توسط LaMDA طراحی شده است.

گوگل بارد چیست؟

Bard یک چت بات آزمایشی گوگل است که از مدل زبان بزرگ LaMDA پشتیبانی می‌کند. بارد این یک هوش مصنوعی مولد است که دستورات را می‌پذیرد و تسک های مبتنی بر متن مانند پاسخ‌ها و خلاصه‌ها و اشکال مختلف محتوا را تحویل می دهد.

بارد همچنین با خلاصه کردن اطلاعات موجود در اینترنت و ارائه لینک سایت ها به کاوش در موضوعات کمک می کند.

چرا گوگل بارد را منتشر کرد؟

گوگل Bard را پس از راه‌اندازی موفقیت‌آمیز ChatGPT OpenAI منتشر کرد که این تصور را ایجاد کرد که گوگل از نظر فناوری عقب مانده است.ChatGPT به عنوان یک فناوری انقلابی با پتانسیل ایجاد اختلال در صنعت جستجو گوگل تلقی شد.

در 21 دسامبر 2022 سه هفته پس از راه اندازی ChatGPT نیویورک تایمز گزارش داد که گوگل یک “کد قرمز” اعلام کرده است. چهل و هفت روز پس از تعدیل استراتژی کد قرمز گوگل راه اندازی Bard را در 6 فوریه 2023 اعلام کرد.

مشکل Google Bard چه بود؟

اعلام Bard یک شکست بزرگ بود زیرا نسخه ی نمایشی که قرار بود هوش مصنوعی چت بات گوگل را به نمایش بگذارد حاوی یک خطای واقعی بود.

سهام گوگل متعاقباً صد میلیارد دلار از ارزش بازار خود را در یک روز از دست داد که نشان دهنده از دست دادن اعتماد مردم به توانایی گوگل برای حرکت در عصر آینده هوش مصنوعی است.

Google Bard چگونه کار می کند؟

Bard از نسخه “سبک” LaMDA تغذیه می شود. LaMDA یک مدل زبان بزرگ است که بر روی مجموعه داده های متشکل از گفتگوی عمومی و داده های وب آموزش داده شده است. در این جا دو فاکتور مهم وجود دارد و شامل موارد زیر است:

ایمنی: مدل با داده هایی که توسط گروه ها تفسیر شده است، به سطح از ایمنی دست می یابد.

پایه و مبنا : LaMDA به طور واقعی بر منابع دانش خارجی (از طریق بازیابی اطلاعات همان جستجو است) متکی است.

گوگل از سه معیار برای ارزیابی خروجی های LaMDA استفاده کرد:

منطقی بودن: اندازه گیری اینکه آیا یک پاسخ منطقی است یا نه.

اختصاصی بودن : اندازه گیری می کند که آیا پاسخ کلی است یا اختصاصی.

جالب بودن: این معیار اندازه گیری می کند که آیا پاسخ های LaMDA هوشمندانه هستند یا ایده می دهند.

هر سه معیار توسط ارزیاب‌های دیگر و جمع سپاری مورد قضاوت قرار گرفتند و این داده‌ها برای ادامه بهبود هوش مصنوعی به دستگاه بازگردانده شدند.

مقاله تحقیقاتی LaMDA با بیان اینکه بررسی‌های جمع‌سپاری و توانایی سیستم برای بررسی واقعیت با موتور جستجو، تکنیک‌های مفیدی بودند، به پایان می‌رسد.

برنامه ریزی گوگل برای استفاده از Bard در جستجو چگونه است؟

آینده بارد در حال حاضر به عنوان یک ویژگی در جستجو متصور شده است. اعلامیه گوگل در ماه فوریه در مورد نحوه اجرای Bard به اندازه کافی مشخص نبود. جزئیات کلیدی در یک پاراگراف آخر اعلامیه وبلاگ Bard قرار داده است. این عدم وضوح این تصور را تقویت کرد که بارد در جستجو ادغام خواهد شد، که هرگز چنین نبود.

اعلامیه بارد در فوریه 2023 گوگل بیان می کند که گوگل در برخی موارد ویژگی های هوش مصنوعی را در جستجو ادغام خواهد کرد:

“به زودی ویژگی‌های مبتنی بر هوش مصنوعی را در “جستجو” خواهید دید که اطلاعات پیچیده و دیدگاه‌های متعدد را در قالب‌های قابل درک تری ارائه می دهد، بنابراین می‌توانید از وب بیشتر بیاموزید. مانند وبلاگ‌های افرادی که هم پیانو و هم گیتار می‌نوازند. این ویژگی‌های جدید هوش مصنوعی به زودی در جستجوی Google منتشر خواهند شد.”

واضح است که بارد گزینه ای برای جستجو نیست. در عوض در نظر گرفته شده است که یک ویژگی در جستجو باشد و نه جایگزینی برای جستجو.

فیچر یا ویژگی جستجو چیست؟

یک فیچر چیزی شبیه به پانل دانش گوگل است که اطلاعاتی در مورد افراد، مکان ها و غیره را ارائه می دهد.

صفحه وب “جستجو چگونه کار می‌کند” درباره فیچرها توضیح می‌دهد:

“فیچرهای جستجوی Google تضمین می‌کند که اطلاعات مناسب را در زمان مناسب در قالبی که برای درخواست شما مفیدتر است، دریافت می‌کنید.”

گاهی اوقات این اطلاعات یک صفحه وب است و گاهی اوقات نقشه یا محصولی در یک فروشگاه محلی است. در یک جلسه داخلی در گوگل (که توسط CNBC گزارش شده است)، کارمندان استفاده از Bard در جستجو را زیر سوال بردند.

یکی از کارمندان اشاره کرد که مدل های زبان بزرگ مانند ChatGPT و Bard منابع اطلاعاتی مبتنی بر واقعیت نیستند.

Jack Krawczyk مدیر محصول Google Bard گفت بارد جستجوگر نیست.

در همان رویداد داخلی الیزابت رید معاون مهندسی جستجوی گوگل تکرار کرد که بارد جستجوگر نیست. او گفت: بارد واقعا از جستجو جداست..

چیزی که می توانیم با اطمینان نتیجه بگیریم این است که Bard تکرار جدیدی از جستجوی گوگل نیست. در واقع یک فیچر است.

بارد یک روش تعاملی برای کاوش موضوعات است

اعلامیه Google درباره Bard کاملاً صریح بود که Bard جستجوگر نمی‌شود. در واقع بارد به کاربران کمک می‌کند دانش و اطلاعات را بررسی کنند.

در این اطلاعیه توضیح داده شده است:

مردم برای پاسخ‌های واقعی سریع به گوگل مراجعه می کنند، مانند اینکه یک پیانو چند کلید دارد؟

همچنین مردم برای دریافت بینش و درک عمیق‌تر به Google روی می‌آورند. مثلاً آیا یادگیری پیانو یا گیتار آسان‌تر است و هر کدام چقدر تمرین نیاز دارند؟ مردم اغلب می خواهند طیف متنوعی از نظرات یا دیدگاه ها را بررسی کنند. بهتر است بارد را روشی تعاملی برای دستیابی به دانش بدانیم.

نمونه اطلاعات بارد

مشکل مدل‌های زبان بزرگ این است که پاسخ‌ها را تقلید می‌کنند، که می‌تواند منجر به خطاهای واقعی شود. محققانی که LaMDA را ایجاد کردند اظهار داشتند که رویکردهایی مانند افزایش اندازه مدل می تواند به آن کمک کند اطلاعات واقعی بیشتری به دست آورد.

محققان می گویند این رویکرد در مناطقی که واقعیت ها به طور مداوم در طول زمان در حال تغییر هستند، شکست می خورد که از آن به عنوان “مشکل تعمیم زمانی” یاد می شود.

راه حلی که LaMDA دنبال کرد، پرسش در سیستم های بازیابی اطلاعات بود. یک سیستم بازیابی اطلاعات یک موتور جستجو است، بنابراین LaMDA نتایج جستجو را بررسی می کند.

به نظر می رسد این ویژگی از LaMDA یکی از ویژگی های Bard باشد. اعلامیه Google Bard توضیح می دهد بارد به دنبال ترکیب وسعت دانش جهان با قدرت، هوش و خلاقیت مدل‌های بزرگ زبان ما است. از اطلاعات وب استفاده می کند تا پاسخ های تازه و باکیفیت ارائه دهد.

LaMDA و بارد با آنچه مجموعه ابزار نرم افزاری یا TS نامیده می شود به این امر دست می یابند.

مجموعه ابزار در مقاله LaMDA توضیح داده شده است:

ما یک مجموعه ابزار (TS) ایجاد می کنیم که شامل یک سیستم بازیابی اطلاعات، یک ماشین حساب و یک مترجم است. TS یک رشته را به عنوان ورودی می گیرد و لیستی از یک یا چند رشته را تولید می کند. هر ابزار در TS یک رشته را می پذیرد و لیستی از رشته ها را برمی گرداند.

برای مثال ماشین حساب “135+7721” را می گیرد و لیستی شامل [“7856”] را تولید میکند. به طور مشابه مترجم می‌تواند Hello in French را بگیرد و Bonjour را خروجی بدهد.

در نهایت سیستم بازیابی اطلاعات می تواند رافائل نادال چند ساله است؟ را دریافت کرده و خروجی [«رافائل نادال / سن / 35»] تولید کند.

سیستم بازیابی اطلاعات همچنین می‌تواند قطعه‌هایی از محتوا را از وب باز به همراه URLهای مربوطه بازگرداند.TS یک رشته ورودی را روی تمام ابزارهای خود امتحان می‌کند و یک لیست خروجی نهایی از رشته‌ها را به ترتیب ماشین حساب، مترجم و سیستم بازیابی اطلاعات تولید می‌کند.

اگر ابزاری نتواند ورودی را آنالیز کند، فهرستی خالی از نتایج را برمی‌گرداند (به عنوان مثال ماشین‌حساب نمی‌تواند رافائل نادال چند ساله است؟ را آنالیز کند).

سیستم های پرسش و پاسخ محاوره ای

هیچ مقاله تحقیقاتی که نام “بارد” را ذکر کرده باشد وجود ندارد. با این حال تحقیقات اخیر در رابطه با هوش مصنوعی از جمله توسط دانشمندان مرتبط با LaMDA وجود دارد که ممکن است بر بارد تأثیر بگذارد.

مقالات ادعا نمی کنند که گوگل از این الگوریتم ها استفاده می کند. ما نمی توانیم به طور قطع بگوییم که هیچ یک از این فناوری ها در Bard استفاده می شود. الگوریتم‌های مربوط به سیستم‌های پاسخگویی به پرسش مبتنی بر هوش مصنوعی هستند.

یکی از نویسندگان LaMDA روی پروژه ای کار کرد که در مورد ایجاد داده های آموزشی برای یک سیستم بازیابی اطلاعات محاوره ای است.

مشکل آموزش سیستمی مانند Bard این است که مجموعه داده‌های پرسش و پاسخ (مانند مجموعه داده‌های متشکل از پرسش‌ها و پاسخ‌های موجود در Reddit محدود به نحوه رفتار افراد در Reddit است. و شامل نحوه رفتار افراد خارج از آن محیط و انواع سؤالاتی که می پرسند نمی شود.

محققان ایجاد یک سیستم خواندن صفحات وب را مورد بررسی قرار دادند، سپس از یک ” dialog inpainter ” برای پیش بینی اینکه هر قطعه معینی در آنچه ماشین می خواند به چه سوالاتی پاسخ داده می شود، استفاده کردند.

قسمتی از یک صفحه اینترنتی معتبر ویکی‌پدیا که می‌گوید: “آسمان آبی است” را می‌توان به این سوال تبدیل کرد که “آسمان چه رنگی است؟”

محققان مجموعه داده های پرسش و پاسخ خود را با استفاده از ویکی پدیا و سایر صفحات وب ایجاد کردند. آنها مجموعه داده ها را WikiDialog و WebDialog نامیدند.

WikiDialog مجموعه‌ای از پرسش‌ها و پاسخ‌ها است که از داده‌های ویکی‌پدیا به دست می‌آید.

WebDialog مجموعه داده ای است که از گفتگوی صفحه وب در اینترنت مشتق شده است.

این مجموعه داده های جدید 1000 برابر بزرگتر از مجموعه داده های موجود هستند. اهمیت آن در این است که به مدل های زبان مکالمه فرصتی برای یادگیری بیشتر می دهد.

محققان گزارش دادند که این مجموعه داده جدید به بهبود سیستم‌های پاسخگویی به سؤالات مکالمه تا بیش از 40 درصد کمک کرده است.

مقاله تحقیقاتی موفقیت این رویکرد را شرح می دهد:

ما متوجه شدیم که مجموعه داده های ما منابع قدرتمند داده های آموزشی برای سیستم های ConvQA هستند. هنگامی که برای پیش‌آموزش معماری‌های بازیابی استاندارد و رتبه‌بندی مجدد استفاده می‌شوند، آن‌ها پیشرفته‌ترین روش‌ها را در سه معیار بازیابی ConvQA مختلف(QRECC, OR-QUAC, TREC-CAST) ارتقا می‌دهند، که تا 40 درصد سود نسبی را در معیارهای ارزیابی استاندارد ارائه می‌دهند.

آیا ممکن است Google Bard با استفاده از مجموعه داده های WikiDialog و WebDialog آموزش دیده باشد؟

تصور سناریویی که در آن گوگل آموزش هوش مصنوعی مکالمه‌ای را بر روی مجموعه داده‌ای که بیش از 1000 برابر بزرگ‌تر است، دشوار است. اما ما به طور قطع نمی دانیم زیرا گوگل اغلب در مورد فناوری های اساسی خود به جز در موارد نادر مانند Bard یا LaMDA اظهار نظر نمی کند.

مدل‌های زبان بزرگ که به منابع پیوند دارند

گوگل اخیراً یک مقاله تحقیقاتی جالب در مورد روشی منتشر کرده است که مدل های زبان بزرگ را برای اطلاعات خود به منابع استناد می کند. نسخه اولیه مقاله در دسامبر 2022 منتشر شد و نسخه دوم در فوریه 2023 به روز شد. این فناوری از دسامبر 2022 به عنوان آزمایشی شناخته می شود.

مقاله تحقیقاتی هدف این فناوری را اینگونه بیان می کند:

مدل‌های زبان بزرگ (LLM) نتایج چشمگیری را نشان داده‌اند در حالی که نیاز به نظارت مستقیم یا کمی دارند. علاوه بر این شواهد زیادی وجود دارد که نشان می دهد LLM ها ممکن است در سناریوهای جستجوی اطلاعات دارای پتانسیل باشند.

ما QA نسبت داده شده را به عنوان اولین گام کلیدی در توسعه LLM های منتسب، فرموله و مطالعه می کنیم. ما یک چارچوب ارزیابی تکرارپذیر برای این کار پیشنهاد می‌کنیم.

این فناوری به طور خاص برای پاسخگویی به سؤالات است. هدف آن ایجاد پاسخ‌های بهتر است. چیزی که گوگل به‌طور قابل‌توجهی برای بارد می‌خواهد.

Attribution به کاربران و توسعه دهندگان این امکان را می دهد که قابلیت اعتماد و تفاوت پاسخ ها را ارزیابی کنند.

Attribution به توسعه دهندگان این امکان را می دهد که به سرعت کیفیت پاسخ ها را از آنجایی که منابع ارائه شده است بررسی کنند.

یکی از نکات جالب فناوری جدیدی به نام AutoAIS است که به شدت با ارزیابی‌کنندگان انسانی مرتبط است. به عبارت دیگر این فناوری می‌تواند کار ارزیابی انسانی را خودکار کند و فرآیند رتبه‌بندی پاسخ‌های داده‌شده توسط یک مدل زبان بزرگ (مانند بارد) را مقیاس‌بندی کند.

ما رتبه‌بندی انسانی را استاندارد طلایی برای ارزیابی سیستم می‌دانیم، اما متوجه می‌شویم که AutoAIS به خوبی با قضاوت انسان در سطح سیستم همبستگی دارد و به عنوان یک معیار توسعه که در آن رتبه‌بندی انسانی غیرممکن است.

این فناوری تجربی است. احتمالا مورد استفاده نیست اما یکی از مسیرهایی را نشان می دهد که گوگل در حال بررسی برای تولید پاسخ های قابل اعتماد است.

چگونه می توان به Google Bard دسترسی پیدا کرد؟

Google در حال حاضر کاربران جدیدی را برای آزمایش Bard می پذیرد. گوگل در می‌گوید که بارد جست‌وجوگر نیست، ما در نقطه عطف بزرگی هستیم. درک بارد برای هر کسی که در وب محتوا منتشر می‌کند یا سئو را انجام می‌دهد مفید است.

امتیاز دهید

برای این نوشته برچسبی وجود ندارد !

نظرات کاربران

دیدگاهی بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

تومان (IRT)
()
پرداخت می‌کنید
()
تومان (IRT)
دریافت می‌کنید
1 = IRT