بهترین چت بات

از زمان محبوبیت ChatGPT در نوامبر گذشته، چت‌بات های زیاد دیگری نیز راه‌اندازی شده‌اند که به‌عنوان رقیب ChatGPT عمل می‌کنند. این چت‌بات‌ها از نظر LLM (مدل زبانی بزرگ)، قیمت، رابط کاربری، دسترسی به اینترنت و موارد دیگری متفاوت هستند و برای آسان‌ترکردن مقایسه آن‌ها، یک سازمان تحقیقاتی به نام Model Systems Organization که توسط دانشجویان و اساتید «دانشگاه کالیفرنیا، برکلی» تأسیس شده، از Chatbot Arena رونمایی کرده است. در این پست به بررسی بهترین چت بات میپردازیم.

بهترین چت بات

Chatbot Arena یک پلتفرم بنچمارک‌گیری برای مدل‌های زبانی بزرگ است که به کاربران اجازه می‌دهد چت‌بات‌ها را با یکدیگر مقایسه کند. برای آزمایش چت‌بات‌ها با این پلتفرم، کاربران ابتدا باید یک درخواست را ارائه کنند و سپس دو مدل به‌طور تصادفی پاسخ‌هایی را ارائه می‌کنند و کاربران بدون اینکه از LLM هر مدل اطلاعی داشته باشند، بهترین پاسخ را انتخاب می‌کنند.

پس از اینکه کاربران بهترین پاسخ ارائه‌شده توسط یکی از دو چت‌بات را انتخاب کردند، نام آن نمایش داده می‌شود.

به‌عنوان مثال، در آزمایش زیر از دو چت‌بات خواسته شده است تا یک نامه درخواست مرخصی بنویسد. پس از ارائه پاسخ‌های متفاوت و انتخاب گزینه موردنظر، متوجه می‌شوید که یکی از چت‌بات‌ها koala-13b و دیگری vicuna-13b نام دارد.

بهترین چت بات

سپس در صفحه تابلوی امتیازات (Leaderboard)، رتبه‌بندی تمام LLMها نمایش داده می‌شود که نتایج آزمایش کاربران تأثیر زیادی بر آن دارد و از سیستم رده‌بندی Elo استفاده می‌کند که در زمینه محاسبه سطح مهارتی بازیکنان رشته‌های ورزشی کاربرد دارد. طبق این صفحه، درحال‌حاضر GPT-4 از OpenAI پیشرفته‌ترین LLM محسوب می‌شود و امتیاز Elo آن 1227 است. Claude-v1 که توسط Anthropic توسعه یافته، با امتیاز 1227 در جایگاه دوم قرار دارد.

بهترین چت بات

در جایگاه هشتم این لیست نیز نام PaLM-Chat-Bison-001 دیده می‌شود که یکی از زیرمجموعه‌های PaLM 2، مدل زبانی بزرگ هوش مصنوعی Bard گوگل است.

علاوه‌براین، وب‌سایت ChatBot Arena بخش دیگری نیز دارد که از طریق آن می‌توانید یک چت‌بات مشخص را آزمایش کنید یا دو مدل مشخص را با یکدیگر مقایسه کنید. اگر می‌خواهید LLM خاصی را آزمایش کنید، این ویژگی می‌تواند مفید باشد.

برای این نوشته برچسبی وجود ندارد !

نویسنده :

محسن دادار

مقالات نویسنده

اختلال جهانی کلودفلر برطرف شد ( ۲۷ آبان ۱۴۰۴)

اخبار

سرانجام پس از چندین ساعت التهاب در فضای مجازی و از دسترس خارج شدن بسیاری از وب‌سایت‌های پربازدید، مشکل فنی سرویس‌های کلودفلر به طور کامل برطرف شد و دسترسی به اینترنت جهانی به حالت عادی بازگشت. صبح امروز، کاربران سراسر دنیا با پیام‌های خطای متعددی هنگام تلاش برای ورود به سرویس‌های محبوبی همچون ChatGPT، شبکه اجتماعی ایکس (توییتر سابق) و دیسکورد مواجه شدند. اما طبق آخرین به‌روزرسانی منتشر شده از سوی کلودفلر در ساعت 10 صبح به وقت شرق آمریکا، اصلاحات لازم اعمال شده و این شرکت با اطمینان اعلام کرده است که حادثه اکنون حل‌وفصل شده است. دلایل اختلال جهانی کلودفلر این اختلال گسترده که از حوالی ساعت 7 صبح آغاز شده بود، ناشی از مشکلاتی در زیرساخت‌های کلودفلر...

خواندن مقاله

تاثیر عایق‌کاری در کاهش هزینه قبض گاز

اخبار

در دنیای امروز که با افزایش قیمت انرژی و دغدغه‌های زیست‌محیطی مواجه هستیم، مدیریت بهینه مصرف منابع انرژی اهمیت ویژه‌ای دارد. یکی از روش‌های مؤثر برای کاهش هزینه‌های مرتبط با مصرف انرژی، عایق‌کاری مناسب ساختمان‌ها است. عایق‌کاری نه‌ تنها به کاهش میزان اتلاف حرارت و صرفه‌جویی در مصرف انرژی کمک می‌کند، بلکه تاثیر مستقیمی بر کاهش هزینه‌های گاز دارد. این مطلب، به‌ بررسی تاثیرات عایق‌کاری بر کاهش هزینه‌های گاز مصرفی می‌پردازد و روش‌های استعلام قبض گاز را مورد بررسی قرار خواهد داد. عوامل موثر بر هزینه قبض گاز چیست؟ هزینه قبض تحت‌ تاثیر مجموعه‌ای از عوامل قرار می‌گیرد. این موارد هریک به نوبه خود می‌تواند به‌طور مستقیم یا غیرمستقیم بر میزان مصرف انرژی و در نتیجه هزینه‌های مرتبط با...

خواندن مقاله

بانک مرکزی ترکیه مجوز شرکت سهامی پول الکترونیک پاپارا را باطل کرد

اخبار

بانک مرکزی ترکیه با انتشار یک اطلاعیه در روزنامه رسمی این کشور، مجوز فعالیت «شرکت سهامی پول الکترونیک پاپارا» را به طور کامل باطل کرد. این تصمیم که بازتاب گسترده‌ای در فضای مالی دیجیتال ترکیه داشت، در راستای مصوبه «سازمان تنظیم و نظارت بانکی» اتخاذ شد و بانک مرکزی ترکیه مجوزی که در تاریخ ۲۱ آوریل ۲۰۱۶ به این شرکت اعطا کرده بود را از اعتبار ساقط کرد. رسانه‌های ترکیه دلیل باطل شدن مجوز این شرکت را مواردی چون «نبود شفافیت در تراکنش‌های بین‌المللی»، «رعایت نکردن برخی مقررات» و «کمبودهای نظارتی» عنوان کردند. دادگاه ترکیه چند ماه قبل و با ابلاغ یک لایحه‌ برای مدیریت شرکت سهامی پول الکترونیک «پاپارا» امین موقت یا «قیم» منصوب کرده بود. خبرنگار گروه آسیای...

خواندن مقاله

سرشاخه های مجموعه هرمی نتوگیمر دستگیر شدند!

اخبار

مجموعه هرمی به عنوان نتوگیمر، مورد برخورد قضایی قرار گرفته است.نفر اول و موسس مجموعه در استان البرز با دستور قضایی دستگیر و تمامی سایت ها، صفحات مجازی منتصب به این مجموعه نیز توقیف گردیده است. نفر اول و موسس مجموعه در استان البرز با دستور قضایی دستگیر و بازداشت شده است، همچنین تمامی سایت ها، صفحات مجازی منتصب به این مجموعه نیز توقیف گردیده است و پرونده قضایی شرکت در جریان رسیدگی می باشد. این مجموعه مدعی بوده که در حوزه سرمایه گذاری و مبادلات ارزهای دیجیتال فعالیت می کند و با عرضه و فروش توکن موسوم به «neto» اقدام به جذب سرمایه از عموم مردم می نماید. مجموعه نتوگیمر ادعا نموده که در زمینه بازی های رایانه ای...

خواندن مقاله

گزارش جدید Search Console Insights معرفی شد

اخبار

پس از مدت‌ها آزمایش و دریافت بازخورد کاربران، گوگل نسخه‌ی جدیدی از گزارش Search Console Insights را منتشر کرده است. این نسخه‌ی جدید، مستقیماً در محیط اصلی Search Console ادغام شده و جایگزین نسخه‌ی بتای مستقل قبلی شده است. هدف از این تغییر، ارائه تجربه‌ای منسجم‌تر و یکپارچه‌تر برای کاربران است تا بتوانند از ابزارهای تحلیلی متنوع موجود در کنسول جستجو، به‌صورت همزمان و هماهنگ استفاده کنند. تغییرات گزارش جدید Search Console Insights گزارش جدید Insights به‌طور ویژه برای تولیدکنندگان محتوا، وبلاگ‌نویسان و صاحبان سایت‌ها طراحی شده است تا بدون نیاز به دانش تخصصی در تحلیل داده، بتوانند عملکرد وب‌سایت خود را بهتر درک کنند. خرید با پی پال از سایت خارجی نسخه‌ی جدید این گزارش،...

خواندن مقاله

مرورگر کامت (Comet) توسط پرپلکسیتی رونمایی شد

اخبار

شرکت پرپلکسیتی با معرفی یک مرورگر جدید به نام کامت (Comet)، گام مهمی در جهت توسعه‌ی اکوسیستم خود برداشته است. این مرورگر که با هدف یکپارچه‌سازی تجربه کاربری و تعامل با وب طراحی شده، از موتور جستجو و ابزارهای هوشمند همین شرکت قدرت می‌گیرد تا تجربه‌ای متفاوت از وب‌گردی را برای کاربران رقم بزند. بررسی مرورگر کامت (Comet) در حال حاضر، دسترسی به کامت محدود به مشترکان سرویس پرمیوم Perplexity Max است که هزینه‌ای معادل 200 دلار در ماه دارد. البته این شرکت اعلام کرده است که در آینده‌ی نزدیک، این مرورگر از طریق سیستم دعوت‌نامه‌ای در اختیار تعداد بیشتری از کاربران قرار خواهد گرفت. این اقدام پرپلکسیتی را می‌توان به عنوان حرکتی استراتژیک برای رقابت مستقیم با گوگل در...

خواندن مقاله

نظرات کاربران