مدل زبان بزرگ

6 بهترین مدل زبان بزرگ در سال 2023

زمان مطالعه 7 دقیقه

. GPT-4 OpenAI پیشرفته ترین و پرکاربردترین مدل زبان بزرگ با 1.76 تریلیون پارامتر و توانایی های چندوجهی است.

. کلود 2 آنتروپیک در کارهای نوشتن خلاقانه با GPT-4 رقابت می کند و علیرغم داشتن منابع کمتر، جایگاه خود را حفظ می کند.

. Google’s Palm 2، اگرچه یک قاتل GPT-4 نیست، یک مدل زبان قدرتمند با توانایی های چند زبانه و خلاقانه قوی است. Falcon-180B یک مدل منبع باز است که با غول‌های تجاری رقابت می‌کند و می‌تواند با GPT-3.5 پا به پا باشد.

فصل هوش مصنوعی است و شرکت‌های فناوری در حال تولید مدل‌های زبان بزرگ مانند نان از نانوایی هستند. مدل های جدید به سرعت منتشر می شوند و پیگیری آن بسیار سخت می شود.

اما در میان هجوم نسخه‌های جدید، تنها چند مدل به اوج رسیده‌اند و خود را به عنوان رقیب واقعی در فضای بزرگ مدل‌های زبانی ثابت کرده‌اند. با نزدیک شدن به پایان سال 2023، شش مدل زبان بزرگ را که باید امتحان کنید، جمع آوری کرده ایم.

1. GPT-4 OpenAI

GPT-4 پیشرفته ترین مدل زبان بزرگ در دسترس عموم تا به امروز است. GPT-4 که ​​توسط OpenAI توسعه یافته و در مارس 2023 منتشر شد، آخرین نسخه از سری ترانسفورماتورهای پیش‌آموزشی ژنراتور است که در سال 2018 آغاز شد. GPT-4 با قابلیت‌های بسیار زیاد خود به یکی از پرکاربردترین و محبوب‌ترین زبان‌های بزرگ تبدیل شده است. مدل های دنیا

در حالی که به طور رسمی تایید نشده است، منابع تخمین می زنند که GPT-4 ممکن است دارای 1.76 تریلیون پارامتر باشد، حدود ده برابر بیشتر از مدل قبلی خود، GPT-3.5، و پنج برابر بزرگتر از پرچمدار گوگل، PaLM 2. این مقیاس عظیم، توانایی های چندوجهی GPT-4 را قادر می سازد. ، به آن اجازه می دهد هم متن و هم تصاویر را به عنوان ورودی پردازش کند. در نتیجه، GPT-4 می‌تواند اطلاعات بصری مانند نمودارها و تصاویر را علاوه بر متن تفسیر و توصیف کند. ماهیت چندوجهی آن درک انسان گونه تری از داده های دنیای واقعی را فراهم می کند.

در معیارهای علمی، GPT-4 به طور قابل توجهی از سایر مدل های معاصر در آزمایش های مختلف بهتر عمل می کند. در حالی که معیارها به تنهایی نقاط قوت یک مدل را به طور کامل نشان نمی دهند، موارد استفاده در دنیای واقعی نشان داده اند که GPT-4 در حل شهودی مشکلات عملی فوق العاده ماهر است. GPT-4 در حال حاضر 20 دلار در ماه صورتحساب دارد و از طریق طرح پلاس ChatGPT قابل دسترسی است.

2.مدل زبان بزرگ Anthropic’s Claude 2

اگرچه به اندازه GPT-4 محبوب نیست، Claude 2 که توسط Anthropic AI توسعه یافته است، می تواند با معیارهای فنی GPT -4 و عملکرد دنیای واقعی در چندین زمینه مطابقت داشته باشد. در برخی از آزمون‌های استاندارد، از جمله امتحانات منتخب، کلود 2 از GPT-4 بهتر عمل می‌کند. مدل زبان AI همچنین دارای یک پنجره زمینه بسیار برتر در حدود 100000 توکن در مقایسه با مدل های 8k و 32k توکن GPT -4 است. اگرچه طول متن بزرگتر همیشه به معنی عملکرد بهتر نیست، ظرفیت افزایش یافته کلود 2 مزایای واضحی مانند هضم کل کتاب های 75000 کلمه ای برای تجزیه و تحلیل فراهم می کند.

در عملکرد کلی، GPT-4 برتر باقی می ماند، اما آزمایشات داخلی ما نشان می دهد که کلود 2 در چندین کار نوشتن خلاق از آن فراتر رفته است. Claude 2 همچنین GPT-4 را در برنامه‌نویسی و مهارت‌های ریاضی بر اساس ارزیابی‌های ما دنبال می‌کند، اما در ارائه پاسخ‌های خلاقانه و انسان‌مانند برتر است. وقتی از همه مدل‌های این فهرست خواستیم که یک قطعه خلاقانه بنویسند یا بازنویسی کنند، شش بار از ده بار، نتیجه Claude 2 را برای نتایج شبیه به انسان‌مانند آن انتخاب کردیم. در حال حاضر، Claude 2 به صورت رایگان از طریق چت ربات Claude AI در دسترس است. همچنین یک طرح پرداخت 20 دلاری برای دسترسی به ویژگی های اضافی وجود دارد.

با وجود داشتن پشتوانه مالی کمتری نسبت به غول‌هایی مانند OpenAI و مایکروسافت، مدل هوش مصنوعی کلود 2 آنتروپیک در مقابل مدل‌های محبوب GPT و سری‌های PALM گوگل ایستادگی می‌کند. برای هوش مصنوعی با منابع کمتر، کلود 2 به طرز چشمگیری رقابتی است. اگر مجبور شوید روی اینکه کدام مدل موجود شانس بیشتری برای رقابت با GPT در آینده نزدیک دارد، شرط بندی کنید، Claude 2 امن ترین شرط بندی به نظر می رسد. اگرچه از نظر بودجه از نظر مالی پیشی گرفته است، اما قابلیت‌های پیشرفته کلود 2 نشان می‌دهد که می‌تواند حتی با غول‌هایی که بودجه خوبی نیز دارند، دست به کار شود (اگرچه شایان ذکر است که گوگل چندین کمک بزرگ به آنتروپیک کرده است). این مدل بالاتر از کلاس وزنی خود مشت می زند و به عنوان یک رقیب نوظهور نوید می دهد.

3. GPT-3.5 OpenAI

در حالی که تحت الشعاع انتشار GPT-4 قرار دارد، GPT-3.5 و 175 میلیارد پارامتر آن را نباید دست کم گرفت. GPT-3.5 از طریق تنظیم دقیق و ارتقاهای متمرکز بر عملکرد، دقت و ایمنی، فاصله زیادی با مدل اصلی GPT-3 داشته است. اگرچه فاقد قابلیت های چندوجهی GPT -4 است و از نظر طول زمینه و تعداد پارامترها عقب است، GPT-3.5 همچنان توانایی بالایی دارد و GPT-4 تنها مدلی است که می تواند به طور قاطع از عملکرد همه جانبه خود پیشی بگیرد.

علیرغم اینکه GPT-3.5 یک مدل درجه دوم در خانواده GPT است، می تواند خود را حفظ کند و حتی در چندین معیار از مدل های پرچمدار گوگل و متا بهتر عمل کند. در آزمون‌های جانبی مهارت‌های ریاضی و برنامه‌نویسی در برابر Google’s Palm 2، تفاوت‌ها فاحش نبود، با GPT-3.5 حتی در برخی موارد برتری جزئی داشت. کارهای خلاقانه تری مانند طنز و داستان نویسی باعث شد که GPT-3.5 قاطعانه جلو بیاید.

بنابراین، در حالی که GPT-4 نقطه عطف جدیدی در هوش مصنوعی است، GPT-3.5 یک مدل فوق‌العاده قدرتمند باقی می‌ماند که می‌تواند با پیشرفته‌ترین جایگزین‌ها رقابت کند و گاهی از آنها پیشی بگیرد. اصلاح مداوم آن تضمین می‌کند که حتی در کنار مدل‌های نسل بعدی درخشان‌تر، مرتبط باقی می‌ماند.

4.مدل زبان بزرگ Google’s Palm 2

هنگام ارزیابی قابلیت های یک مدل هوش مصنوعی، فرمول اثبات شده این است که گزارش فنی را بخوانید و نمرات معیار را بررسی کنید، اما همه چیزهایی را که یاد گرفتید با مقداری نمک در نظر بگیرید و خودتان مدل را آزمایش کنید. اگرچه ممکن است غیرقابل تصور به نظر برسد، نتایج بنچمارک همیشه با عملکرد دنیای واقعی برای برخی از مدل‌های هوش مصنوعی همخوانی ندارد. بر روی کاغذ، قرار بود PALM 2 گوگل قاتل GPT-4 باشد، با نتایج آزمایش رسمی نشان می دهد که در برخی از معیارها با GPT-4 مطابقت دارد. با این حال، در استفاده روزمره، تصویر متفاوتی ظاهر می شود.

در استدلال منطقی، ریاضیات و خلاقیت، PalM 2 کمتر از GPT-4 است. همچنین در طیف وسیعی از وظایف نوشتن خلاقانه از کلود آنتروپیک عقب مانده است. با این حال، اگرچه نمی تواند به عنوان یک کشنده GPT-4 عمل کند، Google Palm 2 به خودی خود یک مدل زبان قدرتمند با قابلیت های بسیار زیاد باقی می ماند. بسیاری از احساسات منفی پیرامون آن از مقایسه با مدل هایی مانند GPT-4 ناشی می شود تا عملکرد ضعیف آشکار.

با 340 میلیارد پارامتر، PalM 2 در میان بزرگترین مدل های جهان قرار دارد. این به ویژه در کارهای چند زبانه برتر است و دارای توانایی های ریاضی و برنامه نویسی قوی است. اگرچه PalM 2 در آن بهترین نیست، اما در کارهای خلاقانه مانند نوشتن نیز بسیار کارآمد است. بنابراین، در حالی که معیارها تصویر خوش بینانه ای را ترسیم کردند که به طور کامل محقق نشد، PalM 2 همچنان مهارت های هوش مصنوعی چشمگیری را نشان می دهد، حتی اگر از همه رقبای سراسر جهان پیشی نگیرد.

5. Falcon-180B TII

به احتمال زیاد هرگز با Falcon-180B مواجه نشده اید، مگر اینکه با سرعت انتشار مدل های زبان هوش مصنوعی همراه باشید. پارامتر 180 میلیاردی Falcon-180 که توسط مؤسسه نوآوری فناوری امارات توسعه یافته است، یکی از قدرتمندترین مدل‌های زبان منبع باز موجود است، حتی اگر نام مدل‌های GPT یا استفاده گسترده از متا Llama 2 را نداشته باشد. اشتباه – Falcon-180B می تواند پا به پای بهترین های کلاس ایستاده باشد.

نتایج بنچمارک نشان می‌دهد که Falcon-180B از اکثر مدل‌های منبع باز بهتر عمل می‌کند و با جاجگرنات‌های تجاری مانند PalM 2 و GPT-3.5 رقابت می‌کند. در تست ریاضی، کدنویسی، استدلال و نوشتن خلاقانه، حتی گاهی اوقات GPT-3.5 و PalM 2 را پشت سر گذاشت. اگر GPT-4، GPT-3.5 و Falcon-180B را رتبه بندی کنیم، Falcon-180B را به دلیل نقاط قوت آن در چندین مورد استفاده، دقیقاً بین GPT-4 و GPT-3.5 قرار می دهیم.

در حالی که نمی‌توانیم با اطمینان بگوییم که از نظر عملکرد کلی بهتر از GPT-3.5 است، اما خود را به خوبی نشان می‌دهد. در حالی که مبهم است، این مدل برای تطبیق یا فراتر رفتن از قابلیت های جایگزین های شناخته شده سزاوار توجه است. می توانید مدل Falcon-180B را در Hugging Face (یک پلتفرم منبع باز LLM) امتحان کنید.

6.مدل زبان بزرگ Meta AI’s Llama 2

Llama 2، مدل زبان بزرگ 70 میلیارد پارامتری متا AI، بر اساس نسخه قبلی خود، Llama 1 ساخته شده است. در حالی که Llama 2 کوچکتر از مدل های پیشرو است، به طور قابل توجهی از اکثر LLM های منبع باز در دسترس عموم در معیارها و استفاده در دنیای واقعی بهتر عمل می کند. یک استثنا می تواند Falcon-180B باشد.

ما Llama 2 را در برابر GPT-4، GPT-3.5، Claude 2 و PalM 2 آزمایش کردیم تا قابلیت های آن را بسنجیم. جای تعجب نیست که GPT-4 تقریباً در تمام پارامترها از Llama 2 پیشی گرفته است. با این حال، Llama 2 در چندین ارزیابی در مقابل GPT-3.5 و PalM 2 ایستادگی کرد. در حالی که ادعای برتری Llama 2 نسبت به PalM 2 نادرست است، Llama 2 بسیاری از مشکلات را که PalM 2 از جمله وظایف کدنویسی را دچار مشکل کرده بود، حل کرد. Claude 2 و GPT-3.5 در برخی مناطق از Llama 2 برتری داشتند، اما فقط در تعداد محدودی از کارها به طور قطعی بهتر بودند.

بنابراین، در حالی که از توانایی‌های بزرگ‌ترین مدل‌های اختصاصی فراتر نمی‌رود، Llama 2 منبع باز بالاتر از کلاس وزنی خود ضربه می‌زند. برای مدلی که به طور آشکار در دسترس است، عملکرد چشمگیری را نشان می‌دهد و در ارزیابی‌های انتخابی با غول‌های هوش مصنوعی مانند PaLM 2 رقابت می‌کند. Llama 2 نگاهی اجمالی به پتانسیل آینده مدل های زبان منبع باز ارائه می دهد.

شکاف عملکردی بین مدل‌های هوش مصنوعی در حال کاهش است

اگرچه چشم انداز هوش مصنوعی با سرعتی چشمگیر در حال تکامل است، GPT-4 OpenAI همچنان رهبر این بسته است. با این حال، در حالی که GPT-4 از نظر مقیاس و عملکرد بی بدیل باقی مانده است، مدل‌هایی مانند Claude 2 نشان می‌دهند که با مهارت کافی، مدل‌های کوچک‌تر می‌توانند در حوزه‌های انتخابی رقابت کنند. پالم 2 گوگل، علیرغم اینکه برخی از انتظارات عالی را برآورده نمی‌کند، هنوز قابلیت‌های عمیقی از خود نشان می‌دهد. و Falcon-180B ثابت می کند که ابتکارات منبع باز می توانند شانه به شانه غول های صنعت با توجه به منابع کافی باشند.

امتیاز دهید

برای این نوشته برچسبی وجود ندارد !

نظرات کاربران

دیدگاهی بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

تومان (IRT)
()
پرداخت می‌کنید
()
تومان (IRT)
دریافت می‌کنید
1 = IRT