. GPT-4 OpenAI پیشرفته ترین و پرکاربردترین مدل زبان بزرگ با 1.76 تریلیون پارامتر و توانایی های چندوجهی است.
. کلود 2 آنتروپیک در کارهای نوشتن خلاقانه با GPT-4 رقابت می کند و علیرغم داشتن منابع کمتر، جایگاه خود را حفظ می کند.
. Google’s Palm 2، اگرچه یک قاتل GPT-4 نیست، یک مدل زبان قدرتمند با توانایی های چند زبانه و خلاقانه قوی است. Falcon-180B یک مدل منبع باز است که با غولهای تجاری رقابت میکند و میتواند با GPT-3.5 پا به پا باشد.
فصل هوش مصنوعی است و شرکتهای فناوری در حال تولید مدلهای زبان بزرگ مانند نان از نانوایی هستند. مدل های جدید به سرعت منتشر می شوند و پیگیری آن بسیار سخت می شود.
اما در میان هجوم نسخههای جدید، تنها چند مدل به اوج رسیدهاند و خود را به عنوان رقیب واقعی در فضای بزرگ مدلهای زبانی ثابت کردهاند. با نزدیک شدن به پایان سال 2023، شش مدل زبان بزرگ را که باید امتحان کنید، جمع آوری کرده ایم.
1. GPT-4 OpenAI
GPT-4 پیشرفته ترین مدل زبان بزرگ در دسترس عموم تا به امروز است. GPT-4 که توسط OpenAI توسعه یافته و در مارس 2023 منتشر شد، آخرین نسخه از سری ترانسفورماتورهای پیشآموزشی ژنراتور است که در سال 2018 آغاز شد. GPT-4 با قابلیتهای بسیار زیاد خود به یکی از پرکاربردترین و محبوبترین زبانهای بزرگ تبدیل شده است. مدل های دنیا
در حالی که به طور رسمی تایید نشده است، منابع تخمین می زنند که GPT-4 ممکن است دارای 1.76 تریلیون پارامتر باشد، حدود ده برابر بیشتر از مدل قبلی خود، GPT-3.5، و پنج برابر بزرگتر از پرچمدار گوگل، PaLM 2. این مقیاس عظیم، توانایی های چندوجهی GPT-4 را قادر می سازد. ، به آن اجازه می دهد هم متن و هم تصاویر را به عنوان ورودی پردازش کند. در نتیجه، GPT-4 میتواند اطلاعات بصری مانند نمودارها و تصاویر را علاوه بر متن تفسیر و توصیف کند. ماهیت چندوجهی آن درک انسان گونه تری از داده های دنیای واقعی را فراهم می کند.
در معیارهای علمی، GPT-4 به طور قابل توجهی از سایر مدل های معاصر در آزمایش های مختلف بهتر عمل می کند. در حالی که معیارها به تنهایی نقاط قوت یک مدل را به طور کامل نشان نمی دهند، موارد استفاده در دنیای واقعی نشان داده اند که GPT-4 در حل شهودی مشکلات عملی فوق العاده ماهر است. GPT-4 در حال حاضر 20 دلار در ماه صورتحساب دارد و از طریق طرح پلاس ChatGPT قابل دسترسی است.
2.مدل زبان بزرگ Anthropic’s Claude 2
اگرچه به اندازه GPT-4 محبوب نیست، Claude 2 که توسط Anthropic AI توسعه یافته است، می تواند با معیارهای فنی GPT -4 و عملکرد دنیای واقعی در چندین زمینه مطابقت داشته باشد. در برخی از آزمونهای استاندارد، از جمله امتحانات منتخب، کلود 2 از GPT-4 بهتر عمل میکند. مدل زبان AI همچنین دارای یک پنجره زمینه بسیار برتر در حدود 100000 توکن در مقایسه با مدل های 8k و 32k توکن GPT -4 است. اگرچه طول متن بزرگتر همیشه به معنی عملکرد بهتر نیست، ظرفیت افزایش یافته کلود 2 مزایای واضحی مانند هضم کل کتاب های 75000 کلمه ای برای تجزیه و تحلیل فراهم می کند.
در عملکرد کلی، GPT-4 برتر باقی می ماند، اما آزمایشات داخلی ما نشان می دهد که کلود 2 در چندین کار نوشتن خلاق از آن فراتر رفته است. Claude 2 همچنین GPT-4 را در برنامهنویسی و مهارتهای ریاضی بر اساس ارزیابیهای ما دنبال میکند، اما در ارائه پاسخهای خلاقانه و انسانمانند برتر است. وقتی از همه مدلهای این فهرست خواستیم که یک قطعه خلاقانه بنویسند یا بازنویسی کنند، شش بار از ده بار، نتیجه Claude 2 را برای نتایج شبیه به انسانمانند آن انتخاب کردیم. در حال حاضر، Claude 2 به صورت رایگان از طریق چت ربات Claude AI در دسترس است. همچنین یک طرح پرداخت 20 دلاری برای دسترسی به ویژگی های اضافی وجود دارد.
با وجود داشتن پشتوانه مالی کمتری نسبت به غولهایی مانند OpenAI و مایکروسافت، مدل هوش مصنوعی کلود 2 آنتروپیک در مقابل مدلهای محبوب GPT و سریهای PALM گوگل ایستادگی میکند. برای هوش مصنوعی با منابع کمتر، کلود 2 به طرز چشمگیری رقابتی است. اگر مجبور شوید روی اینکه کدام مدل موجود شانس بیشتری برای رقابت با GPT در آینده نزدیک دارد، شرط بندی کنید، Claude 2 امن ترین شرط بندی به نظر می رسد. اگرچه از نظر بودجه از نظر مالی پیشی گرفته است، اما قابلیتهای پیشرفته کلود 2 نشان میدهد که میتواند حتی با غولهایی که بودجه خوبی نیز دارند، دست به کار شود (اگرچه شایان ذکر است که گوگل چندین کمک بزرگ به آنتروپیک کرده است). این مدل بالاتر از کلاس وزنی خود مشت می زند و به عنوان یک رقیب نوظهور نوید می دهد.
3. GPT-3.5 OpenAI
در حالی که تحت الشعاع انتشار GPT-4 قرار دارد، GPT-3.5 و 175 میلیارد پارامتر آن را نباید دست کم گرفت. GPT-3.5 از طریق تنظیم دقیق و ارتقاهای متمرکز بر عملکرد، دقت و ایمنی، فاصله زیادی با مدل اصلی GPT-3 داشته است. اگرچه فاقد قابلیت های چندوجهی GPT -4 است و از نظر طول زمینه و تعداد پارامترها عقب است، GPT-3.5 همچنان توانایی بالایی دارد و GPT-4 تنها مدلی است که می تواند به طور قاطع از عملکرد همه جانبه خود پیشی بگیرد.
علیرغم اینکه GPT-3.5 یک مدل درجه دوم در خانواده GPT است، می تواند خود را حفظ کند و حتی در چندین معیار از مدل های پرچمدار گوگل و متا بهتر عمل کند. در آزمونهای جانبی مهارتهای ریاضی و برنامهنویسی در برابر Google’s Palm 2، تفاوتها فاحش نبود، با GPT-3.5 حتی در برخی موارد برتری جزئی داشت. کارهای خلاقانه تری مانند طنز و داستان نویسی باعث شد که GPT-3.5 قاطعانه جلو بیاید.
بنابراین، در حالی که GPT-4 نقطه عطف جدیدی در هوش مصنوعی است، GPT-3.5 یک مدل فوقالعاده قدرتمند باقی میماند که میتواند با پیشرفتهترین جایگزینها رقابت کند و گاهی از آنها پیشی بگیرد. اصلاح مداوم آن تضمین میکند که حتی در کنار مدلهای نسل بعدی درخشانتر، مرتبط باقی میماند.
4.مدل زبان بزرگ Google’s Palm 2
هنگام ارزیابی قابلیت های یک مدل هوش مصنوعی، فرمول اثبات شده این است که گزارش فنی را بخوانید و نمرات معیار را بررسی کنید، اما همه چیزهایی را که یاد گرفتید با مقداری نمک در نظر بگیرید و خودتان مدل را آزمایش کنید. اگرچه ممکن است غیرقابل تصور به نظر برسد، نتایج بنچمارک همیشه با عملکرد دنیای واقعی برای برخی از مدلهای هوش مصنوعی همخوانی ندارد. بر روی کاغذ، قرار بود PALM 2 گوگل قاتل GPT-4 باشد، با نتایج آزمایش رسمی نشان می دهد که در برخی از معیارها با GPT-4 مطابقت دارد. با این حال، در استفاده روزمره، تصویر متفاوتی ظاهر می شود.
در استدلال منطقی، ریاضیات و خلاقیت، PalM 2 کمتر از GPT-4 است. همچنین در طیف وسیعی از وظایف نوشتن خلاقانه از کلود آنتروپیک عقب مانده است. با این حال، اگرچه نمی تواند به عنوان یک کشنده GPT-4 عمل کند، Google Palm 2 به خودی خود یک مدل زبان قدرتمند با قابلیت های بسیار زیاد باقی می ماند. بسیاری از احساسات منفی پیرامون آن از مقایسه با مدل هایی مانند GPT-4 ناشی می شود تا عملکرد ضعیف آشکار.
با 340 میلیارد پارامتر، PalM 2 در میان بزرگترین مدل های جهان قرار دارد. این به ویژه در کارهای چند زبانه برتر است و دارای توانایی های ریاضی و برنامه نویسی قوی است. اگرچه PalM 2 در آن بهترین نیست، اما در کارهای خلاقانه مانند نوشتن نیز بسیار کارآمد است. بنابراین، در حالی که معیارها تصویر خوش بینانه ای را ترسیم کردند که به طور کامل محقق نشد، PalM 2 همچنان مهارت های هوش مصنوعی چشمگیری را نشان می دهد، حتی اگر از همه رقبای سراسر جهان پیشی نگیرد.
5. Falcon-180B TII
به احتمال زیاد هرگز با Falcon-180B مواجه نشده اید، مگر اینکه با سرعت انتشار مدل های زبان هوش مصنوعی همراه باشید. پارامتر 180 میلیاردی Falcon-180 که توسط مؤسسه نوآوری فناوری امارات توسعه یافته است، یکی از قدرتمندترین مدلهای زبان منبع باز موجود است، حتی اگر نام مدلهای GPT یا استفاده گسترده از متا Llama 2 را نداشته باشد. اشتباه – Falcon-180B می تواند پا به پای بهترین های کلاس ایستاده باشد.
نتایج بنچمارک نشان میدهد که Falcon-180B از اکثر مدلهای منبع باز بهتر عمل میکند و با جاجگرناتهای تجاری مانند PalM 2 و GPT-3.5 رقابت میکند. در تست ریاضی، کدنویسی، استدلال و نوشتن خلاقانه، حتی گاهی اوقات GPT-3.5 و PalM 2 را پشت سر گذاشت. اگر GPT-4، GPT-3.5 و Falcon-180B را رتبه بندی کنیم، Falcon-180B را به دلیل نقاط قوت آن در چندین مورد استفاده، دقیقاً بین GPT-4 و GPT-3.5 قرار می دهیم.
در حالی که نمیتوانیم با اطمینان بگوییم که از نظر عملکرد کلی بهتر از GPT-3.5 است، اما خود را به خوبی نشان میدهد. در حالی که مبهم است، این مدل برای تطبیق یا فراتر رفتن از قابلیت های جایگزین های شناخته شده سزاوار توجه است. می توانید مدل Falcon-180B را در Hugging Face (یک پلتفرم منبع باز LLM) امتحان کنید.
6.مدل زبان بزرگ Meta AI’s Llama 2
Llama 2، مدل زبان بزرگ 70 میلیارد پارامتری متا AI، بر اساس نسخه قبلی خود، Llama 1 ساخته شده است. در حالی که Llama 2 کوچکتر از مدل های پیشرو است، به طور قابل توجهی از اکثر LLM های منبع باز در دسترس عموم در معیارها و استفاده در دنیای واقعی بهتر عمل می کند. یک استثنا می تواند Falcon-180B باشد.
ما Llama 2 را در برابر GPT-4، GPT-3.5، Claude 2 و PalM 2 آزمایش کردیم تا قابلیت های آن را بسنجیم. جای تعجب نیست که GPT-4 تقریباً در تمام پارامترها از Llama 2 پیشی گرفته است. با این حال، Llama 2 در چندین ارزیابی در مقابل GPT-3.5 و PalM 2 ایستادگی کرد. در حالی که ادعای برتری Llama 2 نسبت به PalM 2 نادرست است، Llama 2 بسیاری از مشکلات را که PalM 2 از جمله وظایف کدنویسی را دچار مشکل کرده بود، حل کرد. Claude 2 و GPT-3.5 در برخی مناطق از Llama 2 برتری داشتند، اما فقط در تعداد محدودی از کارها به طور قطعی بهتر بودند.
بنابراین، در حالی که از تواناییهای بزرگترین مدلهای اختصاصی فراتر نمیرود، Llama 2 منبع باز بالاتر از کلاس وزنی خود ضربه میزند. برای مدلی که به طور آشکار در دسترس است، عملکرد چشمگیری را نشان میدهد و در ارزیابیهای انتخابی با غولهای هوش مصنوعی مانند PaLM 2 رقابت میکند. Llama 2 نگاهی اجمالی به پتانسیل آینده مدل های زبان منبع باز ارائه می دهد.
شکاف عملکردی بین مدلهای هوش مصنوعی در حال کاهش است
اگرچه چشم انداز هوش مصنوعی با سرعتی چشمگیر در حال تکامل است، GPT-4 OpenAI همچنان رهبر این بسته است. با این حال، در حالی که GPT-4 از نظر مقیاس و عملکرد بی بدیل باقی مانده است، مدلهایی مانند Claude 2 نشان میدهند که با مهارت کافی، مدلهای کوچکتر میتوانند در حوزههای انتخابی رقابت کنند. پالم 2 گوگل، علیرغم اینکه برخی از انتظارات عالی را برآورده نمیکند، هنوز قابلیتهای عمیقی از خود نشان میدهد. و Falcon-180B ثابت می کند که ابتکارات منبع باز می توانند شانه به شانه غول های صنعت با توجه به منابع کافی باشند.
نظرات کاربران