هوش مصنوعی Bloomberg GPT یک مدل زبانی مبتنی بر هوش مصنوعی است که برای بخش مالی توسعه یافته است. این مدل زبانی با استفاده از حجم زیادی از داده مالی و تکنیکهای یادگیری ماشین آموزش داده شده است. کاربر هدف این سرویس مشاوران مالی، متخصصان و سرمایهگذارانی هستند که از سرویسهای مالی شرکت بلومبرگ استفاده میکنند.
هوش مصنوعی Bloomberg GPT
بلومبرگ جی پی تی (Bloomberg GPT) یک مدل زبانی عظیم مبتنی بر هوش مصنوعی است. این مدل زبانی با کمک طیف گستردهای از دادههای مالی آموزش داده شده است. هوش مصنوعی اخیرا پیشرفتهای بسیاری داشته است، اما امور مالی حوزهای پیچیده و منحصربهفرد است. این مدل به بلومبرگ کمک میکند تا وظایف نیازمند پردازش زبان طبیعی (NLP) مانند تحلیل احساسات بازار، طبقهبندی اخبار و پاسخگویی به سوالات را انجام دهد. NLP شاخهای از یادگیری ماشین (Machine Learning) است که بر استخراج معنا از کلمات تمرکز دارد.
کاربرد NLP در قلمروی فناوری مالی بسیار گسترده و پیچیده است، چون باید از تحلیل احساسات و تشخیص موجودیتهای اسمی (Named Entity Recognition) برای پاسخگویی به سوالات استفاده شود. این محصول جدید امکان جدیدی برای بلومبرگ فراهم میکند تا از دادههای متنوع ترمینال بلومبرگ (Bloomberg Terminal) به شیوهای موثرتر بهره ببرد. ترمینال بلومبرگ نرمافزاری است که اخبار مالی، گزارشها و دادههای بازار، شرکتها و صنایع را در اختیار سرمایهگذاران، بانکها و مدیران مالی قرار میدهد.
بلومبرگ GPT چطور کار میکند؟
تصوری که ما از هوش مصنوعی و مدلهای زبانی داریم، اغلب مشابه عملکرد ChatGPT است. از GPT شرکت OpenAI اغلب بهعنوان مدل بنیادین نام برده میشود. چون برای انجام کار ویژهای طراحی نشده است. رویکرد بلومبرگ متفاوت است. این مدل زبانی براساس حجم گستردهای از اسناد مالی آموزش داده شده است. این اسناد طی سالها توسط شرکت بلومبرگ جمعآوری شدهاند تا مدلی مسلط بر اطلاعات مالی و اقتصادی طراحی کنند.
نیمی از دادههای مورد استفاده در مدل BloombergGPT از منابع غیر مالی در سراسر وب مانند گیتهاب، زیرنویسهای یوتیوب و ویکیپدیا جمعآوری شدهاند. بلومبرگ همچنین بیش از ۱۰۰ میلیارد کلمه را از یک مجموعه داده اختصاصی بهنام FinPile اضافه کرده است. این مجموعه شامل دادههای مالی از پروندههای اوراق بهادار، بیانیههای مطبوعاتی، اخبار بلومبرگ و سایر نشریات و جستجو در وب با تمرکز به صفحات اقتصادی و مالی طی ۲۰ سال گذشته است.
بلومبرگ جی پی تی از مجموعه دادهای ۳۶۳ میلیارد توکنی، متشکل از اسناد مالی و ۳۴۵ میلیارد توکن از مجموعه دادههای عمومی استفاده میکند. بهطور کلی بلومبرگ توسط بیش از ۷۰۰ میلیارد توکن آموزش دیده است. برای تجزیهوتحلیل یک متن، باید آن را به عناصر معنی و کلمات تقسیم کنیم، به هر یک از این عناصر یک توکن گفته میشود.
بلومبرگ GPT همچنین یک مدل زبانی ۵۰ میلیارد پارامتری است. پارامتر یک متغیر پیکربندیشده درون مدل است و مدل برای پیشبینی کردن به این پارامترها نیاز دارد و نشاندهنده مهارت مدل در حل مشکل است. مثلا GPT-3 یک مدل ۱۷۵ میلیارد پارامتری و Bloom مدلی ۱۷۶ میلیارد پارامتری است.
بلومبرگ GPT چندزبانه نیست و فقط از اسناد انگلیسی برای آموزش آن استفاده شده است؛ بنابراین این مدل، توانایی درک و پردازش به زبانهای دیگر را ندارد. چت جی پی تی و بلومبرگ GPT دستاوردهای چشمگیری در عرصه هوش مصنوعی داشتهاند، اما همچنان بر سر توسعه مدلی که محتوای اشتباه یا تخیلی تولید نکند، رقابت میکنند. کاربران بلومبرگ هنگام استفاده از این پلتفرم احتمالا با چنین مشکلاتی روبرو شوند. این نرمافزار ممکن است گاهی اوقات پاسخهای نامربوط تولید کند. همچنین ممکن است محتوای غیر مجاز را پردازش کند. مدل Bloomberg GPT یک مدل متن بسته است و بلومبرگ اطلاعات چندانی بهجز دادههای کلی و پارامترهای آموزشی آن، فاش نکرده است.
مقایسه با سایر مدلهای زبانی
طبق آزمایشات انجامشده، بلومبرگ میتواند نتایج بسیار بهتری را در مقایسه با مدلهای مشابه ایجاد کند. در تصویر زیر توانایی پاسخگویی و دقت بلومبرگ GPT با مدلهای GPT-NeoX و FLAN-T5-XXL مقایسه شده است. در این آزمون از هر سه مدل نام چندین مدیرعامل بانک و بنگاههای مالی بزرگ پرسیده شده است و هیچکدام از دو مدل دیگر، موفق نشدهاند با دقت BloombergGPT پاسخ دهند.
نظرات کاربران