در میان گزینههای متعدد هوش مصنوعی مولد تصویر، هوش مصنوعی میدجرنی مدتهاست که در مقام یک استاندارد طلایی در خلاقیت، واقعگرایی و انعطافپذیری عمل میکند. اما مدل جدید گوگل با نام هوش مصنوعی نانو بنانا (Nano Banana) بهسرعت در حال مطرح شدن است. سبک بودن، سریع العمل بودن و همچنین توانایی خلق تصاویر جذاب و محبوب در شبکههای اجتماعی، باعث جلب توجهها به سوی این مدل جدید شده است. اپلیکیشن جمینای که میزبان این مدل است، اکنون بیش از ۲۳ میلیون کاربر فعال دارد و این موضوع محبوبیت بیچونوچرای آن را نشان میدهد. در این پست از اول پرداخت به مقایسه هوش مصنوعی نانو بنانا و میدجرنی می پردازیم.
مقایسه هوش مصنوعی نانو بنانا و میدجرنی
برای بررسی دقیقتر این دو هوش مصنوعی ساخت عکس، هر دو مدل با ۹ پرامپت یکسان آزمایش شده است؛ پرامپتهایی که برای سنجش نقاط قوت در زمینههای واقعگرایی، سبک، طنز، رندر متنی و روایتگری طراحی شدهاند. از پرترههای فوتورئالیستی گرفته تا اسپایدرمن در میدان تایمز نیویورک، نتایج نشان دادند که هر ابزار در کجا میدرخشد و در کجا ضعف دارد.
۱- واقعگرایی
یک پرتره هایپررئالیستی از یک زن سالخورده با چینوچروکهای عمیق، موهای نقرهای جمعشده، با شالی قرمز، در نور نرم و طلایی غروب، با بافت پوست فوقالعاده دقیق.
Nano Banana: تنها یک تصویر تولید کرد، اما در همان تصویر موفق شد تمامی جزئیات پرامپت، از جمله نورپردازی طلایی غروب را بهطور کامل پیادهسازی کند. نتیجه آن یک تصویر فوتورئالیستی چشمگیر و بسیار واقعی بود.
Midjourney: چندین تصویر ایجاد کرد، اما هیچکدام نتوانستند عنصر “نور غروب طلایی” را بهدرستی نمایش دهند. اگرچه تصاویر از نظر ظاهری واقعی بودند، اما دقت و هماهنگی آنها با پرامپت به پای نانو بنانا نرسید.
برنده: Nano Banana به دلیل ثبت کامل همه جزئیات پرامپت و ارائه یک تصویر فوتورئالیستی برتر.
۲- ساخت دنیای فانتزی
یک قلعه شناور از جنس شیشه و کریستال که بالای آبشاری معلق است، اژدهاها اطراف آن پرواز میکنند و روستاییان از پایین به تماشا ایستادهاند.

مقایسه هوش مصنوعی نانو بنانا و میدجرنی
Nano Banana: تصویری شگفتانگیز و فانتزی خلق کرد؛ قلعهای نورانی همراه با آبشار درخشان که گویی از دل یک کتاب داستان بیرون آمده بود. با این حال، ابرهای بیشازحد منظم و پرندگان کاملا همفاصله، صحنه را کمی مصنوعی جلوه دادند و از حس جادویی آن کاستند.
Midjourney: چهار تصویر خیرهکننده ارائه داد که نهتنها تمام اجزای پرامپت را پوشش میدادند، بلکه با افزودن جزئیات اضافه، صحنهای فراتر از انتظار را رقم زدند.
برنده: میدجرنی به دلیل خلق صحنهای واقعا فانتزی که هم با پرامپت هماهنگ بود و هم عناصر اضافی آن را به سطحی بالاتر رساند.
۳- آزمون واقعگرایی روزمره
یک کافه شلوغ در شهر نیویورک در یک روز بارانی؛ بازتابها روی کف زمین، مشتریانی مشغول کار با لپتاپ و باریستایی که شیر را میجوشاند دیده میشوند.
Nano Banana: توانست روز بارانی را نشان دهد، اما این کار را با قرار دادن چندین چتر در ارتفاع بالا انجام داد که غیرواقعی بهنظر میرسد (چترها معمولا نزدیک در ورودی و در ارتفاع پایینتر قرار دارند). علاوه بر این، تنوع مشتریان کافه کم بود و اغلب آنها شبیه هم به نظر میرسیدند.
Midjourney: به تنوع نیویورک توجه کرد و گروهی متنوع از افراد را در کافه به تصویر کشید. زاویهی دید انتخابی کمی متفاوت از انتظار بود، اما بهخوبی حس شلوغی کافه را منتقل کرد. باران بیرون بهطور مستقیم کمتر دیده میشد، اما با توجه به لباس مشتریان، شرایط آبوهوایی بارانی بهوضوح قابل درک بود.
برنده: Midjourney به دلیل ارائه تصویری واقعگرایانهتر از یک کافه نیویورکی، حتی با وجود نمایش کمتر از بارش باران.
۴- طنز و سورئالیسم
یک سگ نژاد کورگی سامورایی که بر روی اسکیتبرد در جنگل بامبو حرکت میکند، طراحیشده در سبک چاپ چوبی اوکیو-اِ (ukiyo-e)
Nano Banana: تصویری خلق کرد که هم کورگی سامورایی و هم پسزمینه را بهخوبی نشان میداد و عنصر سبک چاپ اوکیو-اِ را بهتر از رقیب به تصویر کشید.
Midjourney: تصاویر بامزهتر و متنوعتری از کورگیهای سامورایی تولید کرد. سگها در حالتها و ژستهای مختلف به نمایش درآمدند، اما نوشتههای موجود در تصاویر ناخوانا بودند و همین موضوع از کیفیت کلی خروجی کاست.
برنده: Nano Banana به دلیل نمایش دقیقتر سبک سنتی چاپ چوبی اوکیو-اِ و حفظ هماهنگی کامل با پرامپت.
۵- چالش رندر متن
تابلوی نئونی یک کافه شبانه که روی آن نوشته شده باشد ‘OPEN 24 HOURS’ همراه با بازتابهای درخشان روی آسفالت خیس، با پسزمینهای از یک کافه سبک دهه ۱۹۵۰.
Nano Banana: نمای بیرونی یک کافه دهه پنجاه میلادی را بهصورت فوتورئالیستی خلق کرد و توانست متن روی تابلو را بدون غلط املایی نمایش دهد. با این حال، بازتاب روی زمین بیش از حد مصنوعی به نظر میرسید و بخشی از حس طبیعی بودن صحنه را از بین برد.
Midjourney: نهتنها نمای بیرونی کافه دهه ۵۰ را دقیقتر بازسازی کرد، بلکه طراحی داخلی آن را هم در نظر گرفت. هرچند در یکی از تصاویر واژه “hours” اشتباه نوشته شده بود، اما سه تصویر دیگر بهمراتب واقعیتر و قابل باورتر از خروجی Nano Banana بودند.
برنده: Midjourney به دلیل ارائه تفسیری کاملتر و باورپذیرتر از پرامپت.
۶- چشمانداز سینمایی
یک نمای واید حماسی از سواحل شنی سیاه ایسلند با امواج سهمگین، آسمان طوفانی و فردی با بارانی قرمز در خط ساحل.
Nano Banana: تصویری خیرهکننده خلق کرد که تقریبا زنده به نظر میرسید. امواج شکافنده، آسمان تیره و عمق صحنه بهگونهای بودند که انگار خودتان در ساحل حضور دارید. نتیجه، تصویری بسیار چشمگیر بود که حس روایت درونی را منتقل میکرد.
Midjourney: تصاویر دراماتیک مشابهی تولید کرد، اما امواج آنقدر عظیم بودند که کل صحنه را تحتالشعاع قرار میدادند و عملا ساحل را میبلعیدند. نبود چشمانداز زمینی در پسزمینه هم باعث شد تصاویر بیشتر شبیه یک منظره دریایی فانتزی باشند تا یک نمای واقعی از اقیانوس.
برنده: Nano Banana به دلیل ایجاد تصویری متعادلتر، باورپذیرتر و در عین حال باشکوه که زیبایی طبیعت را بدون افراط به نمایش گذاشت.
۷- سبک انتزاعی/ هنری
یک نقاشی کوبیستی از یک گروه جاز که در یک کلوب دودی مشغول نواختن هستند، با اشکال اغراقشده، رنگهای جسورانه و الهامگرفته از پیکاسو.
Nano Banana: بار دیگر نشان داد که کیفیت مهمتر از کمیت است. تصویری خلق کرد که حتی با قاب هنری همراه بود و بهطور کامل حس آثار الهامگرفته از پیکاسو را منتقل میکرد؛ بهگونهای که میتوانستید آن را در یک گالری هنری تصور کنید.
Midjourney: سبک کوبیستی را تا حدی بهخوبی بازآفرینی کرد، اما چهار خروجی آن تقریبا مشابه بودند، فاقد عمق و تنوع. هیچکدام بهقدری منحصربهفرد نبودند که ماندگار شوند یا بهعنوان اثر شاخص جلوه کنند.
برنده: Nano Banana به دلیل خلاقیت و ارائه تصویری که بیشتر شبیه یک اثر هنری اصیل به نظر میرسید.
۸- بامزه و مناسب برای وایرالشدن
یک بچه فیل در یک استخر کوچک پر از اردکهای پلاستیکی، با عینک آفتابی بزرگ، در سبک کارتونی پاستلی.
Nano Banana: دقیقا همان چیزی را تولید کرد که در پرامپت خواسته شده بود. تصویری خلق کرد که انگار مستقیما از یک کتاب داستان یا دفتر رنگآمیزی کودکان بیرون آمده باشد. خطوط تیره مناسب بازی و سبک کارتونی روشن، حال و هوای فانتزی و کودکانه را بهطور کامل منتقل کردند.
Midjourney: رویکرد متفاوتی را در پیش گرفت و بیشتر به سمت واقعگرایی متمایل شد. تصاویر تولیدشده بدون شک بامزه بودند (و حتی به نظر میرسید مناسب دکور حمام بچهها باشند)، اما در نهایت از هدف اصلی فاصله گرفتند. پرامپت یک طراحی کارتونی میخواست، نه یک رندر فوتورئالیستی.
برنده: Nano Banana به دلیل توجه کامل به پرامپت و نمایش بینقص سبک کارتونی.
برنده نهایی: نانو بنانا
پس از ۹ دور مقایسه، یک نکته روشن است: نانو بنانا فراتر از انتظار ظاهر شد. این مدل در زمینههای فوتورئالیسم، طنز و پرامپتهای هنری عملکرد درخشانی داشت. در مقابل، میدجرنی ارزش خود را در ساخت دنیای فانتزی و واقعگرایی روزمره نشان داد و با تولید چندین نسخه متنوع، حتی با وجود ایرادها، اغلب تجربهای بهتر و گستردهتر ارائه کرد.
در این رقابت، نانو بنانا برنده شد؛ چرا که توانست سریعتر، دقیقتر و با جذابیتی غیرمنتظره به پرامپتها پاسخ دهد و به بهترین گزینه برای تولید سریع تصاویر با توجه به دستور تبدیل شود. با این حال، اگر به دنبال مجموعهای متنوعتر با جزئیات لایهلایه و انتخابهای بیشتر باشید، میدجرنی همچنان برتری خود را حفظ میکند.
نظرات کاربران