گوگل با ارائه یک بهروزرسانی مهم برای مدلهای هوش مصنوعی خود، قابلیت جدیدی را در حوزه ویرایش تصویر معرفی کرده است که یکی از بزرگترین چالشهای کاربران را هدف قرار میدهد. این ویژگی که با استفاده از یک مدل پیشرفته توسعهیافته در تیم دیپمایند (DeepMind) طراحی شده، مشکل عدم ثبات شخصیت در تصاویر تولیدشده با هوش مصنوعی را برطرف میکند.
جدیدترین هوش مصنوعی گوگل
تاکنون، کاربران ابزارهای هوش مصنوعی مولد تصویر مانند DALL-E 3 با این مسئله مواجه بودند که هنگام تلاش برای خلق تصاویر متعدد از یک شخصیت، چهره و ویژگیهای آن در هر تصویر جدید تغییر میکرد. این محدودیت، استفاده از این فناوری برای داستانسرایی یا تولید محتوای سریالی را دشوار میساخت.
با جدیدترین هوش مصنوعی گوگل، کاربران میتوانند یک عکس مرجع از خود، دوستان یا حتی حیوانات خانگیشان را بارگذاری کنند و سپس ویرایشهای خلاقانهای روی آن اعمال کنند، بدون آنکه هویت اصلی سوژه از بین برود. برای مثال، میتوان مدل موی یک فرد را به سبک دهه 60 تغییر داد یا یک سگ را در لباسی خاص قرار داد و در عین حال اطمینان داشت که چهرهی سوژه کاملاً قابل تشخیص باقی میماند. این پیشرفت، ابزار جمینای را از یک سرگرمی صرف به یک ابزار کاربردی و خلاقانه برای مصارف روزمره تبدیل میکند.
علاوه بر حفظ ثبات چهره، این بهروزرسانی امکانات قدرتمند دیگری را نیز فراهم میآورد. کاربران اکنون میتوانند دو یا چند تصویر را با یکدیگر ترکیب کنند؛ مثلاً تصویر پرترهی خود را در کنار سگشان در یک زمین بسکتبال قرار دهند. قابلیت ویرایش چندمرحلهای نیز اضافه شده است که به کاربر اجازه میدهد یک صحنه را قدمبهقدم بسازد. برای نمونه، میتوان با یک اتاق خالی شروع کرد،
سپس به هوش مصنوعی دستور داد دیوارها را رنگ کند، یک قفسه کتاب اضافه کند و در نهایت یک میز قهوه در صحنه قرار دهد. همچنین، امکان انتقال بافت یا الگوی یک شیء به شیء دیگر نیز وجود دارد؛ مانند طراحی یک لباس با الهام از الگوی بالهای یک پروانه. این مجموعه از ویژگیها، کنترل بیسابقهای را در اختیار کاربران قرار میدهد و میتواند مزیت رقابتی قابل توجهی برای گوگل در بازار هوش مصنوعی ایجاد کند. این قابلیت جدید از امروز در اپلیکیشن جمینای در دسترس قرار گرفته و تمامی تصاویر ویرایششده با یک واترمارک مشخص میشوند تا ماهیت تولیدشده با هوش مصنوعی آنها شفاف باشد.
نظرات کاربران