برای تولید کننده تصویر هوش مصنوعی پولی پرداخت نکنید. در این پست به معرفی بهترین منبع باز تولید عکس با هوش مصنوعی می پردازیم.
بهترین منبع باز تولید عکس با هوش مصنوعی
مدل های تولید متن به تصویر مبتنی بر هوش مصنوعی در همه جا وجود دارند و دسترسی روزانه آسان تر می شود. در حالی که بازدید از یک وب سایت و ایجاد تصویر مورد نظر آسان است، اگر می خواهید کنترل بیشتری بر فرآیند تولید داشته باشید، مولد های متن به تصویر منبع باز بهترین گزینه هستند.
ده ها مولد متن به تصویر هوش مصنوعی رایگان و منبع باز در اینترنت موجود است که در انواع خاصی از تصاویر تخصص دارند. بنابر این، ما این شمع را غربال کرده ایم و بهترین تولید کننده های متن به تصویر AI منبع باز را پیدا کرده ایم که می توانید همین الان امتحان کنید.
سایت Craiyon
Craiyon یکی از در دسترس ترین تولید کنندگان تصویر AI منبع باز می باشد. این بر اساس DALL-E Mini است، و در حالی که می توانید مخزن Github را شبیه سازی نمایید و مدل را به صورت محلی روی کامپیوتر خود نصب کنید، به نظر می رسد Craiyon این رویکرد را به نفع وب سایت خود کنار گذاشته است.
مخزن رسمی Github از ژوئن 2022 به روز نشده است، اما آخرین مدل هنوز به صورت رایگان در سایت رسمی Craiyon در دسترس می باشد. هیچ برنامه اندروید یا iOS هم وجود ندارد.
از نظر عملکرد، تمام گزینه های معمولی را که از یک تولید کننده تصویر هوش مصنوعی انتظار دارید، مشاهده خواهید کرد. هنگامی که درخواست خود را وارد کردید و یک تصویر دریافت نمودید، می توانید از ویژگی ارتقاء برای دریافت یک کپی با وضوح بالاتر استفاده کنید. سه سبک برای انتخاب وجود دارد: هنر، عکس، و طراحی. همچنین اگر می خواهید مدل تصمیم بگیرد، می توانید گزینه «هیچ» را انتخاب نمایید.
علاوه بر این، “حالت متخصص” به شما امکان می دهد کلمات منفی را اضافه کنید، که به مدل می گوید از موارد خاص اجتناب کند. همچنین یک ویژگی پیش بینی سریع وجود دارد که از ChatGPT برای کمک به کاربران برای نوشتن بهترین و دقیق ترین درخواست های ممکن استفاده می کند. در نهایت، ویژگی های حذف پس زمینه مبتنی بر هوش مصنوعی می تواند به شما در صرفه جویی در زمان و تلاش برای برش پس زمینه از تصاویر کمک کند.
و این در مورد تمام کار هایی است که کرایون انجام می دهد. این پیچیده ترین مدل تولید تصویر هوش مصنوعی نیست، اما اگر چیزی جزئی یا واقعی نمی خواهید، بهعنوان یک مدل پایه خوب عمل می کند. استفاده از این مدل رایگان است، اما کاربران رایگان به 9 تصویر رایگان در یک زمان در یک دقیقه محدود می شوند. می توانید در ردیف های پشتیبان یا حرفهای آن ها (به ترتیب با قیمت ۵ و ۲۰ دلار در ماه و صورتحساب سالانه) مشترک شوید تا بدون تبلیغات یا واترمارک، تولید سریع تر و گزینه ای برای خصوصی نگهداشتن تصاویر تولید شده خود دریافت نمایید. یک ردیف اشتراک سفارشی همچنین به مدل های سفارشی، ادغام، پشتیبانی اختصاصی و سرور های خصوصی اجازه می دهد.
سایت Stable Diffusion 1.5
Stable Diffusion شاید یکی از محبوب ترین مدل های منبع باز تولید متن به تصویر باشد. همچنین مدل های دیگر از جمله سه مولد تصویر که در زیر ذکر شده را تامین می کند. در سال 2022 منتشر شد و از آن زمان تاکنون اجراهای زیادی داشته است.
ما از جزئیات فنی بیش از حد در مورد نحوه کار مدل صرف نظر می کنیم (که برای آن می توان مخزن رسمی Github آنها را بررسی نمود)، اما نصب این مدل حتی برای مبتدیان کاملاً آسان است و تا زمانی که یک GPU اختصاصی با آن دارید به خوبی کار می کند. حداقل 4 گیگابایت حافظه همچنین می توانید به Stable Diffusion بهصورت آنلاین دسترسی داشته باشید، و اگر می خواهید Stable Diffusion را در مک اجرا کنید، به شما اطلاع داده ایم.
چندین نقطه بازرسی (آنها را نسخه در نظر بگیرید) برای استفاده برای انتشار پایدار وجود دارد. در حالی که ما نسخه 1.5 را آزمایش کردیم، نسخه 2.1 نیز در حال توسعه فعال و دقیق تر است.
اجرای مدل نیز نسبتاً آسان است. ما آن را با رابط کاربری وب AUTOMATIC1111 Stable Diffusion آزمایش کردیم و همه کنترل ها و پارامتر ها به خوبی کار می کنند. همچنین به لطف پایگاه داده LAION-5B که مدل بر روی آن آموزش دیده است، کاملاً ضد NSFW می باشد (البته، توجه داشته باشید که کامل نیست). در حالی که زمان تولید بر اساس سخت افزار شما متفاوت هست، می توانید انتظار داشته باشید که تصاویر تان حتی با اعلان های اولیه دقیق و واقعی باشند.
سایت DreamShaper
DreamShaper یک مدل تولید تصویر بر اساس Stable Diffusion است. این به عنوان یک جایگزین متن باز برای MidJourney در نظر گرفته شده بود و بر روی فوتورئالیسم در تصاویر تولید شده تمرکز دارد، اگرچه می تواند با چند ترفند به خوبی سبک های انیمیشن و نقاشی را مدیریت کند.
این مدل نسبت به Stable Diffusion توانایی بیشتری دارد و به کاربران اجازه می دهد آزادی بیشتری در خروجی نهایی داشته باشند، از بهبود رعد و برق گرفته تا محدودیت های ضعیف تر NSFW. اجرای مدل نیز آسان می باشد، با یک نسخه قابل دانلود و از پیش آموزش دیده که به صورت آنلاین برای دسترسی محلی در دسترس است و تعداد زیادی وب سایت از جمله Sinkin.ai، RandomSeed و Mage.space (نیاز به اشتراک اولیه دارد) که به شما امکان می دهد مدل را با شتاب GPU اجرا کنید.
همانطور که احتمالاً می توانید حدس بزنید، تصاویر تولید شده توسط DreamShaper در مقایسه با Stable Diffusion واقعی تر به نظر می رسند. حتی اگر یک فرمان را در هر دو مدل اجرا کنید، مدل DreamShaper به احتمال زیاد واقعی تر، دقیق تر و روشن تر خواهد بود.
این به ویژه برای پرتره ها یا شخصیت ها صادق است، چیزی که ما متوجه شدیم Stable Diffusion در مقایسه با همان فرمان فاقد آن است. اگر تصاویر شما بیش از حد واقعی هستند، در اینجا چهار راه برای شناسایی تصویر تولید شده توسط هوش مصنوعی وجود دارد.
برای اجرای مدل نیز به کامپیوتر شخصی غول پیکر نیاز ندارید. GTX 1650Ti ما با 4 گیگابایت VRAM این مدل را به خوبی اجرا کرد. زمان تولید کمی طولانی تر بود، اما به نظر نمی رسید بر خروجی واقعی تأثیر بگذارد. گفتنی است، ممکن است برای اجرای DreamShaper XL که بر اساس مدل Stable Diffusion XL هست، به پردازنده های گرافیکی با VRAM بیشتری نیاز داشته باشید.
سایت InvokeAI
Invoke AI یکی دیگر از مدل های تولید تصویر مبتنی بر هوش مصنوعی است که بر اساس Stable Diffusion، با نسخه XL مبتنی بر Stable Diffusion XL می باشد. همچنین رابط کاربری وب و خط فرمان خود را دارد، به این معنی که شما مجبور نخواهید بود با چیز هایی مانند رابط کاربری وب Stable Diffusion از حلقه ها استفاده کنید.
این مدل بر روی اجازه دادن به کاربران برای ایجاد تصاویر بر اساس مالکیت معنوی خود با گردش کار سفارشی تمرکز دارد. InvokeAI یکی از بهترین مدل های تولید تصویر AI منبع باز برای آموزش مدل های سفارشی و کار با مالکیت معنوی است.
مخزن رسمی Github آن دو روش نصب را فهرست می کند: نصب از طریق نصب کننده InvokeAI یا استفاده از PyPI اگر با ترمینال و پایتون راحت هستید و به کنترل بیشتری بر روی بسته های نصب شده با مدل نیاز دارید.
با این حال، کنترل اضافی چند محدودیت ، به ویژه الزامات سخت افزاری سخت تر را به همراه دارد. InvokeAI یک GPU اختصاصی با حداقل 4 گیگابایت حافظه را توصیه می کند که برای اجرای نسخه XL شش تا هشت گیگابایت توصیه می شود. الزامات VRAM برای هر دو پردازنده گرافیکی AMD و Nvidia اعمال می گردد. همچنین برای مدل، وابستگی های آن و پایتون به حداقل 12 گیگابایت رم و 12 گیگابایت فضای دیسک رایگان نیاز دارید.
در حالی که اسناد، پردازنده های گرافیکی GTX سری 10 و سری 16 انویدیا را به دلیل کمبود حافظه ویدیویی توصیه نمی کنند، نصب کننده ارائه شده به خوبی اجرا شد. در حالی که مسافت پیموده شده شما ممکن است متفاوت باشد، اگر از یک پردازنده گرافیکی پایین تر استفاده می کنید، انتظار داشته باشید مدت بیشتری منتظر بمانید تا پیام هایتان را به تصویر تبدیل نمایید. در نهایت، اگر از ویندوز استفاده می کنید، فقط می توانید از GPU Nvidia استفاده کنید، زیرا در حال حاضر هیچ پشتیبانی از پردازنده های گرافیکی AMD وجود ندارد.
برای بخش تولید تصویر، مدل بیشتر به سمت سبک های هنری متمایل است تا فوتورئالیسم. البته، می توانید مدل را روی مجموعه داده های خود آموزش دهید و از آن بخواهید تصاویری نزدیک تر به آنچه می خواهید تولید کند، حتی اگر شامل تصاویر واقع گرایانه باشد، بهخصوص اگر در طراحی محصول، معماری یا فضا های خرده فروشی کار می کنید. با این حال، یک نکته مهم که باید در نظر داشته باشید این است که InvokeAI در درجه اول یک موتور تولید تصویر هست، به این معنی که احتمالاً باید از مدل های خود برای بهترین نتایج (که به راحتی از طریق مدیر مدل ارائه شده در رابط وب پیدا می شود) به عنوان پیش فرض استفاده نمایید. مدل کاملاً شبیه به خود Stable Diffusion می باشد.
سایت Openjourney
Openjourney یک مدل رایگان و منبع باز تولید تصویر هوش مصنوعی هست که دوباره بر اساس انتشار پایدار می باشد. اگر تعجب می کنید که چرا این مدل Openjourney نام دارد، به این دلیل که بر روی تصاویر Midjourney آموزش داده شده است و می تواند سبک خود را در تصاویری که تولید می کند تقلید کند.
PromptHero، شرکت پشتیبان Openjourney، به شما امکان می دهد مدل را در کنار مدل های دیگر، از جمله Stable Diffusion (نسخه های 1.5 و 2)، DreamShaper و Realistic Vision آزمایش نمایید. هنگام ثبت نام، 25 اعتبار رایگان (یک اعتبار برای هر تصویر ایجاد شده) دریافت می کنید، پس از آن باید در ردیف اشتراک Pro آنها مشترک شوید که هزینه آن 9 دلار در ماه است و به شما امکان دسترسی به 300 اعتبار هر ماه با سایر ویژگی های انحصاری را می دهد.
با این حال، اگر می خواهید آن را به صورت محلی و رایگان اجرا نمایید، می توانید فایل مدل را از HuggingFace دانلود کرده و با استفاده از رابط کاربری وب Stable Diffusion اجرا کنید.Openjourney همچنین دومین مدل تولید تصویر هوش مصنوعی در HuggingFace است که پس از Stable Diffusion قرار دارد.
Openjourney هیچ نیاز سخت افزاری خاصی را برای اجرای مدل به صورت محلی در وب سایت خود فهرست نمی کند، اما می توانید نیازهای سخت افزاری مشابه Stable Diffusion را انتظار داشته باشید. این به معنای یک GPU اختصاصی با 4 گیگابایت VRAM، 16 گیگابایت رم و حدود 12 تا 15 گیگابایت فضای خالی در کامپیوتر شما است تا مدل و وابستگی های آن را ذخیره کنید.
تصاویر تولید شده توسط Openjourney تمایل دارند بین فوتورئالیسم و هنر تعادل برقرار کنند، مگر اینکه طور دیگری مشخص شده باشد. اگر به دنبال یک مدل همه جانبه هستید و ظاهر و احساس Midjourney را بدون پرداخت هزینه اشتراک ترجیح می دهید، Openjourney یکی از بهترین گزینه ها است.
نظرات کاربران