میدجِرنی پس از یک سال، مدل نو فراوری تصویر خود را معرفی کرد

به گزارش آقای معلم، هوش مصنوعی میدجِرنی (Midjourney) از همان روزهای آغازین، با تمرکز بر فراوری تصاویر هنری و خلاقانه، جایگاه منحصربه فردی در میان ابزارهای تصویرساز پیدا کرد. برخلاف رقبا مثل DALL·E از شرکت OpenAI یا Stable Diffusion، میدجِرنی به جای تمرکز صرف بر واقع گراییِ عکاسانه، به بازآفرینی سبک های هنری و تخیل محور توجه داشت.

میدجِرنی پس از یک سال، مدل نو فراوری تصویر خود را معرفی کرد

نسخه های اولیه مثل V1 و V2 در سال 2022 منتشر شدند و هرچند کیفیت آن ها هنوز در مراحل آزمایشی بود، اما کاربران را به وجد آوردند. نسخهٔ V3 با افزایش وضوح و ثبات در خطوط، جهشی بزرگ در کیفیت بصری ایجاد کرد و بسیاری از تصویرگران دیجیتال و طراحان گرافیک را جذب خود کرد. در نسخهٔ V4، یکی از مهم ترین پیشرفت ها، توانایی بهتر در تفسیر و تحلیل دستورهای متنی پیچیده بود، که به فراوری تصاویر دقیق تر و معنادارتر انجامید.

اما نقطهٔ اوج تا آن موقع، بدون تردید نسخهٔ V5 بود که در اوایل 2023 عرضه شد؛ این نسخه با قابلیت نورپردازی پیشرفته تر، ترکیب رنگی هوشمندتر و درک بالاتر از اشکال انسانی، تحولی چشمگیر در تصویرسازی ایجاد کرد. نسخهٔ V5.2 و سپس V6.1 نیز بهبودهای جزئی تری ارائه دادند و تمرکز بر هماهنگی چهره ها، دست ها و فضاهای پرجزئیات داشتند. اما از اواخر سال 2023 به بعد، روند توسعه کمی نماید شد و کاربران منتظر جهش تازه ای بودند؛ جهشی که حالا با نسخهٔ کاملاً بازطراحی شده V7 محقق شده است.

میدجِرنی نه فقط یک ابزار فنی، بلکه یک جنبش فرهنگی دیجیتال به شمار می رود؛ جایی که هنرمندان آماتور و حرفه ای می توانند تنها با چند خط متن، تصاویری خلق نمایند که در گذشته ساعت ها یا روزها وقت احتیاج داشت. از همان شروع، این ابزار با حضور پررنگ در دیسکورد (Discord) و جامعه ای پویا از کاربران خلاق، پیروز شد بازخوردها را به سرعت در فرآیند بهبود مدل هایش به کار بگیرد.

بعلاوه برخلاف بسیاری از پلتفرم های دیگر، میدجِرنی همواره روی تعامل زنده با کاربر تمرکز داشته؛ از به روزرسانی منظم مدل ها تا ارائهٔ حالت های مختلف ریلَکس، توربو و پیش نویس. محدودیت هایی مثل ناتوانی در کشیدن دست های درست یا بازفراوری دقیق بافت پوست، همواره چالش برانگیز بود؛ اما هر نسخه کوشش می کرد این موانع را کمتر کند. کاربران حرفه ای به ویژه برای بازسازی حالت های چهره و نورپردازی خاص از مدل های اخیر مثل V6.1 بهره بردند، هرچند همچنان احتیاج به اصلاحات دستی داشتند.

حالا، پس از ماه ها تحقیق، بازخورد و توسعه پشت صحنه، میدجِرنی با نسخهٔ هفتم (V7) بازگشته؛ نسخه ای که نه تنها بهبودهای ظاهری دارد، بلکه در معماری مدل نیز تغییرات اساسی داده شده است. این مدل نو، فقط نسخه ای پیشرفته تر نیست، بلکه بازتعریفی از روش فراوری تصویر به یاری هوش مصنوعی است؛ یک شروع تازه برای مسیر میدجِرنی.

بازآفرینی جزئیات؛ از چین وچروک پوست تا درخشندگی سرامیک

مدل V7، در بطن خود، بر اساس پژوهش هایی گسترده و بازطراحی معماری مدل های قبلی ساخته شده و به همین علت می توان گفت با یک ابزار کاملاً نو روبه رو هستیم. تمرکز اصلی این نسخه بر افزایش انسجام و هماهنگی بین اجزای تصویر است؛ از فرم دقیق انگشتان گرفته تا بازسازی چهره هایی که قبلاً دچار اعوجاج بودند. یکی از نقاط ضعف همیشگی مدل های پیشین، ناتوانی در بازسازی اجزای غیرمتقارن یا ظریف مثل دست ها بود، اما حالا V7 با بهره گیری از روش های تازهٔ یادگیری عمیق (Deep Learning)، توانسته از این سد عبور کند. جنس مواد نیز به شکلی خیره نماینده بازفراوری می گردد: مثلاً می توانید بافت ناهموار پوست یا جلای ملایم سطح یک کوزهٔ چینی را بدون اغراق یا مصنوعی بودن مشاهده کنید. این پیشرفت نه فقط حاصل تنظیمات عددی یا الگوریتمی است، بلکه نتیجهٔ بازاندیشی کامل در منطق تصویرسازی الگوریتم است. در این نسخه، نور و سایه نیز به گونه ای مدیریت می شوند که تصویر، حس عمق و حجم واقعی تری پیدا می نماید. بسیاری از کاربران حرفه ای که از میدجِرنی برای پروژه های هنری یا تبلیغاتی استفاده می نمایند، حالا می توانند تصاویر با کیفیت چاپی فراوری نمایند. به عبارتی، مرز میان تصویر هوش مصنوعی و تصویر انسانی، حالا باریک تر از همواره شده است.

حالت پیش نویس؛ جادوی سرعت برای خلاقیت های فوری

در کنار کیفیت بصری خیره نماینده، یکی از مهم ترین نوآوری های V7 معرفی حالت پیش نویس یا Draft Mode است. این حالت به شما اجازه می دهد بدون دغدغهٔ مصرف اعتبار بالا یا انتظار طولانی، تنها با نیمی از هزینه و ده برابر سرعت بیشتر، ایده های اولیه تان را به تصویر بکشید. گرچه کیفیت این تصاویر پایین تر از خروجی نهایی است، اما برای آزمون و خطا و انتخاب سبک مناسب بسیار کارآمد است. در پروژه های هنری که احتیاج به چندین دور بازطراحی و خلاقیت دارند، این قابلیت می تواند زمان فراوری را به طرز چشم گیری کاهش دهد. اگرچه این ویژگی پیش از این هم در ابزارهای دیگر به شکل محدود وجود داشت، اما میدجِرنی آن را با کیفیت قابل قبولی عرضه نموده است. از آنجا که بسیاری از کاربران میدجِرنی در حوزه های تجاری، طراحی محصول، یا داستان پردازی فعالیت می نمایند، وجود یک ابزار سریع برای پیش نمایش ایده ها بسیار حیاتی است. پژوهش های اجرا شده نشان می دهد کاربران در حالت پیش نویس، راحت تر بین سبک های مختلف تصویری جابجا می شوند و دقت بصری بالاتری در انتخاب نهایی دارند. به همین علت می توان گفت Draft Mode نه فقط یک امکان جانبی، بلکه ابزاری استراتژیک برای توسعهٔ ایده های خلاقانه است.

دو حالت توربو و ریلکس؛ کنترل بیشتر در خدمت کاربر

میدجِرنی در نسخهٔ نو، همانند گذشته، دو حالت عملکرد اصلی ارائه داده است: حالت توربو (Turbo) و حالت ریلکس (Relax). در حالت توربو، شما می توانید تصویر نهایی را با سرعت بسیار بالا دریافت کنید، اما با دو برابر هزینهٔ اعتباری. در مقابل، حالت ریلکس همان آرامش همیشگی را دارد و با نصف هزینه، به کاربر اجازه می دهد بدون دغدغهٔ مصرف اعتبار زیاد، تصویر را در زمان طولانی تری دریافت کند. جالب اینکه برخلاف نسخه های قبلی، در V7 هنوز حالت استاندارد تعریف نشده و این موضوع به گفتهٔ توسعه دهندگان، به علت احتیاج به زمان بیشتر برای تنظیمات پایدار و دقیق است. به نظر می رسد تیم توسعه در حال ارزیابی عملکرد گسترده تر مدل نو در میان کاربران مختلف است تا نسخهٔ نهایی را دقیق تر منتشر کند. چنین ساختاری، به کاربران حرفه ای این امکان را می دهد که باتوجه به احتیاج پروژه، بین سرعت و کیفیت انتخاب نمایند. بعلاوه این دو حالت برای کاربرانی که از میدجِرنی به عنوان ابزار فراوری انبوه استفاده می نمایند، نوعی انعطاف عملیاتی فراهم نموده است. با این انتخاب های متنوع، حالا میدجِرنی بیش از همواره یک ابزار چندمنظوره برای خلاقیت دیجیتال به شمار می رود.

شروع یک فصل تازه برای تصویرسازان دیجیتال

با معرفی V7، میدجِرنی به وضوح نشان داده که همچنان در خط مقدم نوآوری هوش مصنوعی تصویری قرار گرفته است. این مدل تازه، نه تنها مسائل فنی نسخه های پیشین را رفع نموده، بلکه با طراحی مجدد ساختار مدل، راه را برای آینده ای متفاوت باز نموده است. ابزارهایی مانند Draft Mode یا بهبودهای عمیق در بازنمایی بافت و نور، صرفاً ویژگی های نو نیستند؛ آن ها نشانه هایی از بلوغ فکری و پژوهشی در تیم توسعه هستند. از نگاه یک تصویرگر یا طراح گرافیک، این نسخه می تواند زمان فراوری، هزینه و حتی احتیاج به اصلاحات دستی را به حداقل برساند. در دنیای رقابتی امروز که خلاقیت باید با سرعت و دقت همراه باشد، میدجِرنی V7 همان سکوی پرتابی است که می تواند ایده های ذهنی را به تصویری زنده و قابل ارائه تبدیل کند. با رشد سریع فناوری، ابزارهای تصویری هوش مصنوعی نیز باید هر روز بازاندیشی و نوسازی شوند؛ و میدجِرنی نشان داده که به این اصل، بیش از هر چیز پایبند است. حالا چشم ها به آینده دوخته شده؛ به روزی که نسخه های آینده حتی از نسخهٔ هفتم هم فراتر بروند و هنر دیجیتال را به مرزهای ناشناخته برسانند.

منبع

منبع: یک پزشک
انتشار: 16 فروردین 1404 بروزرسانی: 16 فروردین 1404 گردآورنده: fansgholami.ir شناسه مطلب: 1353

به "میدجِرنی پس از یک سال، مدل نو فراوری تصویر خود را معرفی کرد" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "میدجِرنی پس از یک سال، مدل نو فراوری تصویر خود را معرفی کرد"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید