معرفی هوش مصنوعی سورا (Sora) ویدیویی چت جیپیتی
۲۹ بهمن ۱۴۰۲
هوش مصنوعی سورا: شرکت اوپن ایآی (OpenAI) که نقش اساسی در پیشرفت هوش مصنوعی و سازنده چت جیپیتی ایفا کرده است، به تازگی از هوش مصنوعی تبدیل متن به ویدیوی خود به نام هوش مصنوعی سورا رونمایی کرده است. به گفته کارشناسان هوش مصنوعی Sora قویترین ابزار مولد تبدیل متن به ویدیو است که بیشتر برای تولید بازیهای ویدیویی مورد استفاده قرار میگیرد. خروجیهای این هوش مصنوعی انقدر طبیعی و پیشرفته است که OpenAI فعلا تصمیم گرفته که اجازه دسترسی عمومی به آن را صادر نکند. اگر دوست دارین بیشتر با این هوش مصنوعی آشنا شوید، این مقاله که برای شما آماده کردهایم را تا انتها مطالعه کنید. همچنین، شما میتوانید برای خرید اکانت هوش مصنوعی از حدمات ارزی کافه ارز استفاده کنید.
فهرست مطالب
معرفی هوش مصنوعی سورا؛ انقلابی در زمینه تبدیل متن به ویدیو
هوش مصنوعی سورا احتمالاً یکی از قویترین هوش مصنوعیهای مولد (Generative) ارائهشده تا به امروز به شمار میرود که توسط کمپانی OpenAI وارد بازار شده است. این مدل جدید از محصولات اوپن ایآی قابلیت تولید ویدیوهای یک دقیقهای از متن را در اختیار کاربران میگذارد. طبقی مقالهای که در وبلاگ OpenAI منتشرشده است، هوش مصنوعی سورا توانایی ساخت صحنههایی پیچیده در کنار شخصیتهای متعدد را دارد. علاوه بر این، سورا قادر است تا حرکات خاص و جزییات سوژه و پسزمینه را به بهترین شکل ممکن نشان دهد. سازندگان این هوش مصنوعی ادعا میکنند که سورا قادر است تا شخصیتهای جذاب با احساست بسیار غنی را نیز تولید نماید.
هوش مصنوعی Sora همچنین میتواند از یک تصویر استاتیک، ویدیوهای جذابی تولید کند. یا این که فریمهای از دسترفته در یک ویدیو را تکمیل کرده و آن را به شکلی جذاب گسترش دهد. دسترسی به سورا فعلاً برای همگان آزاد نیست اما ویدیوهایی که به شکل دمو از طریق آن تولید شده است بسیار طبیعی است. برای مثال، یکی از معروفترین ویدیوهایی که با این هوش مصنوعی تولید شده است، صحنه طوفان در کالیفرنیا را نشان میدهد که از کیفیت بسیار بالا و قابل قبولی دارد. اوپن ایآی همچنین تاکید میکند که سورا در حال حاضر در خلق صحنههای پیچیده مشکل دارد اما ویدیوهای دمویی که از این ابزار منتشر شده است نشان از قدرت بسیار بالای سورا دارد.
در سالهای قبل ابزارهای هوش مصنوعی نظیر میدجرنی (Midjourney) در زمینه تبدیل متن به تصویر بسیار پرقدرت ظاهر شدند. اما اخیراً خلق ویدیو از طریق دستورات متنی (Prompt) با سرعت قابلتوجهی توسط شرکتهای پیشرو نظیر Pika و Runway آغاز شد. ابزارهایی که توسط این شرکتها وارد بازار شدند، قابلیتهای بسیار جدیدی در اختیار کاربران قرار دادند اما نقطه عطف این تکنولوژی هوش مصنوعی سورا است. یکی دیگر از ابزارهای جدید به نام هوش مصنوعی Lumiere که توسط گوگل توسعه داده شده است نیز به عنوان یکی از رقبای سرسخت هوش مصنوعی سورا است.
چه کسانی میتوانند از هوش مصنوعی سورا استفاده کنند؟
در حال حاضر، اوپن ایای دسترسی به سورا را فقط در اختیار تیمهای قرمز قرار داده است. این تیم امنیتی وظیفه دارد این ابزار را از نظر آسیبها و خطرات احتمالی که ممکن است برای کاربران ایجاد کنند، مورد بررسی دقیق قرار میدهند. علاوه بر این، شرکت OpenAI یا هوش مصنوعی chatgpt مجوز استفاده از Sora را به برخی از طراحان و فیلمسازان نیز داده است. در حال حاضر، اوپن ایآی اذعان میکند که هوش مصنوعی سورا ممکن است در خلق صحنههای پیچیده دچار مشکل شود چون رابطه علت و معلولی برخی از دستورات را درک نمیکند.
جیم فان که از محققان شرکت Nvidia است در جدیدترین بررسی خود اذعان کرده که که سورا فقط یک هوش مصنوعی مولد نیست بلکه یک موتور فیزیکی دادهمحور است. در حقیقت، قابلیتهای این ابزار فقط به تولید ویدیو از متن یا عکس محدود نمیشود بلکه قابلیت تعیین فیزیک هر جسم و شی در یک محیط را دارد و بر اساس دستورات کاربر، یک ویدئو (یا حتی یک جهان سهبعدی تعاملی) را خلق میکند.
محققان OpenAI نیز اظهار داشتهاند که سورا ثابت کرده که مقیاسپذیری مستمر مدلهای ویدیویی، این تکنولوژی را به سمت توسعه مورتوهای شبیهسازی پیشرفته سوق میدهد. در واقع، با این سرعت پیشرفت میتوان دنیاهای فیزیکی و دیجیتالی را طوری شبیهسازی کرد که اشیا و حیوانات و حتی کاربران قادر به زندگی در آنها باشند.
ویژگیهای هوش مصنوعی Sora
- تولید ویدیوهایی با کیفیت 1080 با جزییات کامل
- امکان ساخت ویدیوهای لوپ و جلوبردن و عقبکشیدن زمان ویدیو
- تغییر بکگراند ویدیوهای آپلودی توسط کاربر
- قابلیت ایجاد جهانهای دیجیتالی (برای مثال میتوان صحنهای از بازی ماینکرفت را خلق کرد و همزمان کنترل شخصیت بازیکن را به دست گرفت)
- قابلیت ساخت ویدیواز روی یک تصویر استاتیک
محدودیتهای هوش مصنوعی سورا
در حال حاضر، هوش مصنوعی سورا در زمینه ساخت بازیها و جلوههای ویژه ویدیویی ضعیف عمل میکند. برای مثال، این ابزار قادر به تخمین دقیق از تعاملات فیزیکی ساده مانند خردشدن چوب یا شیشه نیست. این ابزار حتی ممکن است در پردازش برخی از رندرهای پیچیده علت و معلولی دچار مشکل شود. برای مثال، ممکن است پرامپت فردی که در حال خوردن برگر است را به راحتی به ویدیو تبدیل کند اما نمیتواند محل گاززدن روی برگر را رندر بگیرد.
به طور کلی، اما هوش مصنوعی سورا میتواند راه شبیهسازی ویدیوهای واقعگرایانه را هموار کند و پرامپتهای متنی را به بهترین شکل به کاربران تحویل دهد. این موضوع همان قسمت تاریک و خطرناک هوش مصنوعی است چون همانند فناوری دیپ فیک (Deep Fake) میتواند انسانها را گمراه کند. به نظر میرسد که OpenAI به همین دلیل دسترسی به آن را محدود نگه داشته است. همنجین، شما میتوانید در مقاله مقایسه chatgpt 3 با chatgpt4 اطلاعات بیشتری درباره دیگر محصولات این شرکت کسب کنید.
نتیجهگیری
ابزارهای هوش مصنوعی با سرعت سرسامآوری در حال پیشرفت هستند و روزی نمیشود که خبر از یک ابزار هوش مصنوعی جدید در اینترنت نشنویم. یکی از جدیدترین محصولات توسعهیافته در این زمینه که اتفاقاً متعلق به شرکت OpenAI است، سورا (Sora) نام دارد که در زمینه تبدیل متن به ویدیو بسیار قدرتمند ظاهر شده است. دسترسی به هوش مصنوعی فعلاً محدود به تیم اجرایی این شرکت است و به نظر میرسد که در روزهای اخیر به صورت عمومی معرفی شود. هنوز مشخص نیست که استفاده از این هوش مصنوعی رایگان است یا خیر اما به احتمال خیلی زیاد برای استفاده کامل از امکانات آن باید اشتراک اکانت OpenAI را خریداری کنید. شما برای خرید اکانت این شرکت میتواند از سرویس خرید اکانت هوش مصنوعی کافه ارز استفاده کنید.