گوگل رسما Lumiere نسل جدیدی از تولید کننده ویدیو متنی مبتنی بر هوش مصنوعی را معرفی کرد
فرزانه طاهری
دنیای پردازش آنلاین: به گزارش techradar، گروهی از محققان هوش مصنوعی در گوگل ریسرچ، نسل جدیدی از تولیدکننده ویدیوی به نام Lumiere را که مبتنی بر هوش مصنوعی است توسعه دادهاند. این گروه مقاله ای منتشر کرده که تلاش های خود را بر روی پایگاه داده پیش چاپ arXiv شرح می دهد.
طی چند سال گذشته، برنامه های کاربردی هوش مصنوعی از آزمایشگاه به جامعه کاربران منتقل شده اند. برای مثال، مدلهای زبان در مقیاس بزرگ (LLM) مانند ChatGPT در مرورگرها ادغام شدهاند و به کاربران این امکان را میدهند که متون خود را به روشهای بیسابقهای تولید کنند.
اخیراً، مولدهای تبدیل متن به تصویر به کاربران اجازه ایجاد تصاویر سورئال را داده اند، و مولدهای تبدیل متن به ویدیو به کاربران اجازه می دهند که تنها با استفاده از چند کلمه، کلیپ های ویدیویی کوتاه تولید کنند. اکنون تیم گوگل با معرفی یک تولیدکننده ویدئو به متن به نام Lumire، این زمینه را به اوج جدیدی رسانده است.
Lumiere که احتمالاً از برادران Lumiere که پیشگام تجهیزات عکاسی اولیه بودند نامگذاری شده است، به کاربران این امکان را می دهد تا جمله ساده ای مانند «دو راکون در حال خواندن یک کتاب با هم» را تایپ کنند و یک ویدیوی کامل دریافت کنند.
وضوح بالای خیرهکننده این ژنراتور جدید هوش مصنوعی نشاندهنده گام بعدی در توسعه تولیدکنندههای ویدئو به متن با تولید نتایج بسیار بهتر است. گوگل فناوری پشت این ژنراتور جدید را به عنوان معماری فضا-زمان پیشگامانه U-Net توصیف می کند که برای تولید ویدیوی متحرک در یک مدل واحد طراحی شده است.
ویدیوی نمایشی نشان میدهد که گوگل ویژگیهای جدیدی را به این فناوری اضافه کرده است، مانند اینکه به کاربران اجازه میدهد ویدیوی موجود را با برجسته کردن بخشی از آن ویرایش کنند و دستورالعملهایی مانند «تغییر رنگ لباس به قرمز» را تایپ کنند.
ژنراتور همچنین انواع مختلفی از نتایج را تولید می کند، مانند سبک سازی، که در آن سبک سوژه به جای نمایش کامل رنگی ایجاد می شود و همچنین امکان ارجاع به سبک های مختلف را فراهم می کند. همچنین کارهای سینمایی را انجام می دهد که در آن کاربر می تواند بخشی یا تمام یک تصویر ثابت را برجسته کرده و آن را متحرک کند.
گوگل در اطلاعیه خود مشخص نکرد که آیا قصد دارد Lumire را در دسترس عموم قرار دهد یا خیر. احتمالاً به دلیل عواقب قانونی آشکاری که ممکن است از ایجاد ویدیوهایی که قوانین کپی رایت را نقض می کنند به وجود بیاید نباید به این زودی ها منتظر در دسترس قرار گرفتن این هوش مصنوعی هیجان انگیز باشیم.