വാക്കുകൾ കൊണ്ട് വിസ്മയം സൃഷ്ടിക്കുന്ന എ ഐ മാജിക്കിന്റെ വിപ്ലവത്തിന് മുന്നിൽ നിന്ന് നയിച്ച കമ്പനിയാണ് ഓപ്പൺ എ ഐ. 2022 നവംബറിൽ പുറത്തിറങ്ങിയ ചാറ്റ് ജി പി ടി യുടെ വരവോടുകൂടി എ ഐ ലോകത്തിന്റെ സംസാര വിഷയമായി മാറി. ഒരു വർഷത്തിനുള്ളിൽത്തന്നെ വ്യത്യസ്ത വിഭാഗങ്ങളിലായി ആയിരക്കണക്കിന് എ ഐ ടൂളുകൾ പുറത്തിറങ്ങി. ഇപ്പോഴിതാ മറ്റൊരു തുറുപ്പ് ചീട്ടുമായി ഓപ്പൺ എ ഐ രംഗത്ത്! സോറ എ ഐ.
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024
വെറും ടെക്സ്റ്റ് കമാൻഡുകളിൽ നിന്ന് യാഥാർഥ്യ തുല്യമായ വിഡിയോകൾ സൃഷ്ടിക്കുന്ന എ ഐ മാജിക്. റൺവേ എം എൽ, കൈബർ എ ഐ, പിക ലാബ്സ് തുടങ്ങി അനേകം എ ഐ കൾ ഇതിനകം തന്നെ എ ഐ വീഡിയോ ക്രിയേഷനിൽ അത്ഭുതകരമായ കഴിവ് തെളിയിച്ചു കഴിഞ്ഞതാണ്. പക്ഷെ ഇതിനെയെല്ലാം കടത്തിവെട്ടിക്കൊണ്ടാണ് സോറ യുടെ വരവ്. ടെക്സ്റ്റ് പ്രോംപ്റ്റിന് അനുസൃതമായി മികച്ച വിഷ്വൽ ക്വാളിറ്റിയോട് കൂടി ഒരു മിനുട്ടോളം ദൈർഘ്യമുള്ള, യാഥാർഥ്യ തുല്യമായ വിഡിയോകൾ ഉണ്ടാക്കാൻ സാധിക്കും എന്നതാണ് സൊറയെ വ്യത്യസ്തമാക്കുന്നത്. ഇതിന് ഉദാഹരണമായി കമ്പനി പുറത്തിറക്കിയ വിഡിയോകൾ ഇതിനകം തന്നെ ചർച്ചയായിക്കഴിഞ്ഞു. അത്ഭുതകരമായ കൃത്യതയും മികവും തന്നെയാണ് പ്രധാന ആകർഷണം. തീർന്നില്ല,
ഒന്നിലധികം കഥാപാത്രങ്ങൾ, നിർദ്ദിഷ്ട തരം ചലനങ്ങൾ, വിഷയത്തിന്റെയും പശ്ചാത്തലത്തിന്റെയും കൃത്യമായ വിശദാംശങ്ങൾ എന്നിവ ഉപയോഗിച്ച് സങ്കീർണ്ണമായ രംഗങ്ങൾ സൃഷ്ടിക്കാൻ സോറയ്ക്ക് കഴിയും. പ്രോംപ്റ്റിൽ ഉപയോക്താവ് എന്താണ് ആവശ്യപ്പെട്ടതെന്ന് മാത്രമല്ല, യഥാർത്ഥ ലോകത്ത് അവ എങ്ങനെ നിലനിൽക്കുന്നുവെന്നും മനസ്സിലാക്കി അതിനനുസരിച്ചുള്ള വീഡിയോകളാണ് സോറ ക്രിയേറ്റ് ചെയ്യുന്നത്. ചാറ്റ് ജി പി ടി യുടെ പവറോട് കൂടി വർക്ക് ചെയ്യുന്ന ഈ മോഡലിന് ഭാഷയെക്കുറിച്ച് ആഴത്തിലുള്ള ധാരണയുണ്ട്. അത്കൊണ്ട് തന്നെ പ്രോംപ്റ്റുകൾ കൃത്യമായി വ്യാഖ്യാനിക്കാനും, വ്യത്യസ്തമായ ഭാവങ്ങളോട് കൂടി കഥാപാത്രങ്ങളെ സൃഷ്ടിക്കാനും അതിന് കഴിയും. കഥാപാത്രങ്ങളും ശൈലിയും കൃത്യമായി നിലനിർത്തിക്കൊണ്ടുതന്നെ ഒരൊറ്റ വീഡിയോയിൽ ഒന്നിലധികം ഷോട്ടുകൾ സൃഷ്ടിക്കാനും സോറയ്ക്ക് സാധിക്കും.
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
നിലവിലെ മോഡലിന് പോരായ്മകളുണ്ട്. സങ്കീർണ്ണമായ ഒരു രംഗത്തെ കൃത്യമായി അനുകരിക്കുന്നതിൽ ഇതിനു പ്രയാസമുണ്ട്, കൂടാതെ ചില പ്രത്യേക സന്ദർഭങ്ങൾ കൃത്യമായി മനസ്സിലാക്കാൻ സാധിക്കില്ല. ഉദാഹരണത്തിന്, ഒരു വ്യക്തി ഒരു ബിസ്ക്കറ്റ് കടിച്ചു, എന്നാൽ പിന്നീട് വരുന്ന ഷോട്ടിൽ ബിസ്ക്കറ്റിൽ ആ ഒരു കടി അടയാളം ഉണ്ടാകണമെന്നില്ല. കൂടാതെ സങ്കീർണ്ണമായ പ്രോപ്റ്റുകളും അതിന്റെ വിവരണങ്ങളും സോറയെ ആശയക്കുഴപ്പത്തിലാകും.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
സോറ ഇപ്പോൾ എല്ലാവർക്കും ഉപയോഗിക്കാൻ സാധിക്കില്ല. റെഡ് ടീമർ എന്ന് അറിയപ്പെടുന്ന മോഡൽ ടെസ്റ്റ് ടീമിനാണ് ഇപ്പോൾ സോറ ഉപയോഗിക്കാൻ സാധിക്കുക. ക്രിയേറ്റീവ് പ്രൊഫഷണലുകൾക്ക് ഏറ്റവും സഹായകരമായ രീതിയിൽ മോഡൽ എങ്ങനെ മുന്നോട്ട് കൊണ്ടുപോകാം എന്നതിനെക്കുറിച്ചുള്ള ഫീഡ്ബാക്ക് നേടുന്നതിന് നിരവധി വിഷ്വൽ ആർട്ടിസ്റ്റുകൾ, ഡിസൈനർമാർ, ഫിലിം മേക്കർമാർ തുടങ്ങിയ ആളുകൾ അടങ്ങിയതാണ് റെഡ് ടീമർ. ഇവർ ഈ ടൂളുകൾ ഉപയോഗിച്ച് നോക്കുകയും, അതിന്റെ ഗുണ ദോഷങ്ങൾ മനസ്സിലാക്കുകയുംചെയ്യും. റെഡ് ടീമർമാരുമായി സഹകരിച്ച്, തെറ്റായ വിവരങ്ങൾ, വിദ്വേഷകരമായ ഉള്ളടക്കം, പക്ഷപാതം തുടങ്ങിയ മേഖലകളിലെ നിരവധി സുപ്രധാന സുരക്ഷാ നടപടികൾ കൈക്കൊണ്ടതിനു ശേഷമായിരിക്കും പൊതുജനങ്ങൾക്ക് സോറ ഉപയോഗിക്കാൻ സാധിക്കുള്ളു.
ഇത് ഒരു വിപ്ലവം തന്നെ ആവും.waiting for this extra ordinary revolution
സോറ ഒരു വിപ്ലവകരമായ മുന്നേറ്റം ആയിരിക്കും