
ओपनएआई ने चैटजीपीटी के लिए एक नई इमेज जेनरेशन सुविधा का अनावरण किया है, जो जीपीटी-4ओ में अपने अब तक के सबसे उन्नत विज़ुअल मॉडल को एकीकृत करता है। ओपनएआई के सीईओ सैम ऑल्टमैन ने सोशल मीडिया पर लॉन्च की घोषणा की, इसे अविश्वसनीय तकनीक/उत्पाद कहा जो उपयोगकर्ताओं को रचनात्मक नियंत्रण का एक नया स्तर देगा। ऑल्टमैन ने एक्स पर एक पोस्ट में कहा, मुझे याद है कि इस मॉडल से कुछ पहली छवियां निकलीं और मुझे यह विश्वास करने में कठिनाई हुई कि वे वास्तव में एआई द्वारा बनाई गई थीं। उन्होंने कहा कि यह टूल व्यापक रचनात्मक अभिव्यक्ति की अनुमति देता है, जबकि ओपनएआई यह सुनिश्चित करने के लिए प्रतिबद्ध है कि आपत्तिजनक सामग्री केवल उचित सीमाओं के भीतर ही बनाई जाए। लोग कुछ वाकई अद्भुत चीजें बनाने जा रहे हैं और कुछ ऐसी चीजें जो लोगों को नाराज कर सकती हैं; हम जो लक्ष्य रखना चाहते हैं वह यह है कि टूल तब तक आपत्तिजनक चीजें न बनाए जब तक आप ऐसा न चाहें, जिस स्थिति में यह उचित सीमा के भीतर ऐसा करता है, ऑल्टमैन ने पोस्ट में लिखा।
ओपनएआई के सीईओ का मानना है कि उपयोगकर्ताओं के हाथों में बौद्धिक स्वतंत्रता देना सही दृष्टिकोण है, लेकिन कंपनी बारीकी से निगरानी करेगी कि उपकरण का उपयोग कैसे किया जाता है और उसके अनुसार नीतियों को समायोजित करेगी।
पोस्ट में आगे लिखा है, हमें लगता है कि उपयोगकर्ताओं के हाथों में यह बौद्धिक स्वतंत्रता और नियंत्रण देना सही बात है, लेकिन हम देखेंगे कि यह कैसे होता है और समाज की बात सुनेंगे। हमें लगता है कि समाज द्वारा अंततः AI के लिए निर्धारित की जाने वाली बहुत व्यापक सीमाओं का सम्मान करना सही बात है, और जैसे-जैसे हम AGI के करीब पहुँचते हैं, यह और भी महत्वपूर्ण होता जाता है।
GPT-4o में इमेज जेनरेशन टूल के बारे में आपको जो कुछ भी जानना चाहिए नई सुविधा के बारे में विस्तार से बताने वाले एक ब्लॉग पोस्ट में, OpenAI ने बताया कि मॉडल टेक्स्ट को सटीक रूप से प्रस्तुत करने, अधिक सटीकता के साथ संकेतों का पालन करने और कई पुनरावृत्तियों में स्थिरता बनाए रखने में उत्कृष्ट है। कंपनी ने इस बात पर जोर दिया कि यह नई क्षमता गेम डेवलपमेंट, शैक्षिक सामग्री और ऐतिहासिक अन्वेषण सहित अनुप्रयोगों की एक विस्तृत श्रृंखला का समर्थन करने के लिए डिज़ाइन की गई है।
पिछले AI इमेज मॉडल के विपरीत, जो सटीक विवरण और ऑब्जेक्ट संबंधों के साथ संघर्ष करते थे, GPT-4o को काफी अधिक सटीकता और प्रासंगिक जागरूकता के साथ छवियां उत्पन्न करने के लिए प्रशिक्षित किया गया है। OpenAI ने कहा कि मॉडल एक ही छवि में 10-20 अलग-अलग वस्तुओं को संभाल सकता है, जो पिछली सीमाओं की तुलना में एक बड़ा सुधार है। सिस्टम उपयोगकर्ताओं को प्राकृतिक बातचीत के माध्यम से छवियों को परिष्कृत करने की भी अनुमति देता है, जिससे कई पुनरावृत्तियों में चरित्र डिजाइन जैसे तत्वों में सहज समायोजन सक्षम होता है।
ओपनएआई का कहना है कि उसने जिम्मेदार उपयोग सुनिश्चित करने के लिए सुरक्षा सुविधाओं में भी सुधार किया है। सभी AI-जनरेटेड छवियों में C2PA के माध्यम से मेटाडेटा शामिल होगा, जो यह संकेत देगा कि वे GPT-4o का उपयोग करके बनाए गए थे। इसके अतिरिक्त, ओपनएआई ने सामग्री को सत्यापित करने और AI-जनरेटेड विज़ुअल का पता लगाने के लिए एक आंतरिक खोज उपकरण विकसित किया है। डीपफेक और स्पष्ट सामग्री जैसी हानिकारक या नीति-उल्लंघन करने वाली छवियों को रोकने के लिए सख्त सुरक्षा उपाय भी किए गए हैं।