एप्पल ने अपना अब तक का सबसे बड़ा ओपन-सोर्स डेटासेट लॉन्च किया है, जिसका नाम Pico-Banana-400K रखा गया है। यह डेटासेट शोधकर्ताओं को AI-आधारित इमेज एडिटिंग मॉडल्स विकसित करने में मदद करेगा। इसमें 4 लाख वास्तविक तस्वीरें और उनके AI-एडिटेड वर्ज़न शामिल हैं, जो टेक्स्ट-गाइडेड इमेज एडिटिंग मॉडल्स को ट्रेन करने में उपयोगी होंगे।
यह डेटासेट केवल रिसर्च (शोध) उद्देश्यों के लिए मुफ्त उपलब्ध है और इसे व्यावसायिक उपयोग के लिए नहीं अपनाया जा सकता। खास बात यह है कि एप्पल ने यह डेटासेट ऐसे समय जारी किया है, जब कंपनी अपने खुद के AI सिस्टम्स के विकास में चुनौतियों का सामना कर रही है।
🧠 Pico-Banana-400K: टेक्स्ट-आधारित इमेज एडिटिंग का नया युग
एप्पल के रिसर्च पेपर “Pico-Banana-400K: A Large-Scale Dataset for Text-Guided Image Editing” (जो arXiv पर प्रकाशित हुआ है) के अनुसार, यह डेटासेट OpenImages पर आधारित है और इसमें 35 प्रकार के एडिट्स शामिल हैं — जैसे सिंगल-टर्न एडिट्स, मल्टी-टर्न सीक्वेंस, और प्रेफरेंस पेयर्स।
इस संरचना की खासियत यह है कि यह सिंथेटिक डेटा की तुलना में कहीं अधिक वास्तविक और उपयोगकर्ता-केंद्रित है, जिससे यह रीयल-वर्ल्ड एडिटिंग सिचुएशन्स और प्राकृतिक टेक्स्ट इंस्ट्रक्शन्स को बेहतर ढंग से दर्शाता है।
⚙️ कैसे बना यह एडवांस्ड डेटासेट
एप्पल के वैज्ञानिकों ने इस डेटासेट को दो शक्तिशाली AI मॉडलों की मदद से तैयार किया:
- एक जनरेटिव मॉडल (Nano Banana), जो इमेज एडिट तैयार करता है।
- दूसरा मल्टीमॉडल मॉडल, जो एडिट्स की गुणवत्ता की जांच और फ़िल्टरिंग करता है।
इससे तैयार हुआ डेटा विविध, उच्च-गुणवत्ता वाला और मानव-केंद्रित है, जिसमें छोटे और लंबे दोनों प्रकार के टेक्स्ट इंस्ट्रक्शन्स मौजूद हैं।
डेटासेट में नेगेटिव सैंपल्स और प्रेफरेंस पेयर्स भी जोड़े गए हैं — जो AI एलाइनमेंट रिसर्च के लिए बेहद अहम हैं। इससे मॉडल न केवल यह सीखता है कि क्या करना है, बल्कि यह भी समझता है कि बेहतर परिणाम कैसा दिखता है।
🔍 पारदर्शिता और सीमाएं
एप्पल ने अपने पेपर में डेटासेट की मजबूतियों और सीमाओं का ईमानदारी से ज़िक्र किया है। यह स्टाइल ट्रांसफर और लाइटिंग एडजस्टमेंट्स जैसे एडिट्स में अच्छा प्रदर्शन करता है, लेकिन स्पैटियल एडिटिंग या टेक्स्ट रिप्लेसमेंट्स जैसे जटिल बदलावों में अभी सुधार की ज़रूरत है।
यह भी पढ़ें – एलन ट्यूरिंग इंस्टीट्यूट का नया मिशन – ब्रिटेन की साइबर सुरक्षा को मज़बूती
🌐 GitHub पर उपलब्ध और Apple की AI दिशा
Pico-Banana-400K डेटासेट अब GitHub पर गैर-व्यावसायिक उपयोग के लिए उपलब्ध है।
हालांकि एप्पल अपनी AI क्षमताओं को मजबूत करने में लगा है, लेकिन Apple Intelligence और Siri के नए संस्करणों में अपेक्षित तेजी नहीं देखी गई है। इसके बावजूद, कंपनी ने iPhone 17 सीरीज़ के साथ अपने AI फीचर्स का विस्तार कर एक मजबूत दिशा की ओर कदम बढ़ाया है।