आप अल्फा एआई को कैसे हराते हैं? एक स्मार्टर संस्करण बनाएं

Anonim
DeepMind ने AlphaGo का एक और भी अधिक शक्तिशाली संस्करण विकसित किया है।

गो के खेल के विश्व विजेता को हराने वाला पहला कंप्यूटर प्रोग्राम अल्फ़ागो ने हाल ही में खुद को दर्जनों मैच हारते हुए पाया।

कार्यक्रम का नया चैलेंजर कौन था? खुद का अधिक शक्तिशाली संस्करण।

कंप्यूटर प्रोग्राम के पीछे की वर्णमाला के स्वामित्व वाली कंपनी डीपमाइंड के अनुसार, यह नया और बेहतर अल्फ़ागो वास्तव में मनुष्यों की प्रतिक्रिया के बिना, अपने दम पर गेम खेलना सीख सकता है।

बुधवार को, डीपमाइंड ने अल्फ़ाज़ो के इस नवीनतम विकास को विस्तृत किया, जिसे प्रकृति में प्रकाशित एक नए शोध पत्र में ज़ीरो कहते हैं।

अल्फा के पुराने संस्करणों से अलग जीरो को सेट करने से प्रोग्राम कैसे सीखता है। पिछले पुनरावृत्तियों ने मानव खिलाड़ियों के साथ प्रतिस्पर्धा की, शौकिया और पेशेवर दोनों।

शून्य अलग है। यह संस्करण खुद के खिलाफ खेल खेलकर सीखा, दीपमिन्द ने एक ब्लॉग पोस्ट में लिखा है।

इसे पूरा करने के लिए, कंपनी ने अपने गेमप्ले को ऑप्टिमाइज़ करने के लिए जीरो को पुश करने के लिए "सुदृढीकरण सीखने" नामक एक मशीन लर्निंग तकनीक का उपयोग किया। कार्यक्रम के एल्गोरिदम तब भविष्य की चाल और प्रत्येक मैच के अंतिम विजेता की भविष्यवाणी करने के लिए ठीक-ठाक थे।

"यह तकनीक अल्फा गो के पिछले संस्करणों की तुलना में अधिक शक्तिशाली है क्योंकि यह अब मानव ज्ञान की सीमाओं से विवश नहीं है, " कंपनी ने कहा।

उस बदलाव ने शून्य को पहले पुनरावृत्तियों की तुलना में एक अधिक मजबूत खिलाड़ी बनने में मदद की।

विभिन्न AlphaGo संस्करणों के कौशल स्तर।

केवल तीन दिनों के स्व-प्रशिक्षण के बाद, नए संस्करण को पिछले साल के 18-बार के विश्व चैंपियन ली सेडॉल को हराने वाले अल्फ़ागो कार्यक्रम के खिलाफ खड़ा किया गया था। ज़ीरो ने इतना अच्छा प्रदर्शन किया कि उसने खेले गए सभी 100 मैच जीते।

"सिस्टम ने उत्तरोत्तर कुछ दिनों की अवधि के दौरान मानव ज्ञान के हजारों वर्षों को संचित करते हुए खरोंच से गो का खेल सीखा, " दीपमिन्द ने कहा।

स्व-प्रशिक्षण के 40 दिनों के बाद, ज़ीरो को तब अल्फागो कार्यक्रम के खिलाफ खड़ा किया गया था जिसने इस साल की शुरुआत में मौजूदा विश्व चैंपियन के जी को हराया था। इसने खेले गए 100 मैचों में से 89 में जीत हासिल की।

यह कोई भी शोध प्राचीन बोर्ड के खेल के बाहर अन्य क्षेत्रों में कैसे लागू हो सकता है अभी भी स्पष्ट नहीं है। लेकिन DeepMind के अनुसार, AlphaGo के नए संस्करण से पता चलता है कि AI प्रोग्राम को स्मार्ट बनने के लिए हमेशा मानव निर्मित डेटा पर निर्भर नहीं रहना पड़ता है।