டீப் ப்ளூ vs. காஸ்பரோவ்: இயந்திரங்களின் ஆதிக்கத்தின் விடியல்

 

1997-ல், மனிதனுக்கும் இயந்திரத்திற்கும் இடையிலான உறவில் உலகம் ஒரு வரலாற்றுத் திருப்புமுனையைக் கண்டது. IBM-ஆல் உருவாக்கப்பட்ட, சூப்பர்கம்ப்யூட்டர் ஆழ் நீலம் ஆளும் உலக சாம்பியனைத் தோற்கடித்தார், கேரி காஸ்பரோவ், ஆறு-போட்டித் தொடரில். நிலையான நேரக் கட்டுப்பாடுகளின் கீழ், ஒரு போட்டி வகை ஆட்டத்தில் உலக சாம்பியனை ஒரு கணினி தோற்கடித்தது இதுவே முதல் முறையாகும்.

 

முரட்டு வலிமை: டீப் ப்ளூ ஒரு சிறப்பு வன்பொருளின் தலைசிறந்த படைப்பாகும், அது வினாடிக்கு 200 மில்லியன் நிலைகளைக் கணக்கிடும் திறன் கொண்டிருந்தது.

 

ஒரு சின்னஞ்சிறந்த வெற்றி: இந்தப் போட்டி செயற்கை நுண்ணறிவு குறித்த உலகளாவிய கண்ணோட்டத்தை மாற்றியமைத்தது. மனித உள்ளுணர்வு ஆழ்ந்ததாக இருந்தாலும், ஒரு இயந்திரத்தின் அபாரமான கணக்கீட்டு வேகம், அந்தக் காலத்தின் மிகச்சிறந்த வியூக சிந்தனையாளரைக்கூட வென்றுவிட முடியும் என்பதை இது நிரூபித்தது.

ஸ்டாக்ஃபிஷ்: கிராண்ட்மாஸ்டர் பகுப்பாய்வின் ஜனநாயகமயமாக்கல்

ஸ்டாக்ஃபிஷ் இது உலகின் மிகவும் சக்திவாய்ந்த திறந்த மூல சதுரங்க இயந்திரமாகும். கடந்த காலத்தின் பிரத்யேகமான சூப்பர்கம்ப்யூட்டர்களைப் போலல்லாமல், ஸ்டாக்ஃபிஷ் அமெச்சூர் பொழுதுபோக்கு ஆர்வலர்கள் முதல் உலகத் தரம் வாய்ந்த கிராண்ட்மாஸ்டர்கள் வரை அனைவருக்கும் இலவசமாகவும் அணுகக்கூடியதாகவும் உள்ளது.

  • உலகத் தரம்: இயந்திரத் தலைப்பலகைகளில் தொடர்ந்து முதலிடத்தைப் பிடித்து வரும் ஸ்டாக்ஃபிஷ், விளையாட்டுப் பகுப்பாய்வு மற்றும் உத்திகள் உருவாக்கத்திற்கான ஒரு மிகச்சிறந்த கருவியாகச் செயல்படுகிறது.
  • நரம்புப் பரிணாமம்: முதலில் செவ்வியல் “தேடல் மற்றும் மதிப்பீடு” நெறிமுறைகளை அடிப்படையாகக் கொண்டிருந்த ஸ்டாக்ஃபிஷ், அதன் நவீனப் பதிப்புகள் இப்போது பயன்படுத்துகின்றன. NNUE (திறமையாகப் புதுப்பிக்கக்கூடிய நரம்பியல் வலையமைப்புகள்). இந்தக் கலவை, சிக்கலான நிலைகளைப் பற்றிய ஆழமான, கிட்டத்தட்ட மனிதனைப் போன்ற “புரிதலுடன்” மிகப்பெரிய கணக்கீட்டு வேகங்களை இணைக்க அனுமதிக்கிறது, மேலும் இது ELO தரவரிசையில் மிக உயர்ந்த நிலையை அடைகிறது. 3500.

ஆல்ஃபாஸீரோ: இயந்திர உள்ளுணர்வு மற்றும் படைப்பாற்றலின் சகாப்தம்

கூகிளின் டீப்மைண்டால் உருவாக்கப்பட்ட ஆல்ஃபாஸீரோ, செயற்கை நுண்ணறிவைப் பற்றிய நமது சிந்தனையில் ஒரு புரட்சியை ஏற்படுத்தியது. முந்தைய இயந்திரங்கள் நிரல்படுத்தப்பட்ட விதிகளைப் பயன்படுத்தி மனிதர்களால் “பயிற்றுவிக்கப்பட்டன”, ஆனால் ஆல்ஃபாஸீரோ ஒரு சுய-கற்றல் அமைப்பாக இருந்தது.

  • டாபுலா ராசா (முதலிலிருந்து) AlphaZero-விற்கு சதுரங்கத்தின் அடிப்படை விதிகளை மட்டுமே வழங்கப்பட்டது. வலுவூட்டல் கற்றல் (Reinforcement Learning) மூலம் தன்னையே எதிர்த்து மில்லியன் கணக்கான ஆட்டங்கள் விளையாடி, வெறும் நான்கு மணி நேரத்தில் அது மனிதனைத் தாண்டிய உயர் தேர்ச்சி நிலையை அடைந்தது.
  • ஒரு படைப்புப் புரட்சி: AlphaZero ஒரு வழக்கமான “கணக்கீட்டியைப்” போல விளையாடவில்லை. அது மிகவும் ஆக்ரோஷமான, படைப்பாற்றல் மிக்க, மற்றும் உள்ளுணர்வுடன் கூடிய ஒரு பாணியை அறிமுகப்படுத்தியது, நீண்ட கால நிலைப்பற்ற அழுத்தத்திற்காக அடிக்கடி காய்களைத் தியாகம் செய்தது. மனிதர்களை விட இயந்திரங்கள் வேகமாகக் கணக்கிட முடியும் என்பது மட்டுமல்லாமல், விளையாட்டின் கலை மற்றும் படைப்பாற்றலையே “மீண்டும் கண்டுபிடிக்கவும்” முடியும் என்பதை இது நிரூபித்தது.