От същия автор

Бюлетин „Либерален преглед в неделя“

Pin It

 

2018 05 alphago ai match

 

Брой думи:  4800

Ая Хуанг бръква в дървената купа, пълна с полирани черни камъни и, без да гледа, стисва един между средния пръст и показалеца си. С поглед, втренчен през очилата с телени рамки, той поставя черния камък върху дъската, в една почти празна зона, точно под и вляво от друга зона, заета почти изцяло от бели камъни. Според разговорния език на играта Го това е „удар с рамо“, отстрани, далеч от местата, където се развиват останалите действия в играта.

От другата страна на масата, Ли Седол, най-добрият играч на Го през последното десетилетие, почти се вцепенява. Той оглежда 37-те камъка, разпределени по различни места на дъската, после се изправя и излиза.

В залата за коментаторите, на около 30 метра, Майкъл Редмънд гледа играта на телевизионен екран. Редмънд, единственият западен играч на Го, който е успял да стигне до девети дан, най-горната фаза на майсторство в играта, буквално трябва да се увери, че е видял правилно. Той е също толкова шокиран, колкото и Ли. „Наистина не знам дали това е добър или лош ход“, коментира Редмънд за почти 2-та милиона души, които следят партията онлайн.

„Мислех, че това е грешка“, казва един друг англоезичен коментатор, Крис Гарлок, вицепрезидент по връзките с обществеността на Американската асоциация по Го.

Няколко минути по-късно Ли се връща в помещението, където се провежда мача. Сяда, но не докосва собствената си купа с бели камъни. Минава минута, после другата – общо 15, значителна част от началните два часа, с които играчите разполагат за всяка игра в турнира. Накрая Ли вади камък и го поставя на дъската, точно над черния, който е изиграл Хуанг.


Small Ad GF 1

Ходът на Хуанг е само 37-ят от играта[1], но Ли никога не успява да се възстанови от удара. Четири часа и 20 минути по-късно той се признава за победен.

Но Хуанг не е истинският победител в тази игра на Го. Той просто следва команди, предавани на плосък монитор вляво от него, който е свързан с близката контролна зала тук в хотел „Четири сезона“ в Сеул. От своя страна мониторът е свързан със стотици други компютри от центровете за данни на Гугъл, разпръснати по целия свят. Хуанг е само ръцете; умът зад играта е изкуствен интелект, наречен AlphaGo, който побеждава един от най-добрите играчи в може би най-сложната игра, създавана някога от хората.

В същата стая мачът се гледа и от друг експерт на Го – трикратният европейски шампион Фен Хуи. Първоначално ход 37 обърква и него. Но той има собствена история с AlphaGo. Хуи е бил, повече от всяко друго човешко същество, спаринг-партньор на програмата. В продължение на пет месеца Фен е изиграл стотици игри срещу машината, като е позволявал на създателите ѝ да видят къде тя допуска грешки. Фен е губил отново и отново, но в хода на всичко това той е започнал да разбира AlphaGo все по-добре – доколкото това е възможно за човешко същество. Според Фен този удар с рамо, „не е човешки ход“. Но след около 10 секунди размишление той вече започва да разбира. „Толкова е красиво“, казва той. „Толкова красиво.“

В този мач от пет партии, AlphaGo вече води срещу Ли – а чрез него и срещу човечеството – с два на нула. Ход 37 показва, че AlphaGo не просто е погълнал много години на програмиране, нито пък използва някакъв предсказателен алгоритъм на груба сила[2]. Това е моментът, в който AlphaGo доказва, че разбира, или поне изглежда, че имитира разбирането по начин, който е неразличим от самото нещо. От гледна точка на Ли, AlphaGo е демонстрирал онова, което играчите на Го описват с думата „интуиция“: способността да се играе една красива игра не само като човек, но и по начин, по който никой човек не може.

Впрочем, нека не избързваме да оплакваме Ли Седол или човечеството, за поражението им. Нито Ли е мъченик, нито пък ход 37 е бил моментът, в който машините са започнали неизбежния си възход към постигане на власт над нашите по-слаби умове. Точно обратното: ход 37 е моментът, в който машините и човечеството най-после започнаха да се развиват заедно.

Бюлетин „Либерален преглед в неделя“

* * *

Когото Дейвид Силвър бил 15-годишен шахматист от Сафък, на източното крайбрежие на Англия, Демис Хасабис бил детето, което никой не можел да победи. Хасабис бил олицетворение на детето-чудо, син на китайско-сингапурска майка и гръцко-кипърски баща в Лондон, а в един момент и вторият най-високо оценяван играч на шахмат под 14-годишна възраст. Появявал се на провинциалните турнири, за да поддържа форма и да припечелва малко джобни пари. „Познавах Демис, преди той да ме познава“, казва Силвър, [който днес е] изследователят, с чиято работа е започнал съществуването си AlphaGo. „Виждах го да се появява от време на време в моя малък град, да печели турнира и да си отива.“

Срещнали се истински вече като студенти в Кеймбридж, където и двамата учели изчислителни неврологични науки [computational neuroscience] – тоест опитът да се разбере човешкия ум и начините, по които евентуално машините някой ден биха могли  да станат малко по-интелигентни. Но онова, което наистина ги свързвало, била страстта към игрите, независимо дали на дъски или на компютри.

Ето как през 1998 г., някак напълно естествено, след като завършили, Хасабис и Силвър създали заедно компания за видеоигри. Хасабис често играел Го с един колега и, подбуждан от интереса на приятеля си, Силвър също започнал да се учи: „Вече беше нещо като особена чест, ако можеш да биеш Демис на каквото и да е“, казва Силвър. „Пък и знаех, че той едва сега започва да се интересува от тази игра.“

Присъединили се към местния клуб по Го и играели срещу играчи от втори или трети дан, което е еквивалентно на черния колан в карате. Но имало и още нещо: не можели да престанат да мислят за това как Го си остава единствената интелектуална игра, която машините още никога не са овладявали. През 1995 г. компютърната програма на име Chinook победи един от най-добрите световни играчи по шашки. Две години по-късно суперкомпютърът Deep Blue на IBM победи световния шампион по шахмат Гари Каспаров. През следващите години машините вече триумфират във всевъзможни игри на знанието – „Скрабъл“, „Отело“, дори и в телевизионната „Стани милионер“. От гледна точка на игровата теория, Го е перфектна информационна игра, също като шаха или шашките – тук няма случайни елементи, няма скрита информация. Обикновено тези игри са лесни за овладяване от компютрите. Но Го е друга история.

Работата е там, че на пръв поглед играта изглежда доста проста. Създадена в Китай преди повече от 3000 години, тя поставя един срещу друг двама играчи, над дъска с 19 на 19 пунктове, разположени върху квадратна координационна система. Играчите поставят поред черни или бели камъни върху ъгловите пунктове, опитвайки се да завоюват територия или да обградят територията на опонента си. Често се казва, че шахматът е метафора за войната, но всъщност метафората касае само една отделна битка. [В сравнение с шаха] Го е като глобално бойно пространство, като геополитика. Един ход в ъгъла на дъската може да има отражения върху цялото пространство. Предимствата се натрупват и оттичат. В една шахматна партия, играчът обикновено има около 35 възможни хода, от които да избира в дадена позиция. В Го същото число е по-близо до 200. В хода на цялата игра, това е съвсем друго ниво на сложност. Както казват Хасабис и Силвър, броят на възможните позиции на дъската надхвърля броя на атомите във Вселената.

Резултатът от това е, че за разлика от шаха, тук играчите – независимо дали са хора или машини – не могат да преценяват крайния резултат от всеки потенциален ход. Най-добрите играчи играят чрез интуиция, а не изчисления. „Добрите позиции изглеждат добре“, казва Хасабис. „Изглежда, че следват някаква естетика. Ето защо това е една толкова вълнуваща игра на хиляди години.“

През 2005 г. компанията на Хасабис и Силвър престанала да съществува и двамата тръгнали по различни пътища. В Университета на Алберта [Канада], Силвър започнал да изучава една нова форма на изкуствен интелект (ИИ), наречена учене чрез затвърждаване [reinforcement learning], което е начин за машините да се учат сами, като изпълняват отново и отново едни и същи задачи, след което проследяват кои решения носят най-голям успех. Хасабис пък се записал в Университетския колеж в Лондон и получил докторска степен по когнитивна неврология.

През 2010 г. те отново се намерили. Междувременно Хасабис е съосновал компания за ИИ в Лондон, наречена DeepMind; Силвър се присъединил към него. Амбициите им били грандиозни: създаване на [т. нар.] Общ изкуствен интелект[3], тоест такъв, който наистина може да мисли. Но първо трябвало да започнат с нещо [конкретно].

И отправната им точка, разбира се, се оказали игрите. Всъщност те са доста добър тест за изкуствен интелект. По дефиниция, игрите са нещо ограничено. Те са малки затворени вселени, където, за разлика от реалния живот, вие можете обективно да оценявате успеха и неуспеха, победата и поражението. DeepMind се заел със задачата да комбинира ученето чрез затвърждаване с т. нар. „дълбоко учене“, един нов подход към намирането на повтарящи се структури в огромни масиви от данни. За да разберат дали функционира, изследователите научили своя нов изкуствен интелект да играе класически компютърни игри като Space Invaders и Breakout.

Breakout се оказал техният голям успех. В основата си тази игра е вариант на Pong, само дето, вместо заедно с противника си да удряте по екрана напред-назад симулирано топче за пинг-понг, тук вие го правите срещу стена от цветни тухли. Ударите ли дадена тухла, тя изчезва; пропуснете връщащата се назад топка или я ударете така, че да излезе извън екрана – и губите. Е добре, само след 500 игри, системата DeepMind се научила да изпраща топката зад стената, и то под ъгъл, който гарантира, че тя ще си остане там, отскачайки наоколо и изхвърляйки тухла след тухла, докато спечели, без да има нужда да удря топката нито веднъж повече. Това е класически ход на Breakout, но DeepMind се научил да го прави с непогрешима точност, във всяка игра, при това със скорост, надхвърляща всичко, с което биха могли да се справят човешките рефлекси.

В търсенето на инвеститори, Хасабис успял да се срещне на вечеря с Питър Тийл, известният съосновател на PayPal и инвеститор във Фейсбук. Разполагал само с няколко минути, за да успее да спечели вниманието му. И тъй като знаел, че Тийл е запален шахматист, Хасабис организирал атаката си върху една [изключително абстрактна, но затова пък безкрайно оригинална идея], свързана с предположението, че играта е оцеляла толкова дълго най-вече поради творческото напрежение между силите и слабостите на офицера и коня [като шахматни фигури]. Тийл предложил Хасабис да се върне на следващия ден, за да направи подходящо представяне на проекта си.

След като веднъж сте успели да накарате някой милиардер от Силициевата долина да чуе за вас, след него го правят и други. Чрез Тийл Хасабис се срещнал с Елон Маск, който пък разказал за DeepMind на главния мениджър на Гугъл, Лари Пейдж. Скоро след това Гугъл купил компанията за 650 млн. долара.

След като се присъединил към гиганта на търсенето, Хасабис показал демонстрацията на играта за Atari [тоест Breakout] по време на среща, в която участвал и другият съосновател на Гугъл, Сергей Брин. И двамата изведнъж открили, че имат обща страст. По време на следването си в Станфорд Брин играел толкова много Го, че се притеснявал, че Гугъл никога няма да бъде реализиран.

Така че, когато Брин се срещнал с Хасабис, двамата се разговорили за играта. „Знаете ли, DeepMind може би ще победи световния шампион след няколко години“, казал му Хасабис. „Ако наистина се захванем сериозно с това.“

„Мислех, че това е невъзможно“, отвърнал Брин.

Това било всичко, от което Хасабис се нуждаел. Играта, както се казва, тръгнала.

* * *

След края на втората партия Силвър се промъква в контролната зала, създадена специално за AlphaGo, малко по-надолу по коридора, където се провежда мачът. „Мозъкът“ на програмата е не повече тук, отколкото където и да било другаде, всъщност той е разпределен сред стотици компютри по цялата планета. Но докато стои пред тези банки с дисплеи, Силвър може да надникне донякъде в начините, по които функционира AlphaGo, да следи здравето му и да проследява прогнозите за резултата във всяка от партиите.

С няколко натискания на клавишите Силвър извиква на екрана запис с решенията на AlphaGo по време на играта. Той избира онова, което се е случило точно преди ход 37.

Преди появата на [програми от рода на] DeepMind и AlphaGo, изследователите на ИИ са се опитвали да атакуват Го с машини, които са се опитвали да предсказват резултатите от всеки ход по систематичен начин, по време на самия мач – тоест към проблема се е подхождало с груба [изчислителна] сила. Това е долу-горе начинът, по който Deep Blue на IBM победи Каспаров в шахматния мач от 1997 г. Самият аз представях този мач като репортер за PC Magazine и, също както и сега, при Ли срещу AlphaGo, хората разбират добре, че това е ключов момент в развитието на изкуствения интелект. Странно, но точно както и в сегашния двубой, тогава Deep Blue направи срещу Каспаров ход, който никой човек не би направил. Каспаров беше точно толкова развълнуван, колкото и Ли, но самият той не успя да събере сили за продължителна битка; само няколко хода по-късно той се предаде, [психологически] пречупен под тежестта на натиска [на машината].

Но грубата сила никога не е била достатъчна, за да може да се побеждава и при Го. Играта просто предоставя твърде много възможности, за да може да се разглежда всеки възможен развой, дори и за [изключително мощен] компютър. Ето защо екипът на Силвър е избрал един напълно различен подход: тук е била изградена машина, която може да се научи да играе доста добре, преди да е играла какъвто и да е мач.

В офисите на DeepMind, близо до метро-станцията Кингс Крос в Лондон, екипът е захранил 30 милиона човешки ходове в дълбоко-невронна [компютърна] мрежа – комбинация от хардуер и софтуер, която донякъде напомня за мрежата от неврони в човешкия мозък. Невронните мрежи всъщност са вече нещо доста обичайно; Фейсбук ги използва, за да маркира лица по снимките,[ които се публикуват там]. Гугъл ги използва, за да идентифицира командите, които се изговарят в смартфоните, работещи със системата Андроид. Ако захраните една невронна мрежа с достатъчно много снимки на майка си, тя ще се научи да я разпознава. Захранете я с достатъчно реч, и тя ще се научи да разбира онова, което казвате. Захранете я с 30 милиона хода на Го – и тя ще се научи да играе Го.

Но познаването на правилата не е същото като да си майстор. Ход 37 не се е намирал в онзи набор от 30 милиона. И така, как всъщност AlphaGo се е научил да играе [толкова добре]?

AlphaGo е знаел – до степента, до която той е в състояние да „знае“ каквото и да било – че този ход е бил доста неясен. „Той е знаел, че това е ход, който професионалистите не биха избрали, и въпреки това, когато е започнал да търси все по- и по-дълбоко, е успял да преодолее тази първоначална задръжка“, казва Силвър. В известен смисъл AlphaGo е започнал да мисли самостоятелно. Той е вземал решенията си не въз основа на някакъв фиксиран набор от правила, кодирани от създателите му в неговата дигитална ДНК, а на алгоритми, които е научил сам. „Той наистина е открил това самостоятелно, чрез собствения си процес на интроспекция и анализ.“

Всъщност машината е пресметнала, че вероятността един експертен човешки играч да изиграе същия ход, възлиза на 1 срещу 10 000. Но го е направила, въпреки това.

След като се научила да играе играта чрез тези човешки ходове, Силвър накарал машината да играе срещу самата себе си. Играела игра след игра, срещу една (леко) различна версия на собствената си невронна мрежа. И докато играела, тя проследявала кои ходове генерират най-голяма награда, под формата на най-голяма завоювана територия на дъската (именно в това се състои техниката за учене чрез затвърждаване техника за армиране, която Силвър е изучавал в университета). AlphaGo започвал малко по малко да създава нечовешкия си репертоар.

Но това е само част от номера. След това екипът на Силвър въвел милиони от тези нечовешки ходове във втора невронна мрежа, чиято задача била да гледа напред и да търси резултати по същия начин, по който Каспаров (или Deep Blue) се опитва да види бъдещите развития в една шахматна партия. Програмата не може да изчисли всички възможни ходове като в шахмата – [в наши дни] това е все още невъзможно. Но след като сумирал всички познания, които бил насъбрал в хода на толкова много партии, AlphaGo вече можел да предсказва как долу-горе ще се развива една игра на Го.

Да можеш да предположиш резултата въз основа единствено на начални условия, които никога преди това не си виждал? В живота това се нарича интуиция. И онова, до което AlphaGo е стигнал във втората партия, е ход 37 – едно прозрение отвъд онова, което могат да видят дори и най-добрите човешки играчи. Даже и собствените му създатели не са очаквали нещо такова. „Когато гледам тези игри, не мога да ви опиша напрежението си“, казва Силвър след идването си в контролната зала. „Наистина не знам какво точно ще се случи.“

* * *

Разбира се, никой няма да плати 650 милиона долара за една компания, само за да си направи компютър, който може да играе страхотно силно интелектуални игри. Дълбоките учебни и невронни мрежи стоят в основата на около една дузина услуги, предлагани от Гугъл, включително и всемогъщата му търсачка. Ученето чрез затвърждаване, другото не съвсем тайно оръжие на AlphaGo, вече обучава лабораторните роботи на компанията да вдигат и преместват всевъзможни предмети. И все пак можеше да се види колко важен беше този мач за Гугъловците. Ерик Шмид – председател и бивш главен мениджър на фирмата – долетя [в Сеул] преди началото на първата партия. Джеф Дийн, най-известният инженер на компанията, също е там за първата игра. Сергей Брин дойде за третата и четвъртата партии, които проследяваше на собствената си дървена дъска.

Но залогът тук е далеч по-голям от просто бизнес. По време на мача аз се разхождах заедно с Хасабис из Йонгно-гу, културното и политическо сърце на Сеул, квартал на около 600 години. И докато разговаряхме, една млада жена с широко разтворени очи разпозна Хасабис, чието лице в онези дни беше навсякъде по корейската телевизия и вестници. А след това направи движение от рода на „о, направо ще припадна“, сякаш пред нея беше [някоя поп-фигура като] Тейлър Суифт или Джъстин Бибър.

„Видя ли това?“, казах аз.

„Да“, отвърна Хасабис, без дори да мигне. „Това се случва непрекъснато.“

Може и да не се е шегувал. Компютърните инженери обикновено нямат фенове, но в Корея Го играят 8 милиона души, а Ли е национален герой. В Китай повече от 280 милиона зрители са гледали мача на живо.

Така че може би не е съвсем безсмислено да се твърди, че когато Ли губи първата, а след това и втората партия, лекомисленото вълнение, което излъчват онези фенове, е подплатено с нещо с нещо далеч по-мрачно. След края на втората партия един китайски репортер, на име Фред Джоу, ме спря в коментарната зала, радостен да говори с някой, който оценява AlphaGo като технологическо постижение, а не просто като „убиец на Го“.

Но след това го попитах как се чувства при мисълта за поражението на Ли. Джоу посочи към гърдите, към сърцето си. „Това ме натъжава“, каза той.

Аз също чувствах тази тъга. Нещо, което до този момент беше принадлежало единствено на хората, вече не беше такова. Онова, което разбираха мнозина от нас – хората, които гледаха състезанието – беше, че машините са задминали един определен праг. Те вече са надхвърлили онова, което могат да направят хората. Разбира се, машините все още не могат да водят истински разговор. Те не могат да измислят някоя добра шега. Не могат да играят на шаради[4]. Не могат просто да дублират добрия стар човешки здрав разум. Но непреодолимото превъзходство на AlphaGo ни показва, че машините вече могат да имитират – а всъщност и надхвърлят – онзи вид човешка интуиция, която е по силите единствено на най-добрите световни играчи на Го.

Ли губи и третата партия, което означава, че AlphaGo вече е спечелил мача. На пресконференцията след това, Ли се извинява, че е „подвел човечеството“. „Трябваше да постигна по-добър резултат, по-добър мач“, казва той.

И докато Ли говори така, едно неочаквано усещане започва да се промъква в гърдите на Хасабис. Като един от създателите на AlphaGo, той се гордее, дори е въодушевен от това, че машината е постигнала нещо, считано за невъзможно от толкова много хора. Но дори и той чувства, че неговата човечност се надига [в протест]. И започва да се надява, че Ли ще спечели поне една игра.

* * *

Два часа след началото на четвъртата партия, Ли се намира дълбоко в друга дупка. Започнал е агресивна партия, нападайки различни части от игралното поле. Но AlphaGo играе във всеобхватен стил, като използва по-цялостен подход, при който се претегля ситуацията върху цялата дъска. В ход 37 AlphaGo поставя черния си камък близо до един друг – в район, който лежи далеч от главното действие в играта. За пореден път, този път в игра четири, машината използва този загадъчен подход, за да поеме контрола над борбата.

AlphaGo е спечелил мача. Ли вече не играе за победа. Той играе за човечеството. На седемдесет и седмият ход нещата изглеждат така, сякаш е изгубил всякаква инициатива. Той опира брадичка в дясната си ръка и леко се поклаща напред-назад. Завърта се на стола и леко масажира врата си. Минават две минути, после четири, после шест.

А след това, докато все още се държи за врата с лявата ръка, той нанася удар. С два пръста на дясната си ръка, Ли поставя бял камък близо до центъра на дъската, точно между два черни камъка. Това е 78-ият камък на борда, един „клинообразен“ ход между две огромни и претъпкани територии. На практика ходът прерязва на две защитата на AlphaGo. И машината „премигва“. Не буквално, разбира се. Но следващият ѝ ход е ужасяващ. Ли изстрелва остър поглед към Хуанг, сякаш той, а не онези милиарди от полупроводникови връзки, е реалният му противник.

В контролната зала на AlphaGo хората, които управляват машината, спират всичко, с което се занимават, и започват втренчено да гледат мониторите си. Преди брилянтния 78-ми ход на Ли, AlphaGo е оценявал шансовете си за победа на 70%. Осем хода по-късно, шансовете му пропадат в празното. Изведнъж AlphaGo вече не е наследникът на Deep Blue. В момента той е Каспаров. [Както изглежда, той] просто не може да повярва, че едно човешко същество е в състояние да направи такъв ход – шансовете на екрана са вече познатите цифри от 1 срещу 10 000.

Също като човек, AlphaGo може да бъде изненадан. След четири часа и 45 минути игра, AlphaGo се предава. Също като нас и той може да изгуби.

„Всички премисляния, които AlphaGo беше извършил до този момент, бяха станали безполезни“, казва Хасабис. „Той трябваше да започне отначало.“

* * *

Последната игра е започнала и аз трябва да я гледам заедно с Хасабис и екипа му. Но точно преди да се отправя към тях, една служителка на Гугъл ме намира в пресцентъра. „Много съжаляваме“, казва тя, „но екипът промени решението си. За финалния мач те не искат репортер в помещението.“

След като тя се е отдалечила, аз се обръщам към Джерди Ууд, фотографът на Wired. „Знаеш ли какво означава това?“, казвам му. „AlphaGo смята, че губи.“

Точно така е. В началото на играта AlphaGo прави новобранска грешка. В една претъпкана част от долната половина на дъската машината поставя своя бял камък твърде близо до черната линия на Ли – и в резултат на това губи цялата територия. Интуицията на AlphaGo се е провалила; също като човек, машината все още има своите собствени слепи петна.

Но когато играта навлиза в третия час, AlphaGo отново се е върнал на терена. Ли е употребил прекалено много време: когато стигат до маркера за три и половина часа, стандартното му време му е изтекло. Съгласно правилата на мача, сега той трябва да прави всеки ход за по-малко от минута, или да загуби автоматично [заради пресрочване на времето], но една голяма част от пространството в горната дясна страна на дъската си остава незапълнена. От време на време той изчаква чак до последната секунда, преди да постави следващия си камък.

И тогава времето на AlphaGo също изтича. И двамата играчи започват да играят в нещо, което изглежда като невъзможно темпо. Дъската се запълва с камъни. За първи път в мача изглежда така, сякаш играта ще бъде изиграна буквално до последния възможен ход, че нито една от страните няма да се предаде, преди да бъдат отброени крайните точки. Но когато се стига до петия час, пропастта между Ли и AlphaGo се е разтворила прекалено широко. Ли се предава. AlphaGo може и да прави грешки, но все още господства.

* * *

По целия свят навярно има само още един човек, който може да претендира, че знае как се чувства Ли: това е Фен Хуи, трикратният европейски шампион и фактически треньор на AlphaGo. Той е загубил с пет на нула мача при закрити врати срещу машината, който е бил проведен през миналия октомври. Това е била генералната репетиция за по-голямото състезание в Сеул. А след това Фен станал един вид играч под наем, играейки игра след игра срещу машинната – все игри, които продължавал да губи, една след друга.

Но докато загубите на Фен срещу AlphaGo се трупали, се случили и нещо радостно. Фен започнал да вижда AlphaGo в изцяло нова светлина. Срещу другите, човешки играчи, той започнал да печели все повече – включително и четири поредни мача срещу топ играчи. Класацията му се изстреляла нагоре. AlphaGo се превърнал в негов треньор.

И така, попитах аз Фен по време на турнира, какво да мислим за борбата на Ли срещу машината?

„Не бъдете жестоки с Ли Седол“, казва Фен. „Бъдете милостиви.“

* * *

Тези дни най-големите и най-богати компании по света използват същите технологии, въз основа на които е създаден AlphaGo, за да търсят конкурентни предимства. Коя програма може да разпознае по-добре дадена снимка? Коя може да отговори на гласова команда? Скоро същите тези системи може би ще помагат на роботите да взаимодействат с реалните си околни среди по начини, много по-близки до онези на хората.

Но тези практически употреби изглеждат някак банални в сравнение с нечовешката човечност на AlphaGo. Около него вече е възникнала някаква субкултура, и то по начин, който не се е случвал никъде другаде, [когато става дума за прилагане на изкуствен интелект]. В Дюселдорф, Германия, Дж. Мартин – професор по дизайн на игри, медии и комуникации – сега води Twitter акаунт, посветен на ход 37. След като е прочела моя онлайн-репортаж за турнира в Сеул, една 45-годишна компютърна програмистка от Флорида, на име Джорди Енсийн, ми изпраща имейл, в който ми казва, че си е направил татуировка с ход 37 на AlphaGo от вътрешната страна на дясната ръка. От вътрешната страна на лявата ѝ ръка пък е татуиран ход 78 на Ли – един ход, който хората от света на Го вече наричат „Божественото осеняване“.

В часовете след четвъртата партия Ли седи в приятелски разговор с Хасабис. Бившето дете-чудо на игрите казва на Ли, че разбира добре натиска, на който той е подложен. Той разбирал и творческата му енергия, и напора му. „Аз също бях нещо като професионален играч“, казва Хасабис. „Ако животът ми би тръгнал по друг начин … Знам каква всеотдайност е необходима, за да се стигне до такова ниво, какво количество жертви.“

Ли отговоря, че играта срещу машината е пробудила отново страстта му към Го. Също като при Фен Хуи, AlphaGo е отворил очите му за една нова страна на играта. „Вече съм далеч по-добър“, казва Ли. „Всичко това ми даде нови идеи“. Оттогава насам той не е губил мач.

Преди турнира Хасабис е казал на света, че технологията на ИИ, върху която е изграден AlphaGo, може би ще доведе до нов вид научни изследвания, при които машините ще насочват хората към следващия голям пробив. По онова време, без доказателства, тези твърдения звучаха малко кухо, като типично техничарски хвалби. Но вече не. Машината извърши нещо много човешко по начин, много по-добър от човешкия. Но заедно с това, в хода на този процес, тя е направила тези хора и по-добри в онова, което правят. Да, човек би могъл да вижда в ход 37 един ранен признак за неизбежното пришествие на превъзходството на машините над техните човешки създатели. Или да вижда в него нещо като семе: Без ход 37 днес не бихме имали и ход 78.

 

Източник

 

[1] Средната игра на Го продължава около 200 хода. Бел. пр.

[2] Методът на „грубата сила“ е такъв, при който компютърът се опитва да изчисли всички възможни варианти след даден ход, за да избере оптималния от тях. На сегашния етап от развитието на компютърната техника този подход е невъзможен, тъй като вариантите в големите човешки игри (шахмат, го) са прекалено много и на практика не могат да бъдат пресметнати изцяло. Бел. пр.

[3] Под „Общ изкуствен интелект“ (или „Интелект от общ характер“) в науката и научната фантастика се разбира такъв вид изкуствен интелект, който може да се занимава не само със строго специфични, но и с общи проблеми на познанието, като всеки човек. Бел. пр.

[4] Игра, при която участниците трябва да представят чрез мимики смисъла на думата, предложена от другия отбор. Бел. пр.

 

Кейд Метц е американски журналист, кореспондент на New York Times по технологическите въпроси и бивш старши редактор на списание Wired. Работите му са свързани с най-различни технологически проблеми като изкуствен интелект, автономни автомобили, роботика, виртуална реалност и други най-нови технологии.

Pin It

Прочетете още...