Pomiń do głównej zawartości

Postęp w kursie:

Здесь размещены избранные записи из портала sztucznainteligencja.org.pl. Мы надеемся, что они вдохновят вас на дальнейшие исследования над тем, как еще можно использовать искусственный интеллект.

1992: Чинок против гения шашек

Может показаться, что не существует лучший пример игры, в которой компьютер обыгрывает человека, чем шашки.

Проблема в том, что количество возможных комбинаций здесь гигантское: 5 х 10 в степени 20 (500 триллионов). Джонатан Шеффер, программист из Университета Альберты в Канаде, в конце 1980-х годов решил создать компьютер, способный превзойти лучших мастеров шашек. Затем он провел такую аналогию: представьте себе, что кто-то вылил воду из Тихого океана, а мы должны вновь наполнить его… чашкой. Нам понадобится 5 х 10 в степени 20 чашек.

В 1990 году созданный им компьютер Чинук участвовал в чемпионате США по шашкам, впервые столкнувшись с гением Марионом Тинсли, а с 1955 года (с перерывом, когда он отказался от титула) стал чемпионом мира. В 34 партиях была сыграна ничья. Два Тинсли - проиграл, но выиграл четыре и титул остался при нем.

Два года спустя на чемпионате мира в Лондоне Чинук имел уже представление о 500 миллиардах возможных конфигураций. Несмотря на это, Тинсли сыграл вничью в шести играх. Однако из-за боли в животе он не смог уже продолжить игру. Ему пришлось отказаться от игры окончательно. Диагноз: рак поджелудочной железы. Через несколько месяцев "Бетховенские шашки" умерли.

Источник: https://www.sztucznainteligencja.org.pl/portfolio/1992-chinook-kontra-geniusz-warcabow/

1997: Deep Blue побеждает Каспарова

На седьмом ходу решающей партии человек ошибся в защите. Посвятив коня, машина быстро произвела мощную атаку и после еще одиннадцати ударов вынудила человека сдаться.

- Нечестная игра! Кричал побежденный.

Обман? Но кто может быть обманщиком? Компьютер?

Нет. По сей день Гарри Каспаров, шахматный гений, которого 11 мая 1997 года победил суперкомпьютер IBM Deep Blue, считает, что он сражался не с машиной, а с другим человеком, контролирующим компьютер. Доказательства? По словам россиянина, игра машины была «слишком человечной».

Но мир этому не поверил. Факт остается фактом: впервые в истории машина победила чемпиона мира по шахматам в классическом матче. Это оказалось возможным не только потому, что она могла провести 100 миллионов анализов за секунду, а Каспаров только три. Успех Deep Blue также был основан на использовании сложных техник искусственного интеллекта, которые помогли машине оценить свои собственные ходы и выбрать из них самые перспективные.

Источник: https://www.sztucznainteligencja.org.pl/portfolio/1997-deep-blue-zwycieza-kasparowa/

2016: AlphaGo - чемпион го

«Не было такого момента, чтобы я чувствовал, что я впереди», - сказал Ли Седол, 18-кратный чемпион мира по го, когда 15 марта 2016 года после шести дней борьбы с машиной было объявлено о его поражении. Победитель, алгоритм AlphaGo, разработанный лондонской лабораторией DeepMind, получил приз - миллион долларов. И заодно - славу как первой машины, победившей одного из величайших чемпионов в истории этой древней игры.

Как это произошло? Сначала, благодаря глубокой нейронной сети машина выучила десятки миллионов ходов самых опытных игроков. Затем было использовано обучение с подкреплением: в миллионах партий разные варианты AlphaGo играли друг против друга, анализируя, какие ходы привели к захвату самой большой территории. Таким образом AlphaGo открывал новые стратегии.

Наконец, ходы совершенные во время этих матчей были введены во вторую нейронную сеть. Это научило систему предугадывать последствия каждого хода, смотреть в будущее.

Источник: https://www.sztucznainteligencja.org.pl/portfolio/2016-alphago-mistrzem-go/

2017: Libratus, т.е. искусство блефа

Мы никогда не выиграем в покер, если не умеем блефовать. Вот почему компьютеры долгое время были в нем слабее людей. Libratus все изменил. В январе 2017 года он победил четырех лучших игроков в покер в 20-дневном марафоне „Brains Vs. Artificial Intelligence: Upping the Ante” в казино River в Питтсбурге. Играя, он учился не на их ошибках, а на пробелах в своей собственной системе, раскрывающих стратегию их ходов.

- Способность искусственного интеллекта думать стратегически на основе неполных данных превзошла способности лучших игроков - прокомментировал Туомас Сандхольм, профессор компьютерных наук в Университете Карнеги-Меллона и один из создателей Libratus.

Прогресс? Очень большой! В любой сфере, где информация является неполной или где противник пытается дезинформировать. Например, во время деловых переговоров, планировании терапии, кибербезопасности или в армии.

- В будущем ваш смартфон сможет предложить вам новую машину по лучшей цене. «И это только начало», - сказал Франк Пфеннинг, руководитель факультета компьютерных наук CMU.

Источник: https://www.sztucznainteligencja.org.pl/portfolio/2017-libratus-czyli-sztuka-blefu/

2017: ИИ побеждает ИИ в шахматах

Программа AlphaZero, разработанная Google, победила Stockfish 8 в шахматах, программу, выигравшей в 2016 году чемпионат мира по компьютерным шахматам. Stockfish 8 проиграл, несмотря на доступ к вековым достижениям человека по шахматам и десятилетиям компьютерного опыта, и несмотря на то, что одновременно он был в состоянии разработать 70 миллионов позиций в секунду.

В то время AlphaZero разработала всего 80 000 позиций, а создатели программы не научили ее ни шахматным стратегиям, ни даже стандартным дебютам. Вместо этого она использовала машинное обучение, играя против самой себе.

В 100 партиях AlphaZero против Stockfish 8, разыгранных 17 декабря 2017 года, новичок ни разу не проиграл ни одной игры: он выиграл 28 и 72 раза сыграл вничью. Ему потребовалось четыре часа, чтобы достичь такой уровень.

Источник: https://www.sztucznainteligencja.org.pl/portfolio/2017-si-wygrywa-z-si-w-szachy%e2%80%a8/

2019: кубик Рубика за секунду

Глубокая нейронная сеть DeepCubeA, созданная учеными из Калифорнийского университета, собрала кубик Рубика за 1,2 секунды, т.е. почти в три раза быстрее, чем самый опытный человек. В среднем ей требовалось около 28 движений (человеку - в среднем 50 движений). Тогда рекордсменом по кубику Рубика был китаец Юшэн Ду. Он собрал кубик за 3,47 секунды.

DeepCubeA был обучен с использованием подкрепления на основе 10 миллиардах комбинаций, благодаря чему он мог выбрать самую быструю стратегию размещения куба. Кубик Рубика совмещает 43 252 003 274 489 856 000 комбинаций, т.е. более 43 триллионов. 

Алгоритмы ИИ, используемые в сборке кубика Рубика, можно использовать везде, где необходимо найти самый быстрый путь для решения проблемы, например, в робототехнике или для прогнозирования белковых структур, на основе которых фармацевты создают новые лекарства.

Успех создателей DeepCubeA был описан на страницах журнала Nature Machine Intelligence 15 июля 2019 года.

Источник: https://www.sztucznainteligencja.org.pl/portfolio/2019-kostka-rubika-sekunde/