Principal Inovar Google Artificial Intelligence 'Alpha Go Zero' acaba de pressionar Reset para aprender

Google Artificial Intelligence 'Alpha Go Zero' acaba de pressionar Reset para aprender

Seu Horóscopo Para Amanhã

Lembra (vagamente) de como você aprendeu a andar, falar, andar de bicicleta ou dirigir? Foi confuso e cheio de erros, mas as habilidades que você aprendeu assim permaneceram. Fora dos sistemas vivos, tem sido um desafio estruturar algoritmos fortes o suficiente para absorver a 'experiência da vida real' e desenvolver comportamentos pegajosos e adaptáveis ​​para a inteligência artificial.

Bem, Alpha Go Zero simplesmente fez isso.

'Começa de uma folha em branco e descobre apenas por si mesmo, apenas por jogo próprio, e sem qualquer conhecimento humano, ou quaisquer dados humanos, ou características, ou exemplos, ou intervenção de humanos. Ele descobre como jogar o jogo Go a partir dos primeiros princípios ', diz o professor David Silver da DeepMind.

A IA teve várias iterações, cada uma mais inteligente e mais capaz do que a anterior. A versão anterior usava um enorme banco de dados de jogos anteriores junto com um monte de algoritmos que apontavam para a vitória. Essa abordagem levou à derrota do jogador profissional Go, campeão mundial em título. No pôquer, o AI Libratus recentemente eliminou os melhores jogadores de pôquer do mundo em quase $ 2 milhões, também aprendendo por meio do jogo autônomo em vez de dados de jogo humanos.

Agora, nesta última versão do Alpha Go, o programa de inteligência artificial ensinou em si como jogar Go - sem formação humana.

Rodando milhões de simulações de jogo contra si mesmo, levou 40 dias para aprender - do zero - como vencer a versão campeã mundial de si mesmo. Isso é verdadeiramente revolucionário, não apenas para Go, mas também para a forma como novos conhecimentos são descobertos. Quão preciso ou completo é o seu conhecimento de domínio? Há muito mais para descobrir, é o que esta experiência fascinante em aprender com Alpha Go Zero está nos dizendo.

'A ideia de Alpha Go não é sair e derrotar humanos, mas realmente descobrir o que significa fazer ciência - para um programa ser capaz de aprender por si mesmo o que é o conhecimento', de acordo com Silver em um post no YouTube sobre a conquista.

A equipe do Alpha Go Zero Deep Mind chama isso de aprendizado de primeiro princípio, 'tabula rasa' (folha em branco).

'Se você pode alcançar tábua rasa aprendizagem, você tem um agente que pode ser transplantado do jogo Go para qualquer outro domínio, e as especificações do jogo em que você está, você cria um algoritmo que é tão geral que pode ser aplicado em qualquer lugar ', diz ele . Essa é uma ideia provocativa quando você estende o conceito. Pense no que poderíamos fazer com um conjunto de algoritmos de aprendizagem fortes que poderiam resolver sistematicamente problemas difíceis e aprender mais rápido do que o conhecimento coletivo de nossa civilização. . . em dias, não em décadas.

Por enquanto, a grande lição é: 'algoritmos são muito mais importantes do que computação ou dados disponíveis', disse Silver. Isso por si só é uma virada de jogo na forma como abordamos a extensão do mundo conhecido. Embora o Alpha Go funcione com cerca de US $ 25 milhões em hardware - não é exatamente um sistema leve - você sabe que os gurus da IA ​​há muito tempo trabalham na criação de conjuntos de dados melhores e mais limpos. Hoje, muitos conjuntos de big data são considerados muito barulhentos - cheios de dados ruins - para treinar com precisão uma inteligência artificial. Se a IA está aprendendo com os dados e os dados são ruins, ela não aprende. Grande problema.

E se você não precisasse de dados limpos, mas apenas de experiência, e a inteligência artificial pudesse se treinar?

Essa é a conquista emocionante em Alpha Go Zero. Mesmo estando no nicho do mundo dos jogos baseado em regras, tem grandes implicações em todos os setores que trabalham com regras físicas - pense em química, tráfego, biologia, farmacologia, viagens, logística e manufatura. Se pudermos projetar regras tão flexíveis que possam funcionar a partir de uma experiência mais ampla e tão direcionais que sempre criem habilidades mais fortes - como Alpha Go Zero - então será possível obter inteligência artificial que gere sistemas. Esses sistemas não precisariam de dados externos, não teriam problemas de limpeza de dados e não precisariam de lentidão humana no circuito. Em parte, é por isso que a empresa controladora do Google, a Alphabet, apostou na inteligência artificial e está investindo em inteligência artificial em um ritmo rápido. (A Amazon também está investindo em inteligência artificial, como sua última aquisição de IA, BodyLabs.)

O professor da Deep Mind David Silver diz, 'o fato de termos visto um programa atingir um desempenho de alto nível ... deve significar que agora podemos começar a enfrentar alguns dos problemas mais desafiadores e impactantes para a humanidade.'

Esta postagem foi atualizada para esclarecer que o AI Libratus derrotou recentemente os melhores jogadores de pôquer usando uma estratégia que envolve o jogo pessoal em vez de dados inseridos por humanos.