A Google está agora trabalhando em uma nova tecnologia de aprendizado de máquina chamado MultiModel. De acordo com a empresa, trata-se de uma rede neural multitarefa incrivelmente inteligente, capaz de aprender várias tarefas complexas.
E qual é a inovação? Mesmo que redes neurais já existam nas mais variadas formas e cores, todas elas “falham” em uma única grande limitação: por melhores que sejam suas capacidades de desempenhar tarefas, elas ainda são capazes de desempenhar uma única tarefa bem.
Porém, no caso do MultiModel, o termo “multitarefa” não poderia ser melhor usado. O sistema é capaz de lidar com oito tarefas diferentes de uma só vez. E não apenas realiza-las, como também fazê-las com incrível precisão e habilidade. Entre as ações simultâneas desempenhadas, temos a detecção de objetos em imagens, geração de legendas, reconhecimento de fala e tradução entre quatro pares de linguagens (bem como sua gramática e sintaxe). Não há como negar que a ideia é poderosa.
Inteligente como nosso cérebro
Segundo a companhia, o segredo para isso está na maneira como o dispositivo foi modelado: na forma de um cérebro humano. Basicamente, ele copia a maneira como pensamos, em que áreas diferentes do órgão analisam e processam informações e estímulos distintos, enquanto todas elas se unem para facilitar nossa compreensão.
Isso, por sua vez, se replica na forma de uma série de sub-redes de áudio, imagem e texto. Todos conectados a uma rede central.
A Google admite que ainda há um longo caminho pela frente com o MultiModel. O sistema, por exemplo, ainda não é tão preciso quanto seria possível trabalhando com redes neurais especializadas trabalhando separadamente. Para a surpresa dos desenvolvedores, a tecnologia não apenas manteve sua performance independe das tarefas simultâneas, como também chegou a apresentar uma melhora em sua performance.
Resta agora esperar para ver se, com o tempo, essa tecnologia realmente apresenta toda a eficiência que parece prometer.