Pesquisadores da Universidade Heriot-Watt, em colaboração com a Alana AI, desenvolveram um busto robótico inovador que não só conversa, mas também exibe expressões faciais. Esta maravilha da tecnologia une o poder do GPT-3.5, a inteligência por trás do ChatGPT, a uma cabeça robótica humanoide, conhecida como Furhat, que é responsável por suas expressões faciais.
A interação verbal é facilitada por um sistema chamado FurChat. O projeto foi detalhadamente documentado em um artigo pré-publicado no arXiv e também foi destaque no site Tech Xplore.
Objetivos e Metas do Projeto
O núcleo da pesquisa visava introduzir conversas contextualizadas utilizando Modelos de Linguagem de Grande Escala (LLMs). O Dr. Oliver Lemon, um dos principais pesquisadores envolvidos, explicou ao Tech Xplore: "Nosso foco estava em explorar aspectos multifacetados da IA integrada para interações autênticas com seres humanos. Estávamos particularmente curiosos para harmonizar a capacidade de diálogos abertos do LLM, como vistos no ChatGPT, com informações mais direcionadas e pertinentes."
A reação verbal e as expressões faciais geradas pelo agente conversacional são ambas resultados do modelo GPT-3.5, que posteriormente são expressas tanto verbalmente quanto fisicamente pelo robô Furhat.
Dr. Lemon destaca: “Este é, até onde sabemos, o primeiro sistema que integra LLMs para diálogos universais e fontes de dados específicos juntamente com animações robóticas automáticas e expressivas."
Teste em Ambiente Real
Para mensurar a eficácia do FurChat, um experimento foi realizado com usuários humanos no National Robotarium do Reino Unido, localizado na Escócia. Durante este teste, o robô interagiu com os visitantes, fornecendo detalhes sobre a instalação, projetos de pesquisa em andamento, futuros eventos e muito mais.
Os feedbacks iniciais após a interação com o sistema FurChat foram positivos, com o robô mostrando-se competente em oferecer comunicação fluente e informativa. Estes resultados promissores sugerem um futuro onde agentes IA equipados com LLM podem ser vistos em espaços públicos, museus, festivais, e outras localidades, enriquecendo a experiência do usuário e fornecendo informações valiosas.
Escrito por: