Modelos de linguagem treinados com dados gerados por outras IAs podem herdar características da inteligência artificial original por meio de sinais ocultos nos conteúdos, incluindo “tendências malignas”. É o que aponta um estudo publicado na plataforma arXiv, na última terça-feira (22). De acordo com a investigação feita pelo grupo de pesquisa de segurança Truthful AI

Software
keyboard_arrow_up