No processo de preparação dos dados, são os humanos que etiquetam os modelos, como palavras, imagens e voz, para que a máquina possa aprender a identificá-los corretamente. Isso é crucial para a detecção de padrões de informação nesses conjuntos de dados etiquetados104. Isso significa que os dados possuem etiquetas indicando seu gênero, espécie e subespécies, ajudando o sistema a realizar classificações precisas com base nos exemplos já conhecidos105. Nesse método, existe, portanto, a intervenção humana para guiar a máquina, e o nível de autonomia do sistema implicado é menor. O aprendizado não supervisionado (unsupervised learning), por sua vez, trabalha com dados que não possuem rótulos. O objetivo é encontrar estruturas ou padrões ocultos nos dados. Nesse modelo, também conhecido como autoaprendizado, o algoritmo analisa os dados para extrair regras gerais e selecionar as características que achar mais relevantes para resolver um problema específico, descartando as informações menos importantes. No aprendizado não-supervisionado, o algoritmo trabalha com dados que não foram previamente etiquetados ou classificados por humanos; ele os analisa por conta própria para encontrar padrões ou semelhanças. Por exemplo, ao organizar uma biblioteca, um algoritmo não supervisionado agruparia os livros com base nas similaridades que detecta nos dados, como estilo de escrita ou frequência de certas palavras, sem intervenção humana. Isso significa que o algoritmo está “auto-organizando” os dados conforme critérios internos que ele desenvolve, sem intervenção humana. A essência desse tipo de aprendizado é justamente sua capacidade de auto-organização, onde o sistema encontra estrutura nos dados – sem que haja a necessidade de um resultado específico para que o seu desempenho possa ser avaliado106. 104 Por exemplo, no reconhecimento de linguagem natural e na análise de documentos jurídicos como sentenças, denúncias, pareceres ou petições, o aprendizado supervisionado é usado. Aqui, os algoritmos aprendem as correlações entre palavras ou frases para extrair regras específicas dentro de um contexto jurídico. Depois que o sistema aprende que certas combinações de palavras seguem determinadas regras, ele pode aplicar esse conhecimento para classificar novos exemplos, usando dados previamente aprovados e etiquetados por humanos. Uma utilização corriqueira de aprendizado supervisionado são a classificação de e-mails como “spam” ou “não spam”. Learned-Miller, Erik. Introduction to Supervised Learning. Artigo de 17 fev. 2014 para a University of Massachusetts. Disponível em: https://People.cs.umass.edu/~elm/Teaching/Docs/ supervised2014a.pdf. Acesso em: maio 2024. 105 Idem. 106 Vejam-se mais detalhes em Corvalán, Dávila e Simari, 2023, pp. 55-56.
Alessandro Casoretti Lavorante
Prof. Me. pela USP
Advogado especializado em Direito Digital, IA e Startups. Mestre em Direito Civil pela USP. Autor do livro "Responsabilidade Civil por Inteligência Artificial".