Algoritmo CO-Training
CO-Training
Introdução o Aprendizado de Máquina o Aprendizado Multi-Visão o Aprendizado Semi-supervisionado
O Problema Inicial
• Classificadores precisam de dados rotulados
– Mas rotular dados é caro
– Rotular um grande volume de dados manualmente não é viável
– Pode exigir conhecimento especializado
CO-Training
• Objetivo
Incrementar o número de exemplos rotulados para melhorar a performance de aprendizagem de máquina supervisionado, quando o número original de exemplos rotulados não é suficientes para um bom aprendizado.
CO-Training
• Exemplos de Multi-visão
“É possivel construir um classificador para identificar spam usando o texto contido no campo assunto das mensagens ou usando o texto contido no corpo das mensagens”
CO-Training
CO-Training
CO-Training
Considerações Finais
• Encontrar base de dados reais com um número significativo de exemplos rotulados, é cada vez mais difícil, se não impossível.
• CO-Training tenta solucionar o problema rotulando exemplos a partir de poucos exemplos rotulados • E esses exemplos rotulados podendo ser utilizados por qualquer algoritmo de aprendizagem supervisionada.
Referências
BRAGA, I. A.; MATSUBARA, E. T.; MONARD, M. C. Um Estudos sobre a Rotulação de Exemplos no
Aprendizado Semi-supervisionado Multi-visão. Instituto de Ciências Matemáticas e de
Computação, Universidade de São Paulo, USP. p. 1059-1068. Disponível em: http://www.lbd.dcc.ufmg.br/colecoes/enia/2009/044.pdf BRAGA, I. A. Aprendizado Semissupervisionado Multidescrição em Classificação de Textos. 2010.
105 f. Dissertação (Mestrado em Ciências da Computação) – Instituto de Ciências Matemáticas e de
Computação, Universidade de São Paulo, USP, São Carlos, São Paulo. Disponível em: http://www.bv.fapesp.br/pt/dissertacoes-teses/80226/aprendizado-semissupervisionadomultidescricao-em-classifica/ BLUM, A. MITCHELL, T. Combining Labeled and Unlabeled Data With CO-Training. 11th