Algoritmo CO-Training
CO-Training
Introdução
o Aprendizado de Máquina
o Aprendizado Multi-Visão
o Aprendizado Semi-supervisionado
O Problema Inicial
• Classificadores precisam de dados rotulados
–Mas rotular dados é caro
– Rotular um grande volume de dados
manualmente não é viável
– Pode exigir conhecimento especializado
CO-Training
• Objetivo
Incrementar o número de exemplosrotulados
para melhorar a performance de aprendizagem de máquina supervisionado, quando o
número original de exemplos rotulados não é
suficientes para um bom aprendizado.
CO-Training
• Exemplos deMulti-visão
“É possivel construir um classificador para
identificar spam usando o texto contido no
campo assunto das mensagens ou usando o
texto contido no corpo das mensagens”
CO-TrainingCO-Training
CO-Training
Considerações Finais
• Encontrar base de dados reais com um número
significativo de exemplos rotulados, é cada vez
mais difícil, se não impossível.
•CO-Training tenta solucionar o problema
rotulando exemplos a partir de poucos exemplos
rotulados
• E esses exemplos rotulados podendo ser
utilizados
por
qualquer
algoritmo
de
aprendizagemsupervisionada.
Referências
BRAGA, I. A.; MATSUBARA, E. T.; MONARD, M. C. Um Estudos sobre a Rotulação de Exemplos no
Aprendizado Semi-supervisionado Multi-visão. Instituto de Ciências Matemáticas e deComputação, Universidade de São Paulo, USP. p. 1059-1068. Disponível em:
http://www.lbd.dcc.ufmg.br/colecoes/enia/2009/044.pdf
BRAGA, I. A. Aprendizado Semissupervisionado Multidescrição emClassificação de Textos. 2010.
105 f. Dissertação (Mestrado em Ciências da Computação) – Instituto de Ciências Matemáticas e de
Computação, Universidade de São Paulo, USP, São Carlos, São Paulo. Disponível em:http://www.bv.fapesp.br/pt/dissertacoes-teses/80226/aprendizado-semissupervisionadomultidescricao-em-classifica/
BLUM, A. MITCHELL, T. Combining Labeled and Unlabeled Data With CO-Training. 11th...
Por favor, assinar para o acesso.