Weka

Disponível somente no TrabalhosFeitos
  • Páginas : 55 (13740 palavras )
  • Download(s) : 0
  • Publicado : 2 de novembro de 2012
Ler documento completo
Amostra do texto
CENTRO UNIVERSITÁRIO FEEVALE

SIDINEI PEREIRA GONCHOROSKI

UTILIZAÇÃO DE TÉCNICAS DE KDD EM UM CALL CENTER ATIVO

Novo Hamburgo, junho de 2007.

SIDINEI PEREIRA GONCHOROSKI

UTILIZAÇÃO DE TÉCNICAS DE KDD EM UM CALL CENTER ATIVO

Centro Universitário Feevale Instituto de Ciências Exatas e Tecnológicas Curso de Ciência da Computação Trabalho de Conclusão de Curso

ProfessorOrientador: Juliano Varella Carvalho

Novo Hamburgo, junho de 2007.

AGRADECIMENTOS

Gostaria de agradecer a todos os que, de alguma especial: Aos amigos, família e meu orientador Juliano Varella de Carvalho. maneira, contribuíram para a realização desse trabalho de conclusão, em

RESUMO

Os Call Centers Ativos possuem estrutura para realizar campanhas de telemarketing ou vendas através dotelefone e são boas alternativas para que as empresas aumentem seu número de clientes. No entanto, as empresas do ramo de atendimento podem não explorar e aproveitar da melhor maneira o conhecimento nas bases de dados. Podem ainda não identificar o melhor perfil de vendas ou ter dificuldade em criar uma estratégia para aumentar o desempenho da produção. Através do processo de descoberta deconhecimento em banco de dados (KDD) é possível identificar regras e padrões válidos aplicando as técnicas e algoritmos de mineração de dados. Sendo assim, esse trabalho apresenta o problema detalhado do Call Center, KDD com suas técnicas e algoritmos, dando ênfase principalmente às árvores de classificação e o software Weka. Por fim, é feita uma breve introdução do estudo de caso, quais técnicasserão utilizadas e como será realizada validação dos resultados. Palavras-chave: Descoberta de Conhecimento. Técnicas de Mineração de Dados. Weka. Algoritmos de Mineração de Dados. Call Center Ativo.

ABSTRACT

The Outbound Call Center companies have structures to carry out sales or telemarketing campaigns through telephone, which are, good alternatives for companies to increase the number ofcostumers. However, these companies may not explore and use their databases records in the best way. Also, may not identify the best sales profiles or have difficulty in creating a strategy to increase the production performance. Through the discovery process of knowledge in databases (KDD), it is possible to identify rules and valid patterns applying the techniques and algorithms of data mining.Therefore, this assignment presents the Call Center problem in details, KDD techniques and algorithms, giving emphasis to the classification trees and Weka software. Finally, a brief introduction of the study case is made, which techniques will be used and how it will carry out the validation of the results. Key words: Knowledge Discovery. Data Mining techniques. Weka. Algorithms of DataMining. Active Call Center.

LISTA DE FIGURAS

Figura 1.1 – Tipos de atributos de uma tabela mailing em um Banco de Dados __________ 20 Figura 2.1 – O processo de KDD ______________________________________________ 28 Figura 2.2 – Representação de 3 Clusters gerado com a técnica ______________________ 35 Figura 2.3 – Representação da Linha de Regressão ________________________________ 36 Figura2.4 – Regressão linear do valor de renda e valor de título adquirido _____________ 37 Figura 3.1 – Arquivo .arff do Weka ____________________________________________ 39 Figura 3.2 – Algoritmo Apriori _______________________________________________ 42 Figura 3.3 – Função Apriori-gen ______________________________________________ 44 Figura 3.4 – Algoritmo ID3__________________________________________________ 47 Figura 3.5 – Função da Entropia ______________________________________________ 48 Figura 3.6 – Árvore gerada através do algoritmo ID3 ______________________________ 49 Figura 3.7 – Árvore sem poda e árvore com poda _________________________________ 51 Figura 3.8 – Expressão do Ganho de Informação _________________________________ 52 Figura 3.9 – Pseudocódigo algoritmo C4.5...
tracking img