Aprendizado por reforço

843 palavras 4 páginas

Aprendizado por Reforço

André Felipe Rodrigues1, Adauto Mendes1, Wesley Ferreira de Carvalho1

1Departamento de Ciência da Computação – Universidade Federal de Lavras (UFLA)
Caixa Postal 3037 – 37200-000 – Lavras – MG – Brasil

{afelipe@hotmail.com, , wesley.fc@bol.com.br}

Resumo. Este artigo descreve uma visão geral sobre umas das mais importantes áreas da Inteligência Artificial (IA): a Aprendizagem por Reforço (AR). A Aprendizagem por Reforço preocupa-se com o problema de um agente aprender, por tentativa e erro, a atingir um objetivo interagindo com o seu ambiente. O ambiente lhe fornece um reforço (recompensa ou punição). A AR utiliza algoritmos, dentre os quais se destaca o Q-Learning. Dentre as inúmeras aplicações da AR, será explanado neste artigo os resultados obtidos por (Horewicz et al., 2006) e (Coelho, 2008) em jogos, mais especificamente no Jogo Da Velha e no Futebol de Robôs, respectivamente. Para um melhor entendimento da IA aplicada à jogos será feita uma breve descrição do conhecido algoritmo MiniMax.

Abstract. This article describes a....

1. Introdução

Conforme [1], o aprendizado é a aquisição de conceitos e de conhecimentos estruturados. O estudo do aprendizado pela máquina é uma área fundamental da Inteligência Artificial (IA). O aprendizado pode ocorrer com ou sem a presença de um tutor, ou seja, de um professor. O aprendizado supervisionado caracteriza-se pela orientação de um tutor na aquisição dos conceitos e de conhecimentos estruturados enquanto que o aprendizado não-supervisionado ocorre apenas em função dos estímulos primitivos, não existindo a figura do tutor na aprendizagem. Um dos mecanismos empregados no processo de aprendizagem é o de punição e recompensa, onde as tentativas e os erros são disciplinados por um supervisor, que fornece ao aprendiz um sinal de retorno na forma de punição ou recompensa dependendo das ações certas ou erradas executadas pelo

Relacionados

Aprendizado por reforço
546 palavras | 3 páginas

Centro Universitário Plínio Leite Inteligência Artificial Aprendizado por Reforço Vinícius Matos Índice  Apresentação;  Aprendizado;  Aprendizado por reforço;  Definição;  Case : Jogo da Velha;   AR x Min-Max; AR1 x AR2;  Conclusões;  Referências;  Agradecimentos; Aprendizado  Aquisição de conceitos e conhecimentos estruturados;  Pode ocorrer com ou sem presença de tutor;  O estudo do aprendizado pela máquina, é fundamental área da IA;  Pode usar o mecanismo….

exibir mais
Ia - aprendizado por reforço
509 palavras | 3 páginas

Centro Universitário Plínio Leite Inteligência Artificial Aprendizado por Reforço Vinícius Índice Apresentação; Aprendizado; Aprendizado por reforço; Definição; Case : Jogo da Velha; AR x Min-Max; AR1 x AR2; Conclusões; Referências; Agradecimentos; Aprendizado Aquisição de conceitos e conhecimentos estruturados; Pode ocorrer com ou sem presença de tutor; O estudo do aprendizado pela máquina, é fundamental área da IA; Pode usar o mecanismo de punição e recompensa, no processo, onde….

exibir mais
EDUCAÇÃO ALIMENTAR NO ENSINO FUNDAMENTAL: a palestra e o jogo educativo como reforços para o aprendizado nutricional
13156 palavras | 53 páginas

embora ele seja, sem dúvida, um elemento essencial. Trabalhar a educação alimentar é de extrema importância na idade escolar , porque aí é que se estabelecem as bases do aprendizado. É na faixa etária 6 a 12 escolar que a criança toma contacto com grande número de alimentos e preparações novas, fazendo seu aprendizado básico e fixando preferências permanentes, decorrentes daí a importância de como se estabelecem essas preferências (ORNELLAS, 1995). Sendo assim, o objetivo deste trabalho….

exibir mais
Aprendizagem de máquina
1797 palavras | 8 páginas

RESUMO Neste trabalho é feito um estudo sobre os conceitos básicos de aprendizado de máquina em inteligência artificial. A pesquisa é iniciada com uma breve fundamentação e é concluída nos três fundamentos do aprendizado: supervisionado, não-supervisionado e por reforço. IV ABASTRACT This paper presents a study on the basics of machine learning in artificial intelligence. The research begins with a brief reason and is completed with the three foundations of learning: supervised, unsupervised….

exibir mais
Psicologia
3318 palavras | 14 páginas

...................................................... 7 Condicionamento Clássico ......................................................... 10 Condicionamento Operante ........................................................ 11 Importância do Reforço .............................................................. 12 Aprendizagem Vicariante ........................................................... 14 Importância da modelação ......................................................... 15 As Teorias….

exibir mais
Aprendizado de Maquina
1895 palavras | 8 páginas

para nos incentivar. As nossas famílias, eternas e sólidas bases. III RESUMO Neste trabalho é feito um estudo sobre os conceitos básicos de aprendizado de máquina em inteligência artificial. A pesquisa é iniciada com uma breve fundamentação e é concluída nos três fundamentos do aprendizado: supervisionado, não-supervisionado e por reforço. IV ABASTRACT This paper presents a study on the basics of machine learning in artificial intelligence. The research begins with a brief reason….

exibir mais
WhiteTxt
21321 palavras | 86 páginas

é para fazer isso em uma festa, mas em aulas normais, tornar isso comum”, diz. “Alguém sentado no fundo da sala inspira mais respeito ao ambiente de aprendizado, parece que os estudantes pensam ‘vieram ouvir porque isso é importante’. Se alguém vai falar ao lado do professor a mensagem é ‘estão tão interessados em que eu aprenda que trouxeram reforço’” . 2) Checar os objetivos O que os estudantes devem aprender ao final desta aula? E para a vida? Como uma coisa levará a outra? A educadora e autora….

exibir mais
galatas
847 palavras | 4 páginas

aprender ao observarem o que acontece com os outros e ao ouvirem alguma coisa, tanto quanto pela experiência. O comportamernto é uma função de consequencias, também reconhece a existência da aprendizagem observacional e a importância da percepção no aprendizado. Veremos adiante processos nos programas de treinamento de funcionários: 1. Processo de atenção: As pessoas aprendem com um modelo apenas quando reconhecem e prestam atençaõ ás suas características críticas. Ser mais influenciados….

exibir mais
Teoria Behaviorista
1036 palavras | 5 páginas

através de reforço diferencial e aproximações sucessivas. É onde a resposta gera uma consequência e esta consequência afeta a sua probabilidade de ocorrer novamente; se a consequência for reforçadora, aumenta a probabilidade, se for punitiva, além de diminuir a probabilidade de sua ocorrência futura, gera outros efeitos colaterais. Este tipo de comportamento que tem como consequência um estímulo que afete sua frequência é chamado “Comportamento Operante”. Os exemplos englobam o reforço positivo e….

exibir mais
Análise de swot
1251 palavras | 6 páginas

Atendimento privilegiado com poucos alunos em sala de aula. - Equipe bem treinada e motiva. - Empresa familiar OPORTUNIDADES - Poucos concorrentes na região ou péssimo trabalho dos mesmos. - Quantidade elevada de alunos precisando de aulas de reforço e acompanhamento psicopedagógico PONTOS FRACOS FRAQUEZAS - Custos elevados de investimento: redimensionar o investimento inicial e/ou buscar novas fontes de financiamento. - Espaço físico reduzido. - Pouco clientes nos tempos de férias….

exibir mais

Outros Trabalhos Populares