Mostrar registro simples

dc.contributor.advisorMaia, Luiz Cláudio Gomes
dc.contributor.authorBrito, Edeleon Marcelo Nunes
dc.date.accessioned2022-08-17T20:43:25Z
dc.date.available2022-08-17T20:43:25Z
dc.date.issued2017
dc.identifier.urihttps://repositorio.fumec.br/xmlui/handle/123456789/939
dc.descriptionTrabalho inserido conforme recebido do autor, sem ata da banca/folha de aprovação com as devidas assinaturas.
dc.description.abstractOs avanços nas técnicas de análise automática de documentos possibilitaram o reconhecimento de aspectos subjetivos em textos extraídos de mídias sociais. O objetivo deste trabalho foi implementar um modelo de sistema para classificar automaticamente sentimentos em bases textuais escritas em Português do Brasil, utilizando os conceitos da aprendizagem de máquina. O trabalho apresenta, ainda, uma revisão bibliográfica e documental sobre os conceitos gerais da mineração de textos, técnicas de pré-processamento e classificadores de opiniões. Foi também realizada uma revisão sistemática de literatura com o objetivo de estabelecer as principais técnicas, algoritmos e métricas utilizados na análise de sentimentos. A fim de guiar esta pesquisa, adotou-se o método design science research (DRS). O paradigma DSR é apropriado para orientar a condução de pesquisas científicas em gestão, tecnologia e sistemas de informação. Utilizando a DSR, gera-se conhecimento no processo de concepção de artefatos, no caso desta pesquisa, o modelo concebido de análise de sentimentos. Complementa-se esta escolha metodológica com dois experimentos, bem como a utilização do classificador supervisionado Naïve Bayes, implementado a partir do Natural Language ToolKit. Os resultados demonstraram que, no geral, o desempenho do método proposto neste trabalho, para analisar mais de duas polaridades utilizando a técnica de classificação, foi inferior ao das outras ferramentas que testam apenas duas polaridades. Ainda que os resultados não tenham sido expressivos, com relação à acurácia da ferramenta, os achados mostraram que há um grande caminho a percorrer no que diz respeito ao tratamento de dados, especificamente para a língua portuguesa. Este trabalho contribui, então, em grande parte, para a viabilização de trabalhos futuros em mineração de textos para a língua portuguesa utilizando módulos de reconhecimento de entidades linguísticas. Espera-se que a pesquisa possa subsidiar propostas de sistemas de tratamento automático de textos publicados em mídias sociais independentemente do domínio de negócio.pt_BR
dc.description.abstractAdvances in the techniques of automatic document analysis enabled the subjective aspects recognition in texts extracted from social media. The objective of this work is to implement a system model to automatically classify feelings, in textual bases, written in Brazilian Portuguese language, using the machine learning concepts. The research also presents a bibliographical and documentary review on the general text mining concepts, preprocessing techniques and opinions classifiers. A systematic literature review was also carried out with the objective of establishing the main techniques, algorithms and metrics used in the feelings analysis. In order to guide this research, the design science research (DRS) method was adopted. The DSR paradigm is appropriate to guide the scientific research conduct in management, technology and information systems. Using DSR, knowledge in the artifact design process is generated, in the case of this research, the designed feeling analysis model. This methodological choice is complemented by two experiments, as well as the use of the Naïve Bayes supervised classifier, implemented from the Natural Language ToolKit. The results showed that generally the performance of the method proposed in this work, to analyze more than two polarities, using the classification technique is inferior to the other tools that test only two polarities. Although the results were not expressive, with respect to the tool accuracy, the findings showed that there is a long way ahead to go in regards to data processing, specifically for Portuguese language. This work contributes, in large part, to the feasibility of future work on text mining for the Portuguese language using modules for the linguistic entities recognition. It is hoped that the research may support proposals for systems of automatic treatment of texts published in social media independent of the business domain.pt_BR
dc.language.isoptpt_BR
dc.rightsAcesso abertopt_BR
dc.subjectProcessamento de linguagem natural (Computação)pt_BR
dc.subjectMineração de dados (Computação)pt_BR
dc.subjectLingüísticapt_BR
dc.titleMineração de textos: detecção automática de sentimentos em comentários nas mídias sociaispt_BR
dc.typeDissertationpt_BR
dc.publisher.programMestrado em Sistemas de Informação e Gestão do Conhecimentopt_BR
dc.publisher.initialsFUMECpt_BR
dc.publisher.departamentFaculdade de Ciências Empresariaispt_BR


Arquivos deste item

Thumbnail

Este item aparece na(s) seguinte(s) coleção(s)

Mostrar registro simples