dc.contributor.advisor | Maia, Luiz Cláudio Gomes | |
dc.contributor.author | Brito, Edeleon Marcelo Nunes | |
dc.date.accessioned | 2022-08-17T20:43:25Z | |
dc.date.available | 2022-08-17T20:43:25Z | |
dc.date.issued | 2017 | |
dc.identifier.uri | https://repositorio.fumec.br/xmlui/handle/123456789/939 | |
dc.description | Trabalho inserido conforme recebido do autor, sem ata da banca/folha de aprovação com as devidas assinaturas. | |
dc.description.abstract | Os avanços nas técnicas de análise automática de documentos possibilitaram o reconhecimento
de aspectos subjetivos em textos extraídos de mídias sociais. O objetivo deste trabalho foi
implementar um modelo de sistema para classificar automaticamente sentimentos em bases
textuais escritas em Português do Brasil, utilizando os conceitos da aprendizagem de máquina.
O trabalho apresenta, ainda, uma revisão bibliográfica e documental sobre os conceitos gerais da
mineração de textos, técnicas de pré-processamento e classificadores de opiniões. Foi também
realizada uma revisão sistemática de literatura com o objetivo de estabelecer as principais
técnicas, algoritmos e métricas utilizados na análise de sentimentos. A fim de guiar esta pesquisa,
adotou-se o método design science research (DRS). O paradigma DSR é apropriado para orientar
a condução de pesquisas científicas em gestão, tecnologia e sistemas de informação. Utilizando
a DSR, gera-se conhecimento no processo de concepção de artefatos, no caso desta pesquisa,
o modelo concebido de análise de sentimentos. Complementa-se esta escolha metodológica
com dois experimentos, bem como a utilização do classificador supervisionado Naïve Bayes,
implementado a partir do Natural Language ToolKit. Os resultados demonstraram que, no
geral, o desempenho do método proposto neste trabalho, para analisar mais de duas polaridades
utilizando a técnica de classificação, foi inferior ao das outras ferramentas que testam apenas
duas polaridades. Ainda que os resultados não tenham sido expressivos, com relação à acurácia
da ferramenta, os achados mostraram que há um grande caminho a percorrer no que diz respeito
ao tratamento de dados, especificamente para a língua portuguesa. Este trabalho contribui, então,
em grande parte, para a viabilização de trabalhos futuros em mineração de textos para a língua
portuguesa utilizando módulos de reconhecimento de entidades linguísticas. Espera-se que a
pesquisa possa subsidiar propostas de sistemas de tratamento automático de textos publicados
em mídias sociais independentemente do domínio de negócio. | pt_BR |
dc.description.abstract | Advances in the techniques of automatic document analysis enabled the subjective aspects
recognition in texts extracted from social media. The objective of this work is to implement a
system model to automatically classify feelings, in textual bases, written in Brazilian Portuguese
language, using the machine learning concepts. The research also presents a bibliographical and
documentary review on the general text mining concepts, preprocessing techniques and opinions
classifiers. A systematic literature review was also carried out with the objective of establishing
the main techniques, algorithms and metrics used in the feelings analysis. In order to guide
this research, the design science research (DRS) method was adopted. The DSR paradigm is
appropriate to guide the scientific research conduct in management, technology and information
systems. Using DSR, knowledge in the artifact design process is generated, in the case of this
research, the designed feeling analysis model. This methodological choice is complemented by
two experiments, as well as the use of the Naïve Bayes supervised classifier, implemented from
the Natural Language ToolKit. The results showed that generally the performance of the method
proposed in this work, to analyze more than two polarities, using the classification technique is
inferior to the other tools that test only two polarities. Although the results were not expressive,
with respect to the tool accuracy, the findings showed that there is a long way ahead to go in
regards to data processing, specifically for Portuguese language. This work contributes, in large
part, to the feasibility of future work on text mining for the Portuguese language using modules
for the linguistic entities recognition. It is hoped that the research may support proposals for
systems of automatic treatment of texts published in social media independent of the business
domain. | pt_BR |
dc.language.iso | pt | pt_BR |
dc.rights | Acesso aberto | pt_BR |
dc.subject | Processamento de linguagem natural (Computação) | pt_BR |
dc.subject | Mineração de dados (Computação) | pt_BR |
dc.subject | Lingüística | pt_BR |
dc.title | Mineração de textos: detecção automática de sentimentos em comentários nas mídias sociais | pt_BR |
dc.type | Dissertation | pt_BR |
dc.publisher.program | Mestrado em Sistemas de Informação e Gestão do Conhecimento | pt_BR |
dc.publisher.initials | FUMEC | pt_BR |
dc.publisher.departament | Faculdade de Ciências Empresariais | pt_BR |