Mineração de textos: identificando tendências no mercado de ações por meio dos sentimentos extraídos de notícias publicadas na internet
Data
2018Autor
Andrade, Freise Wanderson Gonçalves de
xmlui.mirage2.itemSummaryView.MetaData
Mostrar registro completoResumo
No mercado contemporâneo de ações, notícias publicadas sobre determinada
empresa podem influenciar o preço de suas ações na bolsa de valores, ainda que de
forma rápida e meramente especulativa. Dessa forma, um investidor tentando
minimizar perdas e maximizar ganhos procura informações referentes a empresas
das quais possui ações em diversas fontes como sites de notícias, balanços,
gráficos, relatórios, entre outras, porém, essa tarefa pode tomar muito tempo ao ser
executada por uma pessoa. Com isso a utilização de sistemas de informação tornase
essencial para automatizar essas atividades. Esta pesquisa teve como objetivo
avaliar a precisão de um sistema de informação para identificar a tendência de baixa
ou alta do papel PETR4 da empresa Petróleos do Brasil S/A. (PETROBRAS) na
Bolsa de Mercadorias e Futuros da Bolsa de Valores de São Paulo
(BMF&BOVESPA) por meio da extração dos sentimentos dos feeds de notícias
publicados na internet envolvendo a empresa. Esses sentimentos foram utilizados
como características para os classificadores de aprendizado de máquina. O método
de pesquisa seguiu o Design Science Research como forma de atenuar o
distanciamento entre teoria e prática. No desenvolvimento da pesquisa foi possível
medir o sentimento expressado por meio das notícias publicadas na internet e
verificou-se que, apesar de as notícias terem a capacidade de influenciar as ações
dos investidores e com isso exercerem efeitos importantes sobre o mercado de
ações, avaliar o movimento do mercado somente por meio dos sentimentos
carregados nas notícias mostrou-se ser uma tarefa complexa. Utilizando-se do
corpus de notícias construído no desenvolvimento deste trabalho foi obtida precisão
de 72% na identificação de tendências do papel PETR4 utilizando o classificador
Naive Bayes. Apesar, porém, dos 72% de precisão na identificação de tendências
alcançados no experimento, percebe-se que a abordagem para utilizar os
sentimentos carregados pelas notícias enfrenta uma série de desafios, como
compreender os fundamentos e a variação do impacto que essas notícias exercem
sobre os investidores ao longo do tempo. In the contemporary stock market, news about a particular company can influence
the price of their shares on the stock market, albeit quickly and merely speculatively.
In this way an investor trying to minimize losses and maximize gains looks for
information about companies that have actions in various sources such as news
sites, balance sheets, charts, reports among others, but this task can take a lot of
time to be executed by a person, with this the use of information systems becomes
essential to automate these activities. This research aimed to evaluate the accuracy
of an information system to identify the low or high tendency of Petróleos do Brasil
S/A. (PETROBRAS) in the Bolsa de Mercadorias e Futuros da Bolsa de Valores de
São Paulo (BMF&BOVESPA) through the extraction of the feelings of news feeds
published on the Internet involving the company, these feelings were used as
characteristics for machine learning classifiers. The research method followed the
Design Science Research method as a way to mitigate the gap between theory and
practice. In the development of the research it was possible to measure the
sentiment expressed through the news published on the internet and it was verified
that although the news had the capacity to influence the actions of the investors and
with that they had important effects on the stock market, to evaluate the movement of
the only through the feelings loaded in the news proved to be a complex task. Using
the corpus of news built in the development of this work, a precision of 72% was
obtained in the identification of PETR4 paper trends using the Naive Bayes classifier.
However, despite the 72% accuracy of trend identification achieved in the
experiment, it is perceived that the approach to use the feelings charged by the news
faces a series of challenges such as understanding the fundamentals and the
variation of the impact that this news has on investors over of time.