revista puc minas

Sistemas de Informação Mineração de dados

IMG_6665

Técnica computacional pode auxiliar instituições em tomadas de decisão e criação de estratégias mais assertivas

“Este trabalho pode ajudar as autoridades a prevenir e combater a criminalidade porque elas terão informação sobre o padrão criminal na região e podem tomar decisões, criar estratégias muito mais direcionadas e assertivas”

Professor Wladmir Cardoso Brandão

Utilizando a técnica da área de informática, denominada mineração de dados, o analista de sistemas Bruno Laporais, que verificou a base de dados da Secretaria de Estado de Defesa Social de Minas Gerais em seu Trabalho de Conclusão de Curso (TCC) de Sistemas de Informação, campus Contagem, chegou a algumas conclusões específicas sobre a criminalidade na Região Metropolitana de Belo Horizonte nos anos de 2012 e 2013: durante o dia, a incidência de roubos é maior que a de furtos; o número de ocorrências de acordo com o período do dia se manteve praticamente o mesmo nos dois anos analisados; os crimes cometidos por pessoas acima de 30 anos têm motivação passional, e os cometidos por pessoas de 19 a 29 anos têm motivação financeira ou relação com o tráfico de drogas; e quando há utilização de arma em roubos, em geral não há lesão corporal, diferentemente do que se imagina. O intuito era identificar características específicas da criminalidade na RMBH nesse período, como os crimes, a quantidade de ocorrências em determinada região, período do dia ou a motivação de acordo com a faixa etária dos autores.

Bruno só conseguiu chegar a essas conclusões com a utilização da mineração de dados, técnica de extração utilizada para reconhecimento de padrões e descoberta de conhecimento por meio da análise de um grande conjunto de dados de maneira automática. “Isso pode ser usado para investigar um conjunto que seria impossível de ser analisado manualmente”, explica o professor Wladmir Cardoso Brandão, do colegiado do Curso de Sistemas de Informação do campus Contagem e pesquisador da área.

“Precisamos aplicar outros algoritmos de mineração de dados para extrair novos padrões, classificações e cruzamentos”

Paula Costa e Silva
IMG_6678

“A mineração de dados nada mais é do que reconhecer padrões dentro de uma grande base de dados que sejam relevantes para tomada de decisões. Ela trata um dado, e a frequência com que ele aparece, e nos retorna alguma informação relevante escondida naquela base”, explica o analista de sistemas.

As análises finais do TCC foram disponibilizadas à Secretaria de Defesa Social para possível utilização do órgão. “Este trabalho pode ajudar as autoridades a prevenir e a combater a criminalidade porque elas terão informação sobre o padrão criminal na região e podem tomar decisões, criar estratégias muito mais direcionadas e assertivas”, defende o orientador.

Um grande desafio enfrentado por diversas instituições é lidar com o grande volume de dados tão comum nos dias atuais. Em meio a tanto conteúdo disponível, não é difícil se perder e não utilizá-lo em sua totalidade, e saber filtrar o que é relevante pode ser a chave para se atingir um objetivo específico.

O conceito não é exatamente uma novidade. Desde a década de 1970 já se falava em sistemas de apoio a tomadas de decisão aplicadas, sobretudo, a bases de dados restritas e privadas. Mas foi com o advento da internet, nas décadas de 1980 e 1990, que a ideia começou a ganhar força, dado o grande volume de dados gratuitos e de fácil acesso à rede. Com a grande oferta e a possibilidade de agrupá-los, a ferramenta mineração de dados permite aplicabilidade no mercado em diversas áreas. “Porque você tem um conjunto de informações e conhecimento mais adequado para se tomar uma decisão mais assertiva”, explica o professor.

“A mineração de dados nada mais é do que reconhecer padrões dentro de uma grande base de dados que sejam relevantes para tomada de decisões”

Bruno Laporais
IMG_6678x

O procedimento da mineração de dados consiste no tratamento da origem das informações, para que se tornem uma base de dados multidimensional e facilite a visão perspectiva delas. A partir dessa base, um conjunto de dados específico é gerado, são os chamados datasets. “Esses datasets contêm características daquele subconjunto. Por exemplo, se eu estiver pesquisando a autoria dos crimes, vou ter um conjunto de dados sobre autores. Se buscar por envolvidos, vou ter um conjunto sobre essa categoria”, explica Bruno. A partir dos datasets, algoritmos de mineração de dados podem ser aplicados para fazer com que padrões emerjam da base analisada na forma de regras de associação, por exemplo.

Baseando-se nesse conceito, dois TCCs desenvolvidos no curso no último semestre, ambos orientados pelo professor e pesquisador, aplicaram a técnica e analisaram o repositório de dados de grupos bem distintos.

Mercado de trabalho

Paula Costa e Silva utilizou técnica similar em um contexto de perfil profissional. Na pesquisa por ela produzida, para analisar o direcionamento de carreira dos egressos dos cursos da área de Tecnologia da Informação nos vários campi e unidades acadêmicas da PUC Minas, a estudante analisou dados coletados do LinkedIn, uma rede social cujo objetivo é estabelecer relações de negócios entre os usuários. “A metodologia consiste na extração de dados, processamento dos perfis profissionais e extração de regras de associação”, resume a autora.

Entre os resultados obtidos, alguns já eram esperados, como a informação de que a maioria dos egressos trabalha como analista de sistemas em Belo Horizonte nas áreas de Tecnologia da Informação e Serviços. “Mas também descobrimos alguns resultados interessantes, como incidência de atuação no exterior, as principais empresas que contratam os ex-alunos da Universidade e um significativo número de pessoas que seguem carreira acadêmica”, relata. Como trabalhos futuros, Paula pensa em otimizar as técnicas de coleta e ampliar o trabalho para outros cursos e regiões. “Precisamos aplicar outros algoritmos de mineração de dados para extrair novos padrões, classificações e cruzamentos”, diz.

Aplicação nas universidades

Para o professor Wladmir, a técnica pode ser utilizada por instituições de ensino, como a própria Universidade, para entender como os ex-alunos e os alunos atuais estão direcionando suas carreiras e estão sendo aproveitados no mercado. “Isso pode ajudar, por exemplo, a definir a grade curricular; a alterar planos de ensino para adequar o conteúdo às necessidades do mercado; a interferir nos programas de extensão e de estágio, entre outras aplicações”, explica.

 

Pesquisa e mercado

As pesquisas sobre mineração de dados renderam boas oportunidades acadêmicas. O artigo com os resultados da pesquisa de Bruno Laporais foi publicado e apresentado na 11th International Conference Applied Computing, realizada em outubro do ano passado, em Porto, Portugal. Paula Costa e Silva também apresentou, em fevereiro desde ano, o trabalho na eKNOW 2015 (Conference on Information, Process, and Knowledge Management), em Lisboa.Paula ingressou no mestrado em Informática da PUC Minas, enquanto Bruno cursa o mestrado em Ciência da Computação da Universidade Federal de Minas Gerais (UFMG). Ambos estão dando continuidade às pesquisas sobre a área.

Texto
Lívia Arcanjo
Fotos
Marcos Figueiredo
Compartilhe
Fale Conosco
+ temas relacionados