Defesas de Qualificação de Doutorado e Dissertação de Mestrado em Setembro de 2018
Matrícula: 201620080003.
Titulo: "Um Estudo Empírico sobre Fatores que Influenciam Testes de Software em Projetos Distribuídos de Software ".
Orientador: Prof. Dr.Cleidson Ronald Botelho de Souza
Data: 05/09/2018.
Hora: 08h00
Local: LABTIC da Ufpa.
Banca Examinadora:
- Prof. Dr. Cleidson Ronald Botelho de Souza - Orientador (PPGCC/UFPA)
- Prof. Dr. Gustavo Henrique Lima Pinto - Membro Interno (PPGCC/UFPA)
- Prof. Dr. Sandro Ronaldo Bezerra Oliveira - Membro Interno (PPGCC/UFPA)
- Prof. Dr. Carlos dos Santos Portea - Membro Externo (UFPA/CAMPUS CAMETÁ)
- Prof. Dra. Tayana Uchôa Conte - Membro Externo (UFAM)
Resumo
A fase de testes é essencial para qualquer projeto de desenvolvimento de software, e é particularmente crítica em projetos distribuídos de software (DDS), onde testadores e desenvolvedores estão dispersos entre diferentes locais de trabalho e possuem contato e interação presencial limitados. Apesar de existirem diversos estudos e relatos na literatura sobre fatores que podem influenciar o comportamento e desempenho das equipes em projetos DDS, atividades realizadas durante esta pesquisa apontaram para um gap de estudos para entender os fatores relacionados a testes em ambientes de projetos DDS. Neste sentido, neste projeto de tese são descritos os principais resultados obtidos até o momento da investigação empírica conduzida. Na primeira fase exploratória desta pesquisa investigou-se os fatores e o comportamento de projetos DDS baseado em dados de um projeto real e uso de técnicas de simulação de processos. A partir destes resultados iniciais e a identificação do gap na literatura de estudos específicos aos fatores relacionados à testes em projetos DDS através de uma revisão sistemática da literatura, esta pesquisa seguiu para uma fase experimental. A fase experimental foi iniciada com a identificação de fatores na literatura sobre testes em projetos de desenvolvimento de software, e posteriormente foi conduzida a criação de modelos baseado em técnicas de regressão para entender o relacionamento e influência destes fatores em projetos de testes em projetos DDS. Os resultados atuais sugerem mais tempo despendido entre times remotos está correlacionado com o esforço despendido na correção de bugs de um release do projeto. espera-se que os modelos criados possam ser reutilizados para outros contextos de projeto de desenvolvimento de software, e nesta direção são apontadas as atividades pretendidas para finalização desta pesquisa.
Palavras-Chave: Estudo Empírico, Teste de Software, Simulação de Processos, Regressão Linear.
Matrícula: 201520080001.
Titulo: "Um Método de Apoio à Modelagem e Simulação de Redes Bayesianas para o Gerenciamento de Projetos de Desenvolvimento de Software ".
Orientador: Prof. Dr.Cleidson Ronald Botelho de Souza
Data: 06/09/2018.
Hora: 08h00
Local: LABTIC da Ufpa.
Banca Examinadora:
- Prof. Dr. Cleidson Ronald Botelho de Souza - Orientador (PPGCC/UFPA)
- Prof. Dr. Gustavo Henrique Lima Pinto - Membro Interno (PPGCC/UFPA)
- Prof. Dr. Sandro Ronaldo Bezerra Oliveira - Membro Interno (PPGCC/UFPA)
- Prof. Dr. Carlos dos Santos Portea - Membro Externo (UFPA/CAMPUS CAMETÁ)
- Prof. Dra. Tayana Uchôa Conte - Membro Externo (UFAM)
Resumo
Apesar dos inúmeros avanços em métodos, técnicas e ferramentas de apoio ao processo de desenvolvimento de software, ainda são comuns os relatos sobre problemas causados por falhas nos sistemas de software. A literatura especializada sugere que ainda temos pouco conhecimento sobre os fenômenos que afetam o processo de desenvolvimento. E indica a necessidade de estudos que permitam a investigação, racionalização e ampliem nosso entendimento sobre suas causas e efeitos. Neste contexto, a modelagem e simulação de processos de software se destaca em relação a outros tipos de estudos experimentais por viabilizar a experimentação virtual, que proporciona menor consumo de recursos e tempo, além de agilizar o tempo de resposta do fenômeno investigado. O objetivo principal deste trabalho é propor um método de apoio a modelagem e simulação com redes bayesianas aderente ao gerenciamento de projetos de desenvolvimento de software. Para isso, foram elaborados um modelo conceitual e o método de apoio. O modelo conceitual contextualiza o uso de simulação com redes bayesianas durante o gerenciamento de projetos de desenvolvimento de software. O método visa orientar a modelagem e simulação. Para avaliar o método proposto foi realizado um estudo piloto em ambiente laboratorial que resultou na definição de uma rede bayesiana. O método proposto pretende contribuir para a área de desenvolvimento de software preenchendo a lacuna identificada na literatura a respeito da falta de detalhes sobre os procedimentos metodológicos que orientam a modelagem e simulação com redes bayesianas em problemas do desenvolvimento de software.
Palavras-Chave: Redes Bayesianas Modelagem e Simulação de Redes Bayesianas Método Gerenciamento de Projetos de Desenvolvimento de Software.
3) Aluno: Tiago Davi Oliveira de Araujo
Matrícula: 201620080009.
Titulo: "Um Modelo para Reconhecimento, Reconstrução e Personalização de Gráficos de Dados Estáticos".
Orientador: Prof. Dr. Bianchi Serique Meiguins
Data: 19/09/2018
Hora: 15h30
Local: Auditório do Instituto de Ciências Exatas e Naturais
Banca Examinadora:
- Prof. Dr. Bianchi Serique Meiguins - Orientador (PPGCC/UFPA)
- Prof. Dr. Carlos Gustavo R. dos Santos - Membro Interno (PPGCC/UFPA)
- Prof. Dr. Jefferson Magalhães de Morais - Membro Interno (PPGCC/UFPA)
- Prof. Dr. Nelson Cruz Sampaio - Membro Interno (PPGCC/UFPA)
- Prof. Dr. José Gustavo de Souza Paiva - Membro Externo (UFU)
- Prof. Dr. Marcelo de Paiva Guimarães - Membro Externo (UNIFESP)
Resumo
Gráficos de dados são amplamente utilizados para comunicação, comparação e análise de dados em vários meios. Um bom gráfico de dados deve apresentar os elementos e dados necessários para seu bom entendimento, tais como: informação sobre eixos, escalas, títulos, legendas, linhas de tendência, etc. Contudo, em muitos casos, parte desses elementos geralmente não está disponível, bem como os dados que os criaram, prejudicando o entendimento do usuário e o redesign do gráfico. Desta forma, a imagem do gráfico torna-se a única fonte para o seu redesign, sendo necessário um processo de extração das características desse gráfico, que de forma mais detalhada engloba as etapas de localização do gráfico na imagem, sua segmentação, classificação do tipo, extração dos dados e características visuais. A partir desses dados é possível melhorar o gráfico ou até mesmo propor um novo tipo de gráfico para representar os mesmos dados. Assim, esta proposta de tese propõe um modelo para reconhecimento, reconstrução e personalização de imagens de gráficos de dados que pode ser apresentada em diversos cenários, tais como: realidade aumentada, realidade virtual, dispositivos móveis, web, etc. Como resultados parciais, um protótipo inspirado nesse modelo será apresentado, tendo como cenário de uso o gráfico de barras. Em relação as tecnologias adotadas, destacam-se para segmentação e localização do gráfico na imagem digital a Mask R-CNN, uma rede neural convolucional que classifica e segmenta objetos em uma imagem, para extração dos dados são utilizados algoritmos de OCR para encontrar títulos e eixos, para identificação dos contornos e características visuais para extração das informações das barras será utilizado OpenCV, para reconstrução e personalização dos gráficos são utilizadas a biblioteca de visualização da informação D3 e gramática de geração de gráficos VEGA. Por fim, para validação de cada etapa são utilizados métodos específicos, por exemplo, as etapas de localização do gráfico e segmentação faz uso do Mean Average Precision, métrica utilizada para precisão de detecção de objetos, a fase de extração de dados utiliza o Erro Absoluto Médio para comparar os gráficos reconhecidos com os dados originais para testar a precisão do método, e para fase de reconstrução e personalização será realizada uma avaliação qualitativa com usuários.
Palavras-Chave: Reconhecimento de Gráfico, Aprendizado de Máquina, Processamento de Imagem, Visualização da Informação.
Matrícula: 201520080002.
Titulo: "Expandindo a Visualização de Dados Multidimensionais em Treemaps com Glifos".
Orientador: Prof. Dr. Bianchi Serique Meiguins
Data: 20/09/2018
Hora: 09h00
Local: Sala FC-02 do Instituto de Ciências Exatas e Naturais
Banca Examinadora:
- Prof. Dr. Bianchi Serique Meiguins - Orientador (PPGCC/UFPA)
- Prof. Dr. Carlos Gustavo R. dos Santos - Membro Interno (PPGCC/UFPA)
- Prof. Dr. Jefferson Magalhães de Morais - Membro Interno (PPGCC/UFPA)
- Profa. Dra. Marcelle Pereira Mota - Membro Interno (PPGCC/UFPA)
- Prof. Dr. José Gustavo de Souza Paiva - Membro Externo (UFU)
- Prof. Dr. Marcelo de Paiva Guimarães - Membro Externo (UNIFESP)
Resumo
A Visualização da Informação (InfoVis) é a área que estuda representações visuais interativas para dados abstratos com objetivo de potencializar a percepção dos usuários sobre os dados. A técnica treemap é uma técnica de InfoVis consolidada e bastante difundida, que possui como principais características a visualização de dados hierárquicos e o uso de todo o espaço visual disponível de tela. No entanto, tal técnica apresenta alguns desafios para a representação de dados, entre elas destacam-se: poucas opções para representação visual de dados, limitada a tamanho, cor e rótulo; e para aumentar a dimensionalidade de dados utiliza-se os níveis hierárquicos, mas um número elevado de hierarquias dos dados pode dificultar a percepção dos usuários sobre os mesmos. Como objetivo de proposta de tese, visa-se propor soluções para mitigar os desafios apresentados na utilização da técnica treemap para muitas dimensões de dados, propondo como alternativa a agregação de glifos aos itens de dados visuais da técnica. No contexto de InfoVis, glifos são objetos visuais que codificam individualmente os atributos de uma base de dados a uma ou mais características visuais (variáveis visuais). Esta proposta de tese considera três principais cenários para comparação e avaliação: treemap, treemap com glifos e treemap com glifos adaptativos. Os glifos adaptativos são glifos que estão em itens do treemap com áreas muito pequenas, e por esta rezão é realizado uma análise de qual parte do glifo deve ser apresentada para ainda ser uma informação visual útil. Visando verificar as propostas, foi desenvolvido um protótipo computacional que permite criar cenários propostos para análise de dados multidimensionais. A avaliação dos cenários gerados será com base em tarefas de InfoVis aplicadas a grupos de usuários, tais como: busca de similaridades, busca visual, detecção de tendência, etc. Adicionalmente, cada participante responde um questionário qualitativo sobre as tarefas realizadas, e as características dos glifos. Por fim, uma análise preliminar dos resultados dos dados coletados quantitativos e qualitativos é apresentada.
Palavras-Chave: Visualização da Informação, Treemap, Glyph.
DEFESAS DE QUALIFICAÇÃO DE MESTRADO:
Matrícula: 201620070010
Titulo: "Modelo para Tomada de Decisão no Processo de Imputação de Dados Faltantes"
Orientador: Prof. Dr. Bianchi Serique Meiguins
Data: 19/09/2018
Hora: 09h00
Local: Auditório do Instituto de Ciências Exatas e Naturais da Ufpa.
Banca Examinadora:
- Prof. Dr. Bianchi Serique Meiguins - Orientador (PPGCC/UFPA)
- Prof. Dr. Jefferson Magalhães de Morais - Co-Orientador (PPGCC/UFPA)
- Prof. Dr. Carlos Gustavo Resque dos Santos - Membro Interno (PPGCC/UFPA)
- Prof. Dr. Marcelo de Paiva Guimarães - Membro Externo (UNIFESP)
Resumo
Dados geralmente contêm valores ausentes e as razões são diversas. Valores ausentes ocorrem quando as medições valham, quando os resultados da análise são perdidos ou quando as medições são incompreensíveis. Logo, os registros de dados estão incompletos, o que pode causar análise de dados ineficientes e decisões imprecisas. A forma de analistas lidam com dados incompletos pode ser um trabalho difícil, sendo a diferença entre estudos enviesados e não enviesados. Técnicas de imputação são umas das principais maneiras de tratar dados faltantes. No entanto, vários fatores devem ser considerados na hora de se decidir o método mais indicado para uma base especifica. Desse modo, este trabalho desenvolveu um modelo de decisão cujo o objetivo e auxiliar no processo de imputação de dados, guiando o analista através de quatro etapas. Elas permitem (a) determinar, através de técnicas de visualização, os mecanismos geradores de dados faltantes, (b) realizar o tratamento de outliers, (c) executar simulações em amostras da base para definir, por meio de métricas de avaliação, qual a técnica de imputação mais eficiente para um conjunto de dados, e (d) realizar a imputação com a técnica selecionada como melhor opção. A metodologia proposta foi avaliada simulando a ocorrência de dados faltantes e seus mecanismos em cinco bases de dados reais através de cinco técnicas (Média, Hot-Deck, KNN Imputation, IRMI, MICE) de imputação considerando as métricas RMSE, MAE, MPE, Acurácia Categórica e Tempo de Execução. Seguindo o modelo de decisão proposto, os resultados mostraram a influência negativa dos outliers na imputação e a escolha da melhor técnica para cada cenário. Com isso, conclui-se que o modelo de tomada de decisão desenvolvido consegue orientar o analista nas etapas do processo de imputação de dados faltantes.
Palavras-Chave: Dados faltantes, imputação de dados, modelo de decisão, outlier, visualização de informação.