Please use this identifier to cite or link to this item: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521
Title: Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP.
Other Titles: Exploring dimensionality reduction techniques in DNA analysis of jewish and other ethnic groups: a comparison of PCA, T-SNE, AND UMAP.
???metadata.dc.creator???: RODRIGUES, Matheus Andrade.
???metadata.dc.contributor.advisor1???: MASSONI, Tiago Lima.
???metadata.dc.contributor.referee1???: MACHADO, Patrícia Duarte de Lima.
???metadata.dc.contributor.referee2???: BRASILEIRO, Francisco Vilar.
Keywords: Etnias;Judeus;DNA;t-SNE;UMAP;Redução de dimensionalidade;Calculadoras de interpretação genética;Grupos étnicos;Software R.;Microbanchmark;PCA;Ethnicities;Jews;Dimensionality reduction;Genetic Interpretation Calculators;Ethnic groups;R software.;Microbankmark
Issue Date: 28-Jun-2023
Publisher: Universidade Federal de Campina Grande
Citation: RODRIGUES, Matheus Andrade. Explorando técnicas de redução de dimensionalidade na análise de DNA de grupos judaicos e de outros grupos étnicos: uma comparação entre PCA, t-SNE e UMAP. 2023. 24f. (Trabalho de Conclusão de Curso - Artigo), Curso de Bacharelado em Ciência da Computação, Centro de Engenharia Elétrica e Informática, Universidade Federal de Campina Grande – Paraíba - Brasil, 2023. Disponível em: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521
???metadata.dc.description.resumo???: Aplicamos PCA, t-SNE e UMAP nos datasets de calculadoras de interpretação genética com dados de grupos étnicos judaicos, de vários vizinhos não-judeus e de etnias correlacionadas, utilizando o software R. Realizamos uma comparação visual entre os resultados gerados e utilizamos o microbenchmark para verificar o tempo de execução dos métodos. O t-SNE e o UMAP são eficientes para trabalharmos com âmbitos locais da visualização, enquanto o PCA é adequado quando o número de amostras é reduzido. t-SNE e UMAP são capazes de formar agrupamentos que não veríamos somente utilizando o PCA. Apesar disso, são mais lentos que o PCA, e as visualizações geradas por eles mudam ao executar o algoritmo novamente.
Abstract: We applied PCA, t-SNE, and UMAP to datasets from genetic interpretation calculators containing data of Jewish ethnic groups, various non-Jewish neighbors, and correlated ethnicities, using the R software. We conducted a visual comparison of the generated results and used microbenchmarking to measure the execution time of the methods. t-SNE and UMAP are efficient for working with local aspects of visualization, while PCA is suitable when the number of samples is small. t-SNE and UMAP are capable of forming clusters that would not be seen using PCA alone. However, they are slower than PCA, and the visualizations generated by them change when the algorithm is run again.
Keywords: Etnias
Judeus
DNA
t-SNE
UMAP
Redução de dimensionalidade
Calculadoras de interpretação genética
Grupos étnicos
Software R.
Microbanchmark
PCA
Ethnicities
Jews
Dimensionality reduction
Genetic Interpretation Calculators
Ethnic groups
R software.
Microbankmark
???metadata.dc.subject.cnpq???: Ciência da Computação.
URI: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/30521
Appears in Collections:Trabalho de Conclusão de Curso - Artigo - Ciência da Computação

Files in This Item:
File Description SizeFormat 
MATHEUS ANDRADE RODRIGUES - TCC ARTIGO CIÊNCIA DA COMPUTAÇÃO CEEI 2023.pdfMatheus Andrade Rodrigues - TCC Artigo Ciência da Computação CEEI 2023.1.08 MBAdobe PDFView/Open


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.