Jahr | 2016 |
Autor(en) | Simeon Scheib |
Titel | K - Ein Tool zur Analyse von genetischem Code mittels k-mer Analyse |
KIP-Nummer | HD-KIP 16-122 |
KIP-Gruppe(n) | F18 |
Dokumentart | Bachelorarbeit |
Abstract (de) | Ziel dieser Arbeit ist die Entwicklung von Software, die es ermöglicht, die DNA-Sequenzen verschiedener Organismen schnell und einfach mittels Zählung von k-meren im genetischen Code zu analysieren, zu vergleichen und die Ergebnisse darzustellen. Insbesondere sollen auch verschiedene Features der Sequenz wie Gene, RNA, CDS, uvm. extrahiert und analog analysiert werden. Die Daten über die Sequenz und die Features stammen dabei aus Genbank-Dateien, wie sie in Datenbanken wie 'NCBI' abgelegt sind. Um die Sequenzen zu vergleichen, sollen Histogramme der k-mer-Worte erstellt werden. Außerdem sollen aus diesen Histogrammen Korrelationskoeffizienten für verschiedene Korrelationsfunktionen berechnet und in Heatmaps grafisch dargestellt werden. |
Abstract (en) | Objective of this thesis is the development of software to analyse and compare DNA-sequences by counting subsequences of length k and to present the results. Especially different features of the sequence like genes, RNA, CDS, etc. should be extracted and analysed analogously. The sequence data is taken from genbank-files as they are available in databases like 'NCBI'. To compare the sequences, the software is supposed to create histograms of available k-mere subsequences. Furthermore these histograms should be correlated using different correlation functions. The resulting correlation coefficients are supposed to be presented graphically using heatmaps. |