Primjerna fraktalne geometrije u analizi sekvenci

Bošnjak, Vladimir (2011) Primjerna fraktalne geometrije u analizi sekvenci. Diploma thesis, Faculty of Science > Department of Physics.

[img] PDF
Restricted to Registered users only
Language: Croatian

Download (4MB)

Abstract

2003. godine završen je Human Genome Project čiji cilj je bio određivanje niza kemijskih baza parova DNK te identificiranje i katalogiziranje oko 20 000 –25 000 gena čovjekovog genoma. Očekivanja su bila velika jer se pretpostavljalo da će uvidom u kompletni genom biti moguće dešifrirati cijelu strukturu te, između ostalih, naći rješenja za biološke i medicinske probleme i bolesti. Pokazalo se da je to mnogo složenije od očekivanog pa znanstvenici traže raznovrsne metode kako bi dešifrirali genetski kod. Jedna od metoda je statistička genetika koja koristi različite matematičke i statističke modele, potpomognute sve jačim računalima, primjenjive na građu genoma. Prof. Paar se još 90-ih godina bavio proučavanjem nelinearnih sistema i determinističkog kaosa te je primijetio da se određene metode pri analizi nelinearnih sistema mogu primijeniti i na analizu genskih sekvenci. Analizom fraktalne dimenzije kodirajućih i nekodirajućih sekvenci različitih organizama, nađeno je u radu A. Provata, Y. Almirantis, Fractal Cantor Patterns in the Sequence Structure of DNA da viši organizmi (eukarioti) imaju fraktalnu dimenziju 0.85 dok niži 1 što upućuje da niži organizmi imaju homogeniju raspodjelu kodirajućih i nekodirajućih sekvenci dok je kod viših organizama ona fraktalnija. S druge strane, nađene su i kratke HOR (Higher Order Repeats) sekvence koje se vrlo pravilno pojavljuju duž centromera u svim čovjekovim kromosomima. To su pojave koje se još uvijek razmatraju kao fenomeni i zahtijevaju dublja znanstvena objašnjenja. Kod analiziranja sekvenci koristio sam se vlastitim programom napisanim u Visual basicu koji je namijenjen traženju pojedine ili grupe baza unutar dužih sekvenci s kojim je moguće dobiti histogram udaljenosti između pojedinih grupa baza tj. njihovu frekvenciju pojavljivanja, zatim je moguće propustiti niz kroz Cantorovo sito i statistički odrediti slaganje s očekivanim vrijednostima i na kraju, moguće je izračunati fraktalnu dimenziju pojavljivanja grupe baza u sekvenci. Osim mog programa, koristio sam i Bioinformatic Toolbox unutar programskog paketa MatLab namijenjen analizi genskih sekvenci i filogenetskoj analizi. Svojim programom nisam našao fraktalnu dimenziju različitu od 1 za grupu baza, ali sam uočio zanimljivu statističku pojavu da broj pojavljivanja baza propuštenih kroz Cantorovo sito ne daje očekivane statističke vrijednosti kao da se radi o slučajnom uzorku. Kao potvrda da se ne radi o statističkoj grešci u programu ili izračunu, obradom nasumično generiranih baza (A, C, G, T) ili uzimanjem 4 znamenke iz niza iracionalnih brojeva π ili broja e, baze prirodnog logaritma (da odgovaraju genskoj bazi), dobiju se statistički sasvim očekivani rezultati. Koristeći se MatLabom, također sam uočio vizualnu razliku u oscilacijama gustoće stvarnih genskih baza od onih koje su generirane generatorom slučajnih brojeva ili u ovom slučaju generatorom slučajnih slova A, C, G i T.

Item Type: Thesis (Diploma thesis)
Keywords: deoksiribonukleinska kiselina (DNK) ; ribonukleinska kiselina (RNK) ; fraktali ; fraktalna analiza
Supervisor: Paar, Vladimir
Date: 21 March 2011
Number of Pages: 83
Subjects: NATURAL SCIENCES > Physics
Divisions: Faculty of Science > Department of Physics
Depositing User: Gordana Stubičan Ladešić
Date Deposited: 04 Jan 2014 17:24
Last Modified: 28 Mar 2014 19:55
URI: http://digre.pmf.unizg.hr/id/eprint/132

Actions (login required)

View Item View Item

Nema podataka za dohvacanje citata