Views: 9
Vedci vyvinuli výpočtovú metódu na odhadnutie dôležitosti každého písmena v ľudskom genóme
Cold Spring Harbor, NY – V ľudskom genóme sú 3 miliardy písmen a vedci donekonečna diskutovali o tom, koľko z nich slúži funkčným účelom. Existujú písmená, ktoré kódujú gény, naše dedičné informácie a tie, ktoré poskytujú pokyny o tom, ako bunky môžu gény využívať. Ale tieto sekvencie sú napísané pomerne málo z obrovského počtu písmen DNA. Vedci už dlho diskutovali o tom, koľko, alebo dokonca či vôbec, zvyšok nášho genómu niečo robí, niektorí zašli až tak ďaleko, že časť, ktorá sa nevenuje kódovaniu proteínov, označili za „nevyžiadanú DNA“.
V práci publikovanej dnes v Nature Genetics výskumníci z Cold Spring Harbor Laboratory (CSHL) vyvinuli novú výpočtovú metódu na identifikáciu toho, ktoré písmená v ľudskom genóme sú funkčne dôležité. Ich počítačový program s názvom fitCons využíva silu evolúcie a porovnáva zmeny v písmenách DNA nielen medzi príbuznými druhmi, ale aj medzi viacerými jedincami jedného druhu. Výsledky poskytujú prekvapivý obraz o tom, ako málo z nášho genómu príroda „zakonzervovala“ nielen medzi druhmi po eóny času, ale aj v novšom časovom období, počas ktorého sa ľudia navzájom rozlišovali.
„V modelových organizmoch, ako sú kvasinky alebo muchy, vedci často generujú mutácie, aby určili, ktoré písmená v sekvencii DNA sú potrebné na fungovanie konkrétneho génu,“ vysvetľuje profesor CSHL Adam Siepel. “Nemôžeme to urobiť s ľuďmi.” Ale keď sa nad tým zamyslíte, príroda robí podobný experiment vo veľmi veľkom meradle, ako sa druhy vyvíjajú. Mutácie sa vyskytujú v genóme náhodne, ale dôležité písmená sú zachované prirodzeným výberom, zatiaľ čo ostatné sa môžu voľne meniť bez nepriaznivých následkov pre organizmus.
Práve táto myšlienka sa stala základom ich analýzy, no sama o sebe nestačila. „Veľké výskumné konzorciá, ako napríklad projekt ENCODE, poskytli vedeckej komunite množstvo informácií o genómovej funkcii za posledných niekoľko rokov,“ hovorí Siepel. „Iné skupiny sekvenovali veľké množstvo ľudí a primátov (okrem človeka). Po prvýkrát nám tieto veľké súbory údajov poskytujú široký a mimoriadne podrobný obraz o biochemickej aktivite pozdĺž genómu a o tom, ako sa sekvencie DNA v priebehu času menili.
Siepelov tím začal triedením údajov konzorcia ENCODE na základe kombinácií biochemických markerov, ktoré označujú typ aktivity na každej pozícii. „Nepoužívali sme len sekvenčné vzory. ENCODE nám poskytol informácie o tom, kde sa pozdĺž celej genómovej DNA číta a ako je modifikovaná biochemickými značkami,“ hovorí Brad Gulko, Ph.D. študent informatiky na Cornell University a hlavný autor nového článku. Kombinácie týchto značiek odhalili niekoľko stoviek rôznych tried miest v genóme, z ktorých každé má potenciálne odlišnú úlohu v genómovej aktivite.
Výskumníci sa potom obrátili na svoju predtým vyvinutú výpočtovú metódu s názvom INSIGHT, aby analyzovali, do akej miery sa sekvencie v týchto triedach menili počas krátkeho aj dlhého obdobia evolúcie. “Zvyčajne sa tento druh analýzy robí porovnávaním rôznych druhov – ako sú ľudia, psy a myši – čo znamená, že výskumníci sledujú zmeny, ku ktorým došlo počas relatívne dlhých časových období,” vysvetľuje Siepel. Ale model INSIGHT zvažuje zmeny medzi desiatkami ľudských jedincov a blízkych príbuzných, ako je napríklad šimpanz, čo poskytuje obraz evolúcie v oveľa kratších časových rámcoch.
Vedci zistili, že nanajvýš len asi 7 % písmen v ľudskom genóme je funkčne dôležitých. „Boli sme ohromení tým, aké nízke je toto číslo,“ hovorí Siepel. “Niektoré analýzy samotných údajov ENCODE tvrdili, že viac ako 80% genómu je funkčných, ale naša evolučná analýza naznačuje, že to tak nie je.” Dodal: „Iní výskumníci odhadli, že podobne malé časti genómu sa zachovali počas dlhých evolučných období, ale naša analýza naznačuje, že oveľa väčšie odhady založené na ENCODE nemožno vysvetliť ziskami nových funkčných sekvencií na ľudskom tele. rodokmeň. Myslíme si, že väčšina sekvencií označených ako „biochemicky aktívne“ podľa ENCODE pravdepodobne nie je pre ľudí evolučne dôležitá.
Podľa Siepela táto analýza umožní výskumníkom oveľa rýchlejšie izolovať funkčne dôležité sekvencie chorôb. Väčšina štúdií týkajúcich sa celého genómu zahŕňa obrovské oblasti, ktoré obsahujú desiatky tisíc písmen, spojené s chorobou. “Naša analýza pomáha určiť, ktoré písmená v týchto sekvenciách sú pravdepodobne funkčné, pretože sú biochemicky aktívne a boli zachované evolúciou.” hovorí Siepel. “Toto poskytuje silný zdroj, pretože vedci pracujú na pochopení genetického základu choroby.”
ZDROJ: Napísal : Jaclyn Jansen, vedecký spisovateľ | publicaffairs@cshl.edu | 516-367-8455
https://www.cshl.edu/harnessing-data-from-nature-s-great-evolutionary-experiment/