Metody strojového učení nacházejí uplatnění při zkoumání genomu
Tým bioinformatiků z centra CEITEC Masarykovy univerzity vytvořil nový analytický nástroj pro biomedicínský výzkum. Využívá metody strojového učení, jinak aplikované například pro rozpoznávání textu nebo v samořízených automobilech. Program MuStARD prohledává genomické oblasti a identifikuje místa, která vykazují podobné strukturní charakteristiky.
MuStARD tak dokáže s výjimečnou přesností například identifikovat části DNA produkující malé molekuly RNA, a to i v oblastech s nevyváženým a variabilním pozadím. Výsledky studie publikoval v červnu 2020 vědecký časopis Nature Scientific Reports.
Vědci znají různé typy malých molekul RNA, které vznikají v buňkách. Ne všechny druhy se však podařilo identifikovat, jen v posledních několika letech vědci objevili tisíce nových lidských mikroRNA. Malé RNA přitom hrají nejspíš důležitou roli v regulaci a vývoji mnoha onemocnění.
Posunuli hranice možností
Hlavními autory nově publikované studie jsou brněnští bioinformatici řeckého původu Georgios Georgakilas a Panagiotis Alexiou. Spolu s kolegy posunuli hranice možností strojového učení v biomedicínském výzkumu.
„Přímým výsledkem je vývoj obecné metody identifikace genomických lokalit obsahujících malé RNA na základě příkladu v rámci stejného druhu, ale aplikovatelné i napříč druhy,“ uvedl Alexiou. Naznačil možnosti uplatnění při zkoumání nově sekvenovaných genomů. „Jakmile je genom sekvenován, musí být určena funkce a význam jednotlivých genů. A přesně k tomu je náš MuStARD vyškolen,“ doplnil Alexiou.
KAM DÁL: Nejslavnější deník na světě museli ověřovat vědci. Osud Anny Frankové známe jen díky neznámé sekretářce.