Ученые из НИЯУ МИФИ и ФИЦ Биотехнологии РАН разработали математический алгоритм, который с высокой точностью находит повторяющиеся элементы в геномах. Они протестировали новый подход на девяти видах бактерий и обнаружили ранее неизвестные повторы в геномах каждого вида. Эти повторы формируют своеобразную «разметку» в геноме бактерий.
В геномах большинства многоклеточных организмов, от дрожжей до человека, встречаются повторяющиеся последовательности нуклеотидов, которые являются своего рода «буквами» ДНК. Каждый такой повтор имеет длину в несколько сот нуклеотидов и распределен по всему геному.
Для поиска дисперсных повторов в геномах существует множество математических алгоритмов, которые даже позволяют обнаруживать «искаженные» копии, то есть повторы, в которых произошли мутации и последовательности отличаются. Однако в процессе эволюции таких изменений может накопиться настолько много, что становится невозможно найти достаточно похожие друг на друга последовательности в геноме.
Чтобы решить эту проблему, ученые ищут новые подходы для обнаружения дисперсных повторов, которые разбросаны в геномах различных организмов. Ранее такие семейства повторов встречались исследователям только в геномах многоклеточных организмов, в то время как в геномах бактерий они были неизвестны.
Ученые предложили новый метод поиска повторяющихся последовательностей. Они применили алгоритм для поиска повторов в геномах девяти видов бактерий и смогли впервые обнаружить у кишечной палочки три семейства повторов длиной 400-600 пар нуклеотидов, которые занимают почти 50% всего ее генома.
Ранее у этого микроорганизма были известны только повторы меньшей длины - до 300 пар нуклеотидов - и в меньшем количестве. В генетических последовательностях других бактерий удалось обнаружить 1-2 семейства повторов такой же крупной длины.
Авторы работы считают, что новый подход поможет анализировать не только бактериальные геномы, но и генетические последовательности многоклеточных организмов, таких как животные и растения. Это позволит лучше понять эволюцию геномов и отдельных их элементов, а также найти мишени для создания новых антибиотиков или повышения продуктивности ценных для биотехнологии штаммов бактерий.