Вычислительная молекулярная биология

TreeTool

Описание: 

TreeTool это интерактивная программа для визуализации, редактирования и печати филогенетических деревьев.

Используя TreeTool пользователь имеет возможность редактировать формат, структуру и прочие характеристики дерева. Помимо редактирования программа может быть использована для сравнения нескольких деревьев.

PyMol

Описание: 

PyMol (PyMOL Molecular Graphics System) - это графическая програма, которая предоставляет 3D визуализацию для белков, небольших молекул, молекулярных поверхностей и траекторий. В основе программы лежит встроенных интерпретатор языка Python, что позволяет легко расширять возможности программы для своих нужд. Помимо визуализации PyMol может быть использован для редактирования анализируемых данных с последующей записью их в PDB формат.

ncbi-tools-x11

Описание: 

Пакет ncbi-tools-x11 содержит набор графических утилит и полноценных программ основанных на базе известного пакета NCBI SDK. В пакет входят такие программы для работы с базами данных NCBI как Cn3D, Network Entrez, Sequin, ddv, и udv.

Ghemical

Описание: 

Ghemical - это пакет программ для молекулярного моделирования с графическими интерфейсами (для библиотеки GLUT и GNOME) и несколькими интересными инструментами 3D-визуализации.

Используются методы, основанные на молекулярной и квантовой механике (с использованием MOPAC7, и MPQC для QM).  В пакет включены алгоритмы геометрической оптимизации (для ММ и QM) и молекулярной динамики (для MM).  Программа Ghemical написана на С++, предоставляет хорошую основу для всех свободно распространяемых программ молекулярного моделирования.

Plasmidomics

Описание: 

Plasmidomics предназначен для рисования плазмид и векторных систем с использованием плазмид. Plasmidomics имеет развитые возможности экспорта и может использоваться при создании иллюстраций для презентаций или публикаций. Основным форматом экспорта для Plasmidomics является PostScript.

Primer 3

Описание: 

Primer3 это широко известная и используемая в мире молекулярных биологов программа для дизайна ПЦР (ПОЛИМЕРАЗНО-ЦЕПНАЯ РЕАКЦИЯ) праймеров. ПЦР - это метод молекулярной диагностики, ставший для ряда инфекций "золотым стандартом", проверен временем и тщательно апробирован клинически. Метод ПЦР позволяет определить наличие возбудителя заболевания, даже если в пробе присутствует всего несколько молекул ДНК возбудителя. Поскольку ПЦР может использоваться для широкого ряда задач, Primer3 также имеет множество различных входных параметров и настроек для того, чтобы как можно точнее указывать характеристики результата.

MUSCLE

Описание: 

Одна из самых быстрых и эффективных программ для множественного выравнивания белковых и нуклеотидных последовательностей. Согласно тестам MUSCLE достигает очень высоких результатов на системах тестирования качества множественного выравнивания, в основе которых лежат общепризанные базы известных выравниваний prefab и balibase.

MUSCLE это консольная утилита работающая преимущественно с FASTA и CLUSTAL форматами данных.

MUMMER

Описание: 

MUMmer это система для быстрого выравнивания больших геномных последовательностей.

Например, MUMmer 3.0 может найти все повторы длиной 20 или больше в геноме размером 5Мб за несколько секунд используя при этом порядка 80Мб оперативной памятию. MUMmer может также использоваться для сборки геномов из фрагментов.

HMMER

Описание: 

HMMER это реализация метода поиска в базах биологических последовательностей с использованием в качестве запроса к базе профиля множественном выравнивания. В основе алгоритмов построения и поиска пакета HMMER лежит теория скрытых марковских моделей, имитирующих работу процесса, похожего на марковский процесс с неизвестными параметрами, и задачей ставится разгадывание неизвестных параметров на основе наблюдаемых.

Пакет HMMER содержит набор консольных программ для построения статистических HMM профилей и поиска в биологических последовательностях при помощи уже готовых HMM профилей.

Garlic

Описание: 

Garlic является инструментов для исследования и анализа мембранных белков. Помимо основного предназначения эта программа может использоваться для визуализации других типов белков,  или просто геометрических объектов записанных в формате PDB. Возможности визуализации включают в себя отображение отдельных атомы, межатомных связяй, мембран, ансамблей молекул, контекстной информации о выделенном объекте, набор графиков и диаграмм отображающих свойства визуализируемых объектов.

DIAlign-TX

Описание: 

DIALIGN-TX это консольная утилита для множественного выравнивания последовательностей ДНК и белков.

Программа представляет из себя полную реализацию алгоритма выравнивания основанного на независимой обработке отдельных сегментов и имеет ряд улучшений и эвристик которые значительно улучшают качество результирующего выравнивания в сравнении с предыдущими версиями программы DIALIGN 2.2 и DIALIGN-T.

ClustalW и ClustalX

Описание: 

ClustalW - Программа для множественного выравнивания последовательностей ДНК и белков.  Работает в два этапа. Первый - попарное выравнивание всех со всеми для оценки сходства. Второй этап - после построения филогенетического дерева выравнивание глобальное. Отличие программы ClustalW от ClustalX состоит в том, что в ClustalX используется графический интерфейс, в то время как ClustalW  работает через командную строку или он-лайн.

BLAST2

Описание: 

BLAST2  - семейство компьютерных программ, служащих для поиска гомологов белков или нуклеиновых кислот, для которых известна первичная структура (последовательность) или её фрагмент. Используя BLAST, исследователь может сравнить имеющуюся у него последовательность с последовательностями из базы данных и найти последовательности предполагаемых гомологов. Является важнейшим инструментом для молекулярных биологов, биоинформатиков, систематиков. Семейство программ серии BLAST делится на 5 основных групп:

  1. Нуклеотидные - предназначены для сравнения изучаемой нуклеотидной последовательности с базой данных секвенированных нуклеиновых кислот и их участков:
    • megablast - быстрое сравнение с целью поиска высоко сходных последовательностей,
    • dmegablast - быстрое сравнение с целью поиска дивергировавших последовательностей, обладающих незначительным сходством,
    • blastn - медленное сравнение с целью поиска всех сходных последовательностей и др.
  2. Белковые - предназначены для сравнения изучаемой аминокислотной последовательности белка с имеющейся базой данных белков и их участков.
    • blastp - медленное сравнение с целью поиска всех сходных последовательностей,
    • cdart - сравнение с целью поиска гомологичных белков по доменной архитектуре,
    • rpsblast - сравнение с базой данных консервативных доменов,
    • psi-blast - сравнение с целью поиска последовательностей, обладающих незначительным сходством,
    • phi-blast - поиск белков, содержащих определенный пользователем паттерн и др.
  3. Транслирующие - способны транслировать нуклеотидные последовательности в аминокислотные:
    • blastx - переводит изучаемую нуклеотидную последовательность в кодируемые аминокислоты, а затем сравнивает ее с имеющейся базой данных аминокислотных последовательностей белков,
    • tblastn - изучаемая аминокислотная последовательность сравнивается с транслированными последовательностями базы данных секвенированных нуклеиновых кислот,
    • tblastx - переводит изучаемую нуклеотидную последовательность в аминокислотную, а затем сравнивает ее с транслированными последовательностями базы данных секвенированных нуклеиновых кислот.
  4. Геномные - предназначены для сравнения изучаемой нуклеотидной последовательности с базой данных секвенированного генома какого-либо организма (человека, мыши и др.)
  5. Специальные - прикладные программы, использующие BLAST:
    • bl2seq - сопоставление двух последовательностей по принципу локальных выравниваний, VecScreen - определение сегментов нуклеотидной последовательности нуклеиновой кислоты, которые могут иметь векторное происхождение и др.

UGENE

Описание: 

UGENE это свободное ПО для работы молекулярного биолога. Пакет является кроссплатформенным, локализован на русский язык.

Основные вычислительные возможности:

  • Множественное выравнивание последовательностей на основе MUSCLE 3 и MUSCLE 4;
  • Анализ с помощью скрытых марковских моделей, основанный на HMMER 2 и HMMER 3;
  • Дизайн ПЦР-праймеров с помощью Primer 3;
  • Предсказание вторичной структуры белков с помощью GOR IV и PSIPRED;
  • Поиск сайтов рестрикции;
  • Сверхбыстрый поиск повторов;
  • Анализ сайтов связывания транскрипционных факторов на основе SITECON;
  • Поиск открытых рамок считывания;
  • Выравнивание последовательностей с помощью алгоритма Смита-Ватермана.

Пользовательский интерфейс:

  • Визуализация хроматограмм;
  • Просмотр трехмерных моделей PDB и MMDB;
  • Редактор множественного выравнивания;
  • Конструктор вычислительных схем автоматизирующий процесс анализа;
  • Поддержка сохранения изображений в векторные форматы для удобства публикации.

Promals3D

Описание: 

Лучший на 2008-2009гг. алгоритм множественного выравнивания последовательностей белков. При выравнивании используются данные о третичной и вторичной структуре белков. Тестирование работы алгоритма осуществлялась на базе данных PREFAB. База данных PREFAB содержит множественные выравнивания белков, сделанные на основе структурных выравниваний трехмерных структур белков без учета данных о идентичности их первичных последовательностей. Pei J, Kim BH, Grishin NV. PROMALS3D: a tool for multiple protein sequence and structure alignments. Nucleic Acids Res. 2008 36:2295-2300.

MAFFT

Описание: 

Лучший на 2005-2006гг. алгоритм множественного выравнивания последовательностей. Для ускорения процедуры множественного выравнивания используется алгоритм быстрого Фурье-преобразования идентифицирующий гомологичные участки последовательностей. Используются алгоритмы итеративного улучшения выравнивания, парного выравнивания, прогрессивного выравнивание на основе улучшенного дерева. Katoh K, Toh H. Recent developments in the MAFFT multiple sequence alignment program. Brief Bioinform. 2008 9:286-298.

PROBCONS

Описание: 

Единственный алгоритм множественного выравнивания основанный на оценке вероятности эволюционного преобразования последовательностей на основе парной скрытой марковской модели. Используется алгоритмы итеративного улучшения выравнивания, прогрессивного выравнивание на основе дерева построенного по оценкам ожидаемой точности парных выравниваний последовательностей. Edgar RC. MUSCLE: a multiple sequence alignment method with reduced time and space complexity. BMC Bioinformatics. 2004 5:113.

Kalign

Описание: 

Самый быстрый на 2008-2009гг алгоритм множественного выравнивания, основанный подходе сравнения аппроксимированных (частично несходных) строк и прогрессивном выравнивании. Lassmann T, Sonnhammer EL.Kalign--an accurate and fast multiple sequence alignment algorithm. BMC Bioinformatics. 2005 6:298.

R-COFFEE

Описание: 

Самый точный на 2008-2009гг алгоритм множественного выравнивания некодирующих РНК, основанный на предсказании вторичной структуры РНК. Наибольшая точность выравнивания оцененная на основе базы данных BRAliBase, содержащей множественные выравнивания РНК сделанные вручную, достигается при комбинировании R-COFFEE с Consan. Wilm A, Higgins DG, Notredame C. R-Coffee: a method for multiple alignment of non-coding RNA. Nucleic Acids Res. 2008 36:e52.

Consan

Описание: 

Один из лучших алгоритмов реализующих метод одновременного восстановления структуры РНК и её выравнивания с РНК-гомологами. Dowell RD, Eddy SR. Efficient pairwise RNA structure prediction and alignment using sequence alignment constraints. BMC Bioinformatics. 2006 7:400.

Mauve

Описание: 

Один из лучших на 2008-2009гг. алгоритм множественного выравнивания протяженных геномных последовательностей. Алгоритм включает в себя поиск локальных надежно выравниваемых районов, реконструкцию по ним филогении, выделение подмножества локальных выравниваний в качестве якорей – коллинеарных групп, проведение рекурсивного расширения выравниваний от якорных коллинеарных групп. Darling AC, Mau B, Blattner FR, Perna NT. Mauve: multiple alignment of conserved genomic sequence with rearrangements. Genome Res. 2004 14:1394-1403.

PhyML

Описание: 

PhyML - это набор различных алгоритмов (модификаций базового алгоритма) филогенетического анализа генов и белков (множество моделей) с помощью метода максимального правдоподобия. PhyML - это лучший на 2009г. базовый алгоритм филогенетического анализа с помощью метода максимального правдоподобия который заключается в оптимизации параметров с использованием числового метода “золотое сечение” и многократном улучшении дерева (изменении ветвления). Guindon S, Gascuel O. A simple, fast, and accurate algorithm to estimate large phylogenies by maximum likelihood. Syst Biol. 2003. 52:696-704. Anisimova M., Gascuel O. Approximate Likelihood-Ratio Test for Branches: A Fast, Accurate, and Powerful Alternative. Syst Biol. 2006. 55:539-552. Hordijk W, Gascuel O. Improving the efficiency of SPR moves in phylogenetic tree search methods based on maximum likelihood. Bioinformatics 2005. 21:4338-4347. Quang LS, Gascuel O, Lartillot N. Empirical profile mixture models for phylogenetic reconstruction. Bioinformatics 2008. 24:2317-2323. Quang LS, Lartillot N, Gascuel O. Phylogenetic Mixture Models for Proteins. Philos Trans R Soc Lond B Biol Sci. 2008. 363:3965-3976. Boussau B, Gouy M. Efficient likelihood computations with nonreversible models of evolution. Syst Biol. 2006 55:756-768. Bevan RB, Lang BF, Bryant D. Calculating the evolutionary rates of different genes: a fast, accurate estimator with applications to maximum likelihood phylogenetic analysis. Syst Biol. 2005 54:900-915.

MrBayes

Описание: 

MrBayes – это набор алгоритмов филогенетического анализа и реконструкции предковых последовательностей с помощью байесовского метода. Единственный в мире качественно распараллеленный алгоритм филогенетического анализа с помощью байесовского метода. MrBayes специально создан для анализа разнородных данных, в анализ могут быть включены качественные и молекулярные (количественные) данные, аминокислотные и нуклеотидные последовательности (множество моделей), митохондриальные и ядерные гены одновременно. Поиск оптимального решения идет с помощью связанных марковских цепей Монте Карло. Huelsenbeck JP, Ronquist F. MRBAYES: Bayesian inference of phylogenetic trees. Bioinformatics. 2001 17:754-755. Ronquist F, Huelsenbeck JP. MrBayes 3: Bayesian phylogenetic inference under mixed models. Bioinformatics. 2003 19:1572-1574. Altekar G, Dwarkadas S, Huelsenbeck JP, Ronquist F. Parallel Metropolis coupled Markov chain Monte Carlo for Bayesian phylogenetic inference. Bioinformatics. 2004 20:407-415.

TREE-PUZZLE

Описание: 

Алгоритм, реализующий уникальный метод сборки филогенетического дерева с использованием информации о правдоподобии квартетов. TREE-PUZZLE также реализует методы тестирования филогении. Schmidt HA, Strimmer K, Vingron M, von Haeseler A. TREE-PUZZLE: maximum likelihood phylogenetic analysis using quartets and parallel computing. Bioinformatics. 2002 18:502-504. Strimmer K, von Haeseler A. Quartet puzzling: A quartet maximum likelihood method for reconstructing tree topologies. Mol Biol Evol. 1996 13: 964-969. Strimmer K, von Haeseler A. Likelihood-mapping: A simple method to visualize phylogenetic content of a sequence alignment. Proc Natl Acad Sci USA. 1997 94:6815-6819

RAxML

Описание: 

RAxML - это алгоритм филогенетического анализа с помощью метода максимального правдоподобия. Единственный в мире качественно распараллеленный алгоритм филогенетического анализа генов и белков (множество моделей) с помощью метода максимального правдоподобия. Stamatakis A. RAxML-VI-HPC: maximum likelihood-based phylogenetic analyses with thousands of taxa and mixed models. Bioinformatics. 2006 22:2688-2690.

Bio++ Program Suite

Описание: 

Bio++ Program Suite 0.4.0 - интенсивно развивающийся пакет филогенетического анализа с помощью дистанционных методов и метода максимального правдоподобия. Включает в себя алгоритмы реконструкции деревьев методами U/W PGMA, Neighbor Joining, BioNJ на основе матриц расстояний вычисленных методом максимального правдоподобия, методом максимальной парсимонии, реконструкции предковых последовательностей. Dutheil J, Boussau B. Non-homogeneous models of sequence evolution in the Bio++ suite of libraries and programs. BMC Evol Biol. 2008 8:255.

CompuCell

Описание: 

Объединяет среду для моделирования и PDE Solver. В основном используются для моделирования клеточных структур (пены, биологические ткани и т.д.), однако, предпринимаются усилия, чтобы включить возможности моделирования жидкостей. Является программным продуктом с открытым исходным кодом.

xCellerator

Описание: 

Представляет собой пакет Mathematica, предназначенного для биологического моделирования с помощью автоматизированного преобразования химических реакций в ОДУ и их последующее решения с помощью численного интегрирования.

Cellumat3D

Описание: 

Является инструментом для моделирования и изучения клеточных автоматов в 3D-пространство. Приложение использует OpenGL и является достаточно быстрым, что создает правильное мнение о том, чтобы клеточные автоматы рассматривать как один из методов исследования искусственной жизни.

NetLogo

Описание: 

Является кросс-платформенной многоагентной программируемой средой моделирования. В том числе используется для моделирования динамики клеточных ансамблей.

CellSim

Описание: 

Представляет собой пакет Java, который обеспечивает графический пользовательский интерфейс для моделирования пространственных моделей, состоящих из компартментов с химическими веществами. Основные приложения – системы с химическими реакциями и клеточные процессы, как следствие, в программе используется соответствующая терминология.