Московский Государственный Университет
им. М. В. Ломоносова
Факультет биоинженерии и биоинформатики
КУРСОВАЯ РАБОТА
ПО БИОИНФОРМАТИКЕ .
Тема : идентификация белка , исследование его аминокислотной последовательности и построение филогенетического древа гомологов .
Автор : Кочмак С.А.
202 группа.
e
-
mail
:
kochmak
@
belozersky
.
msu
.
ru
Кураторы : Филиппов П.П.
,
Сесин И.И.
Отдел сигнальных систем клетки НИИ физико-химической биологии им.А.Н.Белозерского
II семестр 2002-2003 г.
III семестр 2003-2004 г.
Содержание
1.Введение 3
1.1 Семейство аннексинов 3
1.2 Постановка задачи 4
2.Материалы и методы 4
3.Результаты 5
3.1 Идентификация белка 5
3.2 Поиск консенсусных последовательностей 5
3.3 Построение филогенетического древа 7
4.Литература 9
1.Введение .
1.1 Семейство аннексинов . Аннексины ( от греч. Annex
– связывать , удерживать вместе ) - общее название семейства кальций- и фосфолипидсвязывающих белков , образующих эволюционно консервативную группу с представителями, экспрессирующимися и в растительном и в животном царствах ( на сегодняшний день известно порядка 160 белков , относимых к этому семейству , и представленных в более чем 65 видах : от грибов и протистов до растений и высших позвоночных ) . Структурно аннексины характеризуются наличием 4 доменов ( 8 в аннексине VI ) , которые сходны друг с другом по своим первичным и вторичным структурам , образованы пятью a-цепями и расположены симметрично (Рис. 1 ) .
Рис. 1 . Аннексин IV
Многие из этих доменов были закристаллизованы , и их молекулярная структура помогла выявить некоторые интересные черты архитектуры Ca2+
связывающих сайтов и центральной гидрофильной поры ( которую образуют домены ) , предположительно функционирующей в качестве кальциевого канала . Наряду с консервативными доменами , все аннексины содержат в N-концевой части уникальную последовательность , определяющую их индивидуальные свойства in vivo ( например , N-концевая часть аннексина II связывает белок р11 ) .
Биохимически аннексины - хорошо растворимые белки , способные к Ca2+
зависимому связыванию с биомембранами , при повышении концентрации
кальция могут образовывать тримеры . Другими лигандами аннексинов являются S100 белки , цитоскелет-ассоциированные белки , нуклеиновые кислоты и углеводы , в частности гликозаминогликаны . Полностью биологическое значение неплохо описанного in vitro Ca2+
зависимого связывания с фосфолипидами в настоящее время не понято .
Физиологическая роль многих представителей данного семейства остается неясной : предполагаемые функции включают ингибирование свертывания крови ( в том числе предотвращение образования тромбов ) , регуляцию активности фосфолипазы A2 , участие в эндо- и экзоцитозе , взаимодействие с элементами цитоскелета . Аннексины A2 , A5 и A6 участвуют в регуляции сердечной деятельности ( хорошо известна роль кальция для сердца ) . В литературе сообщалось также о связи аннексинов с процессами клеточной пролиферации , дифференцировки и трансформации ; для начальных стадий апоптоза характерно увеличение их концентрации .По последним данным , представители семейства аннексинов могут быть вовлечены в клеточный ответ на стресс : аннексин А1 может выступать в роли шаперона , предотвращая температурную инактивацию глутаматдегидрогеназы . Было показано, что некоторые цитостатики индуцируют в клетках немелкоклеточного рака легкого синтез аннексина IV , который начинает концентрироваться в ядрах этих клеток. Хотя аннексины и не содержат сигнальных последовательностей для секреции , некоторые из них были обнаружены вне клеток , где они могли ингибировать миграцию нейтрофилов , выполнять функцию рецепторов для некоторых протеаз в эндотелии . Функциональные свойства всех аннексинов обусловлены наличием Ca-связывающих участков . Наконец , нарушения экспрессии , активности или локализации представителей данного семейства предположительно коррелируют с некоторыми заболеваниями ( болезней человека , связанных с мутацией в гене аннексина , не описано ) : промиелоцитарной лейкемией , различными аннексинопатиями . При различных лейкемиях , меланоме и раке простаты происходит изменение экспрессии генов аннексинов ( А5 , А9 ) .
1.2 Постановка задачи
.
В предложенной задаче было необходимо :
1) Определить не идентифицированный белок , выделенный и очищенный из сетчатки глаз быка ( BOS TAURUS )
2) Найти консенсусные последовательности , указывающие на наличие в нем ковалентных модификаций
3) Осуществить поиск гомологов и построить филогенетическое древо .
По результатам масспектрометрического анализа данный белок
был идентифицирован как аннексин IV ( синонимы : липокортин IV , эндонексин I )(Авдеева О., 202 группа ) . Это первый случай обнаружения аннексина IV в сетчатке глаза . Для подтверждения результата этот белок был подвергнут протеолитическому расщеплению; из полученного гидролизата методом высокоэффективной жидкостной хроматографии (ВЭЖХ) очищены до гомогенного состояния 2 полипептидных фрагмента; путем секвенирования этих фрагментов установлена их аминокислотная последовательность :
1)AAKGGTVKA ASGFNAA
2)DEVKFLTVLCSR NRNHLLHVFD
2.Материалы и методы .
Были использованы следующие программы :
1) Blast (http://cn.expasy.org/tools/blast) – для идентификации белка и поиска его гомологов .
2) Protdist , Bionj и DrawTree из пакета программ Phylip (http://bioweb.pasteur.fr) – построение филогенетического древа гомологов .
3) RasMol ( версия 2.7.2 ) – визуализация молекулы аннексина IV .
и банки :
1) SwissProt
2) Prosite (http://kr.expasy.org/prosite) для поиска консенсусных последо-
вательностей .
3.Результаты .
3.1
Идентификация белка .
Наиболее близким гомологом оказался ANX4_BOVIN ( процент сходства = 100)(рис . 2) . Другие белки (с меньшим процентом сходства ) также принадлежат семейству аннексинов .При этом пептид (1) точно совпадает с N-концевой частью ANX4 (которая является вариабельной и отличает каждый отдельно взятый представитель семейства) . Пептид (2)- гомологичен всему семейству аннексинов т.к. входит в состав т.н. аннексин-подобных повторов , служащих для связывания двухвалентных ионов кальция .
Рис. 2
3.2 Поиск консенсусных последовательностей .
(О посттрансляционных модификациях аннексинов известно давно ) . В результате обнаружены сайты фосфорилирования двух типов , гликозилирования
Рис. 3 . Аннексин IV : красным цветом выделен I аннексиновый повтор , желтым - II , зеленым - III ,синим – IV ; черным – ионы кальция .
Для N-концевой части аннексина (взяты 1-30 аминокислоты до первого аннексинового повтора) теоретически возможны сайты : миристилирования и 2 сайта фосфорилирования для протеинкиназы С ( для полной активации которой требуется присутствие ионов Ca2+
, диацилглицерола и связь с фосфолипидами внутренней поверхности плазматической мембраны , преимущественно с фосфатидилсерином ) . Экспериментально известно , что ,
по крайней мере in vitro , в аннексине IV фосфорилируется остаток треонина-6 .
Консенсусные последовательности :
N-glycosylation site.
Prosite access number: PS00001
Prosite documentation access number: PDOC00001
N-{P}-[ST]-{P}.
Randomized probability: 5.138e-03 .
Site : 124 to 127 NQTY. Identity.
Site : 244 to 247 NKSA. Identity.
---------------------------------------------------------------------
Protein kinase C phosphorylation site.
Prosite access number: PS00005
Prosite documentation access number: PDOC00005
[ST]-x-[RK].
Randomized probability: 1.423e-02 .
Site : 6 to 8 TVK. Identity.
Site : 21 to 23 TLR. Identity.
Site : 222 to 224 SIK. Identity.
Site : 256 to 258 SMK. Identity.
---------------------------------------------------------------------
Casein kinase II phosphorylation site.
Prosite access number: PS00006
Prosite documentation access number: PDOC00006
[ST]-x(2)-[DE].
Randomized probability: 1.482e-02 .
Site : 31 to 34 TDED. Identity.
Site : 116 to 119 TPEE. Identity.
Site : 134 to 137 SLED. Identity.
Site : 230 to 233 SFED. Identity.
Site : 262 to 265 TDDD. Identity.
Site : 273 to 276 SRAE. Identity.
Site : 302 to 305 TSGD. Identity.
---------------------------------------------------------------------
N-myristoylation site.
Prosite access number: PS00008
Prosite documentation access number: PDOC00008
G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}.
Randomized probability: 1.397e-02 .
Site : 5 to 10 GTVKAA. Identity.
Site : 102 to 107 GTDEGC. Identity.
---------------------------------------------------------------------
Annexins repeated domain signature.
Prosite access number: PS00223
Prosite documentation access number: PDOC00195
[TG]-[STV]-x(8)-[LIVMF]-x(2)-R-x(3)-[DEQNH]-x(7)-[IFY]-x(7)-[LIVMF]-x(3)-[LIVMF]
-x(11)-[LIVMFA]-x(2)-[LIVMF].
Randomized probability: 7.279e-08 .
Site : 30 to 82 GTDEDAIINVLAYRSTAQRQEIRTAYKTTIGRDLMDDLKSELSGNFEQVILGM. Identity.
Site : 102 to 154 GTDEGCLIEILASRTPEEIRRINQTYQLQYGRSLEDDIRSDTSFMFQRVLVSL. Identity.
Site : 186 to 238 GTDEVKFLTVLCSRNRNHLLHVFDEYKRIAQKDIEQSIKSETSGSFEDALLAI. Identity.
Site : 261 to 313 GTDDDTLIRVMVSRAEIDMLDIRANFKRLYGKSLYSFIKGDTSGDYRKVLLIL. Identity.
(Casein kinase II – активируется циклическими мононуклеотидами фосфорилирует серин или треонин ) .
3.3 Построение филогенетического древа .
Получено около 60 гомологов, аминокислотная последовательность которых была выровнена ( при этом 2 последовательности , у которых отсутствовала большая часть консервативного участка , были удалены ) (Рис. 4) .
.
Рис . 4 . Филогенетическое древо гомологов аннексина IV .( HUMAN - Homo sapiens ; MOUSE- Mus musculus ; RAT - Rattus norvegicus ; CAVCU - Cavia cutleri (Guinea pig) ; PIG - Sus scrofa (Pig) ; CHICK - Gallus gallus (Chicken) ; CANFA - Canis familiaris (Dog) ; BOVIN - Bos Taurus ; RABIT- Oryctolagus cuniculus (Rabbit);
COLLI - Columba livia (Domestic pigeon) ; XENLA - Xenopus laevis (African clawed frog ; DROME - Drosophila melanogaster; HYDAT - Hydra attenuate ; ; DICDI - Dictyostelium discoideum (Slime mold) ; RODSP - Rodentia sp ; FRAAN - Fragaria ananassa (Strawberry) ; CYNPY - Cynops pyrrhogaster (Japanese common newt) ; GIALA - Giardia lamblia (Giardia intestinalis) .
В процессе эволюции возникли механизмы , поддерживающие внутриклеточную концентрацию кальция на строго определенном уровне , т.к. кальций является одним из важнейших вторичных мессенджеров (концентрации других двухвалентных катионов , в первую очередь магния и цинка , внутри клетки могут в тысячи раз превышать коцентрацию кальция ) , и , несомненно , один из таких механизмов реализируется семейством аннексинов . К числу простейших организмов , в которых экспрессируются аннексины , относятся Giardia lamblia и Neurospora crassa , Hydra vulgaris и Dictyostelium discoideum .В настоящее время аннексины D. discoideum и N. сrassa считаются ортологами (их аминокислотные последовательности схожи на 40 % ) . Вторая важнейшая группа аннексинов была описана в растениях . Аннексины растений характеризуются отсутствием вариабельной N-концевой части и Ca2+
связывающих сайтов во II и III повторах (по крайней мере в современных цветковых растениях ), что свидетельствует о различных путях эволюции аннексинов растений и животных . Аннексин из Arabidopsis thaliana обладает каталазной активностью , у аннексинов животных ферментативной активности вообще не обнаружено . Аннексины растений и беспозвоночных не имеют ортологов у млекопитающих . Аннексин А13 позвоночных рассматривается в качестве предшественника аннексина А7 , А7 – аннексина А11 . Анализ структуры гена аннексина А11 привел к выводу , что последний является общим предком 9 аннексинов ( А1, А2, А3, А4, А5, А6, А8, А9и А10 ) . Консервативность двенадцати аннексинов млекопитающих в течение 100 миллионов лет еще раз подчеркивает их важную физиологическую роль .
4.Литература
.
1) Gerke V. , Моss SE. Annexins : From Structure to Function . Phisiol Rev 82 :
331-371,2002 .
2) Zanotty G. , Malpeli G. , Gliubich F. , Folli C. , Stoppini M. , Olivi L. , Savoia A.,
Berni R. Structure of the trigonal crystal form of bovine annexin IV . Biochem. J.
329 : 101-106 , 1998 .
3)
Iglesias J. , Morgan R. , Jenkins N. , Copeland N. , Gilbert D. , Fernandez M.
Comparative Genetics and Evolution of Annexin A13 as the founder Gene of Verterbrate Annexins .Mol. Biol. Evol.19(5):608-618 , 2002 .