Найдены неожиданные функции белка, ответственного за программируемую гибель клеток
Семейство белков-каспаз участвует как в запуске, так и в усилении процесса апоптоза в ответ на различные повреждения клетки. Белок каспаза-2 – его самый эволюционно консервативный представитель, возникший довольно давно и мало изменившийся с тех пор. Но в последние годы стали появляться данные о том, что каспаза-2 участвует во множестве других процессов, не связанных напрямую с апоптозом. Так, этот белок может подавлять развитие раковых опухолей или регулировать обмен веществ в клетке.
«Для анализа потенциально возможной связи каспазы-2 с другими белками мы использовали хорошо известную дрожжевую двугибридную систему. С помощью этого метода мы получили достаточно большой список белков, которые могут связываться с каспазой-2. Аспирант лаборатории Алексей Замараев проверил этот список путем биоинформатического анализа и ранжировал их по вероятности взаимодействия. Благодаря такому анализу после детального биохимического исследования мы некоторое время назад нашли новый взаимодействующий с каспазой-2 регуляторный фактор», – рассказал о работе руководитель научной группы и ведущий автор статьи Борис Животовский, доктор биологических наук и руководитель лаборатории исследования механизмов апоптоза факультета фундаментальной медицины МГУ имени М.В. Ломоносова.
Этот регуляторный фактор, найденный во время одного из предыдущих исследований, называется RFXANK. Он участвует в управлении работой гена, контролирующего молекулы главного комплекса гистосовместимости, которые помогают специальным клеткам иммунной системы различать «своих» и «чужаков», защищая организм от инфекций.
Продолжив поиски, ученые обнаружили еще один белок, с которым взаимодействует каспаза-2. Обозначают его английской аббревиатурой FAN, а его полное название – активатор нейтральной сфингомиелиназы. Он управляет производством церамидов – важных компонентов многих липидов (в просторечии часто называемых жирами, хотя жиры – более узкая категория, нежели липиды). Кроме того, FAN контролирует миграцию клеток и производство интерлейкина-6 – молекулы, которая регулирует воспалительные процессы. Другая важная функция FAN – руководить образованием везикул, маленьких внутриклеточных пузырьков, состоящих из того же белково-липидного двухслойного «материала», что и клеточная мембрана. В таких пузырьках различные молекулы могут перемещаться по клетке, «перевариваться» с помощью специальных белков или выбрасываться наружу.
Определить, на какие из этого множества ролей белка FAN влияет каспаза-2, помог современный биологический метод – липидомика. В отличие от своих более популярных «сестер»: протеомики, которая занимается взаимодействиями белков (протеинов), и геномики, изучающей гены и геномы, — липидомика помогает построить сети реакций, в которые вовлечены липиды. Именно эти реакции были важны для понимания работы FAN, функции которого так тесно с ними связаны.
«Совместная работа исследователей МГУ и Каролинского института (Швеция) позволила, используя липидомику, исключить участие каспазы-2 в образовании церамидов, но установить, что взаимодействие каспазы-2 с FAN отвечает за регулирование выхода из клетки интерлейкина-6, размер везикул и скорость миграции клеток, – суммирует выводы исследования Борис Животовский. – Последнее принципиально важно для понимания процесса метастазирования опухоли».
На первый взгляд кажется непонятным, какое отношение FAN может иметь к образованию метастаз – вторичных очагов роста опухоли. Но миграция клеток, которую упоминает ученый, такой же двоякий процесс, как и усиленное их деление, пролиферация. С одной стороны, оба они важны для роста тканей и заживления ран. Но ускоренные без надобности пролиферация и миграция могут сослужить организму и плохую службу, помогая раковой опухоли расти и добираться в новые и новые части организма. В ходе исследования ученые экспериментально доказали, что каспаза-2 через взаимодействие с FAN не ускоряет деление клеток, но помогает им двигаться быстрее. Теоретически, если научиться правильно выключать взаимодействие каспазы-2 и FAN, то можно замедлить процесс образования метастаз, а его включение помогло бы улучшить заживление ран.
Перед применением этого подхода на практике нужно удостовериться, что другие многочисленные функции обоих белков не слишком пострадают от подобного лечения. Как мы помним, открытое в ходе этой же работы взаимодействие каспазы-2 с FAN влияет и на формирование везикул. Подавив действие каспазы-2, ученые убедились, что без этого белка внутриклеточные пузырьки сильно увеличивались в размере. Такая особенность везикул уже была ранее известна как проявление синдрома Чедиака-Хигаши, при котором у человека возникает светобоязнь, нервный тик и нарушения работы иммунной системы. Поэтому только дальнейшие исследования покажут, можно ли бороться с метастазами через подавление связывания каспазы-2 с FAN без вреда для других функций обоих белков.
Structural Protein Function | Protocol (Translated to Russian)
4.16: Структурная функция белка
Структурные белки — это категория белков, отвечающих за различные функции, от формы и движения клеток до обеспечения поддержки основных структур, таких как кости, хрящи, волосы и мышцы. В эту группу входят такие белки, как коллаген, актин, миозин и кератин.
Коллаген, самый обильный белок у млекопитающих, встречается по всему телу. В соединительной ткани, такой как кожа, связки и сухожилия, он обеспечивает прочность на растяжение и эластичность. В костях и зубах он минерализируется, образуя твердые ткани, и вносит вклад в их несущую способность. Помимо структурной поддержки, коллаген также может взаимодействовать с рецепторами на поверхности клетки и другими промежуточными молекулами для регулирования клеточных процессов, таких как рост и миграция, что включает изменения формы клеток и тканей.
Структурные белки составляют основу цитоскелета клетки. Цитоскелет состоит из трех типов филаментов: микрофиламентов, промежуточных филаментов и микротрубочек, каждый из которых состоит из различных структурных белков. Микрофиламент образуется, когда актин самополимеризуется в длинные повторяющиеся структуры. Эти актиновые филаменты вносят вклад в форму и организацию клеток. Кроме того, микрофиламенты также могут способствовать перемещению и делению клеток, когда они действуют вместе с миозином. Состав промежуточных филаментов варьируется в зависимости от типа клеток. Существует около 70 различных генов, которые кодируют разные промежуточные филаменты. Промежуточные филаменты в эпителиальных клетках содержат кератин, в периферических нейронах содержат периферин, а в саркомере в мышечных клетках содержит десмин. Основная структурная функция этих филаментов — укреплять клетки и организовывать их в ткани. Микротрубочки состоят из структурных белков, называемых тубулинами. Тубулины самоорганизуются, образуя микротрубочки, которые способствуют организации цитоплазмы, включая и расположение органелл. Микротрубочки также необходимы для митоза и деления клеток.
Поскольку структурные белки широко распространены, мутация в гене, кодирующем любой из этих белков, может иметь серьезные пагубные последствия. Например, мутация в гене, кодирующем коллаген, может привести к состоянию, известному как несовершенный остеогенез, которое характеризуется слабостью костей и деформациями соединительных тканей. Различные мутации в гене коллагена могут привести к синдрому Альпорта, который характеризуется проблемами в таких органах, как почки, глаза и уши.
Литература для дополнительного чтения
- Lodish, H., Berk, A., Zipursky, S. L., Matsudaira, P., Baltimore, D., & Darnell, J. (2000). Molecular cell biology 4th edition. National Center for Biotechnology Information, Bookshelf.
- Ricard-Blum, S. (2011). The collagen family. Cold Spring Harbor perspectives in biology, 3(1), a004978.
- Dominguez, R., & Holmes, K. C. (2011). Actin structure and function. Annual review of biophysics, 40, 169-186.
- Downing, K. H., & Nogales, E. (1998). Tubulin and microtubule structure. Current opinion in cell biology, 10(1), 16-22.
- Geisler, F., & Leube, R. E. (2016). Epithelial Intermediate Filaments: Guardians against Microbial Infection?. Cells, 5(3), 29. doi:10.3390/cells5030029
Публикации в СМИ
Очищенный белок BRCA2 поможет ученым разгадать, как мутации в кодирующем его гене приводят к возникновению рака.
После полутора десятилетий усилий биохимики наконец получили чистый раствор белка-супрессора опухолей BRCA2. Задача, выполненная одновременно в трех лабораториях, расширяет представления о том, как белок влияет на опухоль. Кроме того, полученный учеными белок приближает раскрытие того, как мутации в гене, кодирующем белок BRCA2, приводят к возникновению рака. Это позволит найти химические соединения, которые смогут заблокировать разрушительный процесс. Результаты исследований были опубликованы в журналах Nature [1] и Nature Structural & Molecular Biology [2,3].
BRCA2 – белок, связанный с развитием рака груди 2 типа – имеет весьма сомнительную славу: некоторые мутации в кодирующем его гене значительно повышают риск развития рака груди, яичников и многих других типов злокачественных опухолей. При этом в норме BRCA2 является белком-супрессором опухолевого роста, т.е. предотвращает возникновение злокачественных клеток.
Ген, кодирующий белок BRCA2, был обнаружен в 1994 г. Совместно с другими белками-супрессорами опухолевого роста, включая связанный с ним белок BRCA1, белок BRCA2 восстанавливает ДНК после повреждений, возникающих при делении клеток. Без белка BRCA2 фрагменты ДНК могут разрушаться, приводя к ошибкам при чтении генов и синтезе белка. Ученые получили чистые фракции белков, взаимодействующих с BRCA2, но до настоящего момента им не удавалось получить сам белок BRCA2, несмотря на то, что его функции были известны благодаря изучению аналогичного белка у червей, бактерий, а также при исследовании фрагментов белка BRCA2 человека.
«Самым серьезным препятствием работе был размер белка: BRCA2 состоит из 3 418 аминокислот, т.е. это белок огромных размеров. Я не знаю ни одного белка такого размера, который был бы очищен до такой же степени гомогенности», — рассказывает один из авторов статьи, биохимик из Калифорнийского Университета в Дэвисе (University of California, Davis) Вольф-Дитрих Хейер (Wolf-Dietrich Heyer) [2].
«Белок BRCA2 очень нестабилен, и для стабилизации он обычно образует комплексы с другими белками. До этого момента ученым удавалось получить лишь его фрагменты, загрязненные фрагментами других белков. BRCA2 было необходимо очень быстро очистить, и это было другим препятствием его выделению», — рассказывает автор другой статьи Стефан Ковальциковски (Stephen Kowalczykowski) [1].
Группе ученых под руководством Ковальциковски удалось «пришить» генетическую последовательность мальтоза-связывающего белка (maltose-binding protein) к гену белка BRCA2, что способствовало повышению растворимости синтезируемого белка и сделало его более стабильным. Выполненные манипуляции позволили ученым получить чистый белок BRCA2 из культуры эпителиальных клеток почек человека. Райен Энсен (Ryan Jensen), работающий над докторской диссертацией в лаборатории Ковальциковски и являющийся одним из авторов статьи, потратил четыре года на оптимизацию процесса очищения белка.
Группа ученых под руководством профессора Хейера применила немного другой способ выделения белка, получая его в культуре генетически модифицированных дрожжей [2]. В третьем исследовании [3], выполненном под руководством генетика Стефана Веста (Stephen West), ученые с помощью бактериальной плазмиды внедрили ген BRCA2 в культуру эпителиальных раковых клеток человека.
«Наконец-то получив белок, ученые могут провести различные эксперименты, которые до этого момента были невозможны. Результаты исследования имеют огромное значение не только для понимания механизма функционирования белка BRCA2, но также для работы с другими белками, которые с ним взаимодействуют», — говорит биохимик из Йельского Университета в Нью Хэвен (Yale University, New Haven) Патрик Сунг (Patrick Sung).
В трех исследованиях изучалось взаимодействие полноценного белка BRCA2 с другими белками, главным образом, с белком RAD51, который восстанавливает ДНК в местах ее разрывов. Изучив взаимодействия между BRCA2 и RAD51, три группы ученых независимо друг от друга пришли к заключению, что белок BRCA2 помогает белку RAD51 инициировать «монтаж» разрушенной области ДНК.
Большая часть исследований была посвящена изучению функций белка BRCA2. «Мы также раскрыли некоторые функции белка, которые могли стать известными только после проведения его биохимического анализа», — рассказывает Ковальциковски.
Например, ранее предполагалось, что белок BRCA2 участвует в устранении лишь одной из форм повреждения ДНК, однако изучение его взаимодействий с белками и ДНК позволило группе ученых во главе с Ковальциковски сделать вывод о том, что функции белка BRCA2 гораздо шире, чем считалось. «Свойства белка BRCA2 указывают на то, что он является основным медиатором восстановления ДНК после различных поломок», — говорит Ковальциковски. «Я не думаю, что при оценке результатов исследования мы сделали какие-либо неожиданные выводы. Прорыв был сделан потому, что ученые много работали в этом направлении», — добавляет Сунг.
Возможность очистить белок BRCA2 позволит биологам разрешить вопросы, связанные с его структурой, и получить дополнительную информацию о его функциях. «Результаты исследований позволят составить представление о «системе контроля за мутациями гена, кодирующего белок BRCA2, приводящими к развитию опухолей», ведь ученые могут ввести мутации в ген [i]BRCA2, а затем очистить полученный белок и понять воздействие мутаций на его функции»[/i], — говорит Сунг.
«То, что мы получили этот важнейший белок и знаем, как он себя ведет, означает, что мы можем использовать методы биохимического скрининга для получения новых лекарственных препаратов, которые остановят разрушение клеток мутантными формами белка», — заключает Ковальциковски.
Литература:
1. Jensen, R. B., Carreira, A. & Kowalczykowski, S. C. Nature advance online publication doi:10.1038/nature09399 (2010).
2. Liu, J., Doty, T., Gibson, B. & Heyer, W.-D. Nature Struct. Molec. Biol. advance online publication doi:10.1038/nsmb.1904 (2010).
3. Thorslund, T. et al. Nature Struct. Molec. Biol. advance online publication doi:10.1038/nsmb.1905 (2010).
По материалам: NatureNews
Функцией белков можно управлять с помощью света
Российские биохимики научились управлять функцией белков с помощью света. Такое «программирование» действия ферментов открывает возможности для регулирования самого широкого круга клеточных процессов в живом организме.
Контроль активности белков в организме – одна из важных задач биоорганической химии. Так, например, управление транскрипционными факторами – белками, отвечающими за перенос информации с молекулы ДНК на м-РНК, — позволит влиять на контролируемую ими морфологию клеток. Через белки можно управлять ответом организма на внеклеточные сигналы и изменение окружающей среды, а также процессами деления клеток и клеточными процессами старения. Однако исследования осложнены тем, что к ин-виво-контролю функции белков предъявляются очевидные дополнительные требования: воздействующие агенты должны быть безопасны для живого организма в целом. По этой причине относительно простые химические реакции, хорошо осуществляемые с белками in vitro, не подходят для перспективного медицинского применения: «малые» молекулы, используемые в них, например формальдегид, являются ядовитыми.
Из-за этого активация-деактивация ферментов с помощью света является предпочтительной, «бережной» методикой управления функцией белков. Исследование механизма модуляции активности рестрикционных ферментов с помощью ультрафиолетового или синего света публикует Proceedings of the National Academy of Sciences.
Рестриктазы — ферменты класса гидролаз, которые катализируют разрушение фосфодиэфирных связей (эти связи играют ключевую роль во всех биологических системах, образуя остов нуклеиновых кислот ДНК и РНК) чужеродных ДНК в большинстве прокариотических организмов — одноклеточных, не обладающих оформленным клеточным ядром, как, например, бактерии. Таким образом, рестриктазы выполняют своего рода «иммунную» функцию. Распознавание чужеродной ДНК осуществляется в специфических нуклеотидных последовательностях (сайтах), которые в собственной ДНК клетки «отмечены» определенными ферментами.
О результатах работы рассказала корреспонденту «Газеты. Ru» один из ее руководителей, заведующий отделом химии нуклеиновых кислот Института физико-химической биологии им. А. Н. Белозерского (НИИ ФХБ МГУ), доктор химический наук, профессор Татьяна Орецкая: «Один из возможных способов регулирования активности белков основан на введении в структуру последних «фотопереключателя», который позволяет изменить активность белка под действием света с определенной длиной волны. Это позволяет изменять активность белка в клетке без добавления химических реагентов, которые, кроме того, могут негативно влиять на клеточные процессы. Пока рано говорить о внедрении в практику предложенных нами подходов регулирования активности ферментов рестрикции при использовании в качестве «фотопереключателей» производных азобензола.
Однако в перспективе создание реагентов, которые способны модулировать активность клеточных белков, может привести к разработке биомедицинских препаратов нового поколения».
С помощью перекрестного сшивания остатков цистеина (аминокислоты, играющей важную роль в дезинтоксикационных процессах) в ферменте бифункциональным производным азобензола, которое может иметь как цис-, так и транс-конфигурацию в зависимости от длины волны света, которым его облучают (УФ или синего), активность фермента можно обратимо контролировать. При облучении синим светом азобензол находится в транс-конфигурации (фенильные заместители располагаются по разные стороны от двойной связи азот—азот), а в УФ-свете – в цис-конфигурации (заместители находятся по одну сторону от связи). Это позволяет изменить мотив упаковки конформационно подвижных цепей. Расстояние между SH-фрагментами цистеина значимо меняется (см. рисунок), что и позволяет модулировать функцию фермента.
Таким образом, функция сшитых остатков цистеина варьируется при смене освещения с УФ на синее, проявляя так называемый «эффект фотопереключателя».
Чтобы выяснить, какие именно остатки наиболее значимо реагируют на изменение света, было синтезировано более 30 вариантов одноцепной рестрикционной эндонуклеазы PvuII. Затем их модифицировали азобензолом и протестировали их способность расщеплять ДНК.
Обычно одиночные перекрестные сшивки в ферменте вызывают лишь небольшие изменения его действия, а значимые эффекты наблюдаются лишь при большом количестве перекрестных сшивок. Некоторые модифицированные ферменты несут сшитый фрагмент в непосредственной близости от активного центра. Именно их лучше всего получается «переключать» с помощью света – интенсивность расщепления ДНК менялась в 16 раз, при этом оставаясь обратимой. При этом изменение активности фермента происходит за считанные секунды.
«Наша работа проводилась в рамках международного проекта International Research Training Group «Enzymes and Multienzyme Complexes acting on Nucleic Acids» («Ферменты и мультиферментные комплексы, взаимодействующие с нуклеиновыми кислотами»). Наш коллектив первый, работающий в рамках этой программы в России и в Германии. С немецкой стороны в нем участвуют два университета – Университет Юстуса Либиха (г. Гиссен) и Университет Филиппа (г. Марбург). С российской стороны наш коллектив состоит из семи команд: пять из МГУ имени М. В. Ломоносова (химический факультет и НИИ ФХБ имени А. Н. Белозерского) и две из Института биологии гена РАН. В программе участвуют 20 аспирантов и молодых кандидатов наук из России. В таком большом коллективе мы работаем третий год, и результатом одного из научных контактов стала эта публикация. Что касается самой программы, с немецкой стороны она финансируется DFG (Deutsche Forschungsgemeinschaft, Немецкое исследовательское общество), а с российской – РФФИ (Российским фондом фундаментальных исследований)», — объяснила профессор Орецкая.
Белок р53 что это такое, в чем содержится больше всего
Белок Р53 — что это?
Одно из наиболее универсальных изменений в клетках опухолей, как доброкачественных, так и злокачественных, – это дисфункция белка р53.
Аномалия белка широко вовлечена в процесс развития новообразований и связана с предотвращением роста опухоли либо ее ингибированием. При этом измененная функция белка может стать и причиной активной опухолевой прогрессии. Все это делает невозможным применение белка как прогностического маркера и мишени воздействия терапевтического лечения.
Локализуется р53 в ядре, являясь продуктом гена ТР53, находящегося на 17 хромосоме. Белок признан антионкогеном, так как является препятствием для возникновения опухолей злокачественного характера. Как основной компонент системы охраны организма на внутриклеточном масштабе белок работает на недопущении размножения клеток, у которых структура ДНК повреждена.
Генетические мутации ТР53 считаются самыми распространенными для атипичных клеток. Статистика говорит о почти 80% крупных опухолей с поврежденными ДНК в гене ТР53.
Программируемая клеточная гибель и злокачественные новообразования
Образование раковой опухоли всегда идет бок о бок со сбоем механизма программируемой клеточной гибели, или иначе опоптоза, контролируемого белком. Функционируя в рамках нормы, он не дает атипичным клеткам бесконтрольно делиться. Если же молекула ДНК в клетке повреждена, р53 останавливает процесс ее деления до устранения повреждения, либо запускает программу, способствующую ее уничтожению.
Механизм, направленный на уничтожение клетки, срабатывает лишь в случае, если ген ТР53 не поврежден. Если же происходит процесс его изменения, клетка превращается в накопитель мутантного белка, привычные функции уже не выполняются.
Так нарушается механизм, отвечающий за включение программы по уничтожению атипичных клеток, а значит, опухоль развивается.
Диагностические методы
Для выявления мутаций в гене ТР53 используют несколько диагностических процедур:
- Метод секвенирования. Обследование помогает расшифровать последовательность гена, это необходимо для нахождения всех изменений, произошедших в нем. Изменения эти обнаруживаются в нормальных клетках, в этом случае мутации увеличивают риск того, что нормальные клетки переродятся в патогенные. Обнаружение изменений в атипичных клетках обозначает дальнейшее развитие опухли. Секвенирование применимо, если возникает подозрение на синдромы, связанные с наследственностью.
- Анализ иммуногистохимический. Это основной диагностический метод. С помощью него оценивают преобразования в ткани р53, а также нарушения функции гена и его активность. С помощью анализа различают аномалии формирования и развития новообразования злокачественного характера.
- Метод полимеразной цепной реакции. Используется в настоящее время достаточно редко, так как считается устаревшим. Но для подтверждения наличия либо отсутствия мутации вполне применим.
- Метод иммуногистохимический. С его помощью по концентрации р53 косвенно оценивают характеристики гена ТР53. Дело в том, что нормальная концентрация белка может существенно отличаться для разных тканей. Поэтому вначале выполняют биопсию, а затем исследуют биоптат в лаборатории, добавляя к изъятому в ходе биопсии материалу меченные красителем антитела.
Мутация в гене далеко не всегда приводит к возникновению опухоли, а лишь повышает вероятность этого события. Выявленное нарушение функций ТР53 необходимо интерпретировать, учитывая клиническую картину.
Клиника интегративной онкологии Onco.Rehab, один из признанных лидеров своего направления, комплексно применяет в лечении заболеваний самые современные методы и технологии.
ВИЧ
Ви́рус иммунодефици́та челове́ка — ретровирус из рода лентивирусов, вызывающий медленно прогрессирующее[3] заболевание — ВИЧ-инфекцию[4][5].
Вирус поражает клетки иммунной системы, имеющие на своей поверхности рецепторы CD4: Т-хелперы, моноциты, макрофаги, клетки Лангерганса[6], дендритные клетки, клетки микроглии[7]. В результате работа иммунной системы угнетается и развивается синдром приобретённого иммунного дефицита (СПИД), организм больного теряет возможность защищаться от инфекций и опухолей, возникают вторичные оппортунистические заболевания, которые не характерны для людей с нормальным иммунным статусом[8][9][10][11][12][13]. Без врачебного вмешательства оппортунистические заболевания вызывают смерть пациента в среднем через 9—11 лет после заражения (в зависимости от подтипа вируса)[10]. При проведении антиретровирусной терапии продолжительность жизни пациента может быть продлена до 70—80 лет[14][15][16].
Вакцина против ВИЧ неизвестна[17].
Открытие ВИЧ
Изображение, сделанное растровым электронным микроскопом. В центре кадра находится заражённый T-лимфоцит. Многочисленные светлые круглые выпуклости на его поверхности — места сборки и отпочковывания вирионов вируса иммунодефицита человека[18]
Изображение вирионов, полученное при помощи просвечивающего электронного микроскопа. Видно строение вирионов, внутри которых находится конусообразное ядро[19]
В 1981 году появились первые три научные статьи о необычных случаях развития пневмоцистной пневмонии и саркомы Капоши у гомосексуальных мужчин[20][21]. До этого оба заболевания встречались редко и были характерны для совершенно разных групп пациентов: саркомой Капоши в основном болели пожилые мужчины средиземноморского происхождения, а пневмоцистной пневмонией — пациенты с лейкозом после интенсивной химиотерапии. Появление этих заболеваний, свидетельствующих о тяжёлом иммунодефицитном состоянии, у молодых людей, не входящих в соответствующие группы риска, наблюдалось впервые[21]. Затем обнаружили такие же симптомы среди наркопотребителей, больных гемофилией A[22] и гаитян[23][24]. Наиболее значимым было обнаружение снижения соотношения CD4+/CD8+-клеток в результате относительного и/или абсолютного уменьшения количества CD4+-лимфоцитов в сочетании с увеличением количества CD8+-лимфоцитов[21][25][26].
В июле 1982 года для обозначения этого состояния был предложен термин синдром приобретённого иммунного дефицита (СПИД, AIDS)[27]. В сентябре 1982 года СПИДу было дано полноценное определение как нозологической форме на основании наблюдения ряда оппортунистических инфекций у четырёх групп пациентов, указанных выше[21][28].
В период с 1981 по 1984 год вышло несколько работ, связывающих вероятность развития СПИДа с анальным сексом или с влиянием наркотиков[29][30][31][32][33][34]. Параллельно велись работы над гипотезой о возможной инфекционной природе СПИДа.
Вирус иммунодефицита человека независимо открыли в 1983 году в двух лабораториях: Институте Пастера во Франции под руководством Люка Монтанье и Национальном институте рака в США под руководством Роберта Галло. Результаты исследований, в которых из тканей пациентов с симптомами СПИДа впервые удалось выделить новый ретровирус, были опубликованы 20 мая 1983 года в журнале Science[35][36]. В этих же работах выделенный из больных СПИДом вирус был впервые успешно размножен в культивируемых Т-лимфоцитах. Французская группа исследователей показала, что серологически этот вирус отличается от HTLV-I, и назвала его LAV («вирус, ассоциированный с лимфаденопатией»), а американская группа назвала его HTLV-III, ошибочно отнеся к группе HTLV-вирусов. Исследователи выдвинули предположение, что вирус может вызывать синдром приобретённого иммунного дефицита[21].
В 1986 году было обнаружено, что вирусы, открытые в 1983 французскими и американскими исследователями, генетически идентичны. Первоначальные названия вирусов были упразднены и предложено одно общее название — вирус иммунодефицита человека[37]. В 2008 году Люк Монтанье и Франсуаза Барр-Синусси были удостоены Нобелевской премии в области физиологии или медицины «за открытие вируса иммунодефицита человека»[38].
ВИЧ-инфекция
Инфицирование
Основная статья: Инфицирование вирусом иммунодефицита человека
Вирус может передаваться через прямой контакт повреждённой слизистой оболочки или повреждённой кожи здорового человека с биологическими жидкостями заражённого человека: кровью, предсеменной жидкостью (выделяющейся на протяжении всего полового акта), спермой, секретом влагалища и грудным молоком. Передача вируса может происходить при незащищённом анальном, вагинальном или оральном сексе[39][40].
Интактная, неповреждённая кожа — является эффективным барьером для инфекции, так как в коже отсутствуют клетки, которые могут быть заражены ВИЧ. Для успешной инфекции требуется прямой контакт с кровеносной системой или с мембранами клеток слизистых оболочек. Слизистые оболочки половых органов и прямой кишки часто получают незначительные повреждения при половом акте, через которые вирус может проникать в кровь. Такие повреждения чаще возникают при наличии заболеваний, передающихся половых путём, например, в случае герпеса. С другой стороны, заражение возможно и в случае неповреждённой слизистой оболочки, так как последние содержат значительное количество дендритных клеток (в том числе, клеток Лангерганса), которые могут играть роль «переносчиков» вирусных частиц в лимфатические узлы. Поэтому особенно опасной формой полового акта для принимающего партнёра является незащищённый анальный секс, так как при этой форме возникает наибольшее число мелких и крупных повреждений[41][42].
Передача вируса происходит с большей вероятностью при использовании заражённых игл и шприцев (особенно потребителями инъекционных наркотиков), а также при переливании крови (в случае нарушения медицинским персоналом установленных процедур проверки донорской крови)[43]. Также передача вируса может произойти между матерью и ребёнком во время беременности, родов (заражение через кровь матери)[44][45] и при грудном вскармливании (причём как от заражённой матери к здоровому ребёнку через грудное молоко, так и от заражённого ребёнка к здоровой матери через покусывание груди во время кормления)[46].
Вирус не передаётся воздушно-капельным путём, бытовым путём, при соприкосновении с неповреждённой кожей, через укусы насекомых[47], слёзы[48] и слюну (из-за того, что концентрация вирионов ВИЧ в этих жидкостях ниже инфицирующей дозы, а также из-за того, что слюна — агрессивная среда, разрушающая своими ферментами вирионы ВИЧ)[48].
Болезнь
Основная статья: ВИЧ-инфекция
Динамика количества CD4+-лимфоцитов и копий РНК вируса за период от момента инфицирования до терминальной стадии[49] количество CD4+лимфоцитов в 1 мкл крови
количество копий РНК вируса в 1 мл плазмы крови
В течении болезни выделяют три стадии: острую инфекцию, латентный период и терминальную стадию (СПИД) (см. иллюстрацию). В ходе развития ВИЧ-инфекции у одного и того же человека в результате мутаций возникают новые штаммы вируса, которые различаются по скорости воспроизведения и способности инфицировать[8][9]. Размножившись, вирусные частицы высвобождаются из поражённых клеток и внедряются в новые — цикл развития повторяется. Инфицированные вирусом Т-хелперы постепенно гибнут из-за разрушения вирусом, апоптоза или уничтожения Т-киллерами. В процессе развития ВИЧ-инфекции количество Т-хелперов (CD4+-клеток) снижается настолько, что организм уже не может противостоять возбудителям оппортунистических инфекций, которые неопасны или мало опасны для здоровых людей с нормально функционирующей иммунной системой. На терминальной стадии (СПИД), ослабленный организм поражают бактериальные, грибковые, вирусные и протозойные инфекции, а также опухоли[11][12][13]. В отсутствие антиретровирусной терапии смерть пациента наступает не в результате размножения вируса в CD4+-клетках, а по причине развития оппортунистических заболеваний (вторичных по отношению к ВИЧ-инфекции).
Эпидемиология
Основная статья: Эпидемиология ВИЧ-инфекции
По данным на 2011 год, в мире за всё время ВИЧ-инфекцией заболели 60 миллионов человек, из них: 25 миллионов умерли, а 35 миллионов живут с ВИЧ-инфекцией[50]. Более двух третей из них проживают в Африке к югу от пустыни Сахара[51]. Эпидемия началась здесь в конце 1970-х — начале 1980-х. Затем эпидемия перекинулась в США, Западную Европу и страны Южной Африки. Сегодня, за исключением стран Африки, быстрее всего вирус распространяется в Центральной Азии и Восточной Европе (в том числе в России). Эпидемическая ситуация в этих регионах сдерживалась до конца 1990-х, затем с 1999 по 2002 годы количество инфицированных почти утроилось — в основном за счёт инъекционных наркоманов. Значительно ниже среднего ВИЧ-инфекция распространена в Восточной Азии, Северной Африке и на Ближнем Востоке. В масштабе планеты эпидемическая ситуация стабилизировалась, количество новых случаев ВИЧ-инфекции снизилось с 3,5 миллионов в 1997 году до 2,7 миллионов в 2007 году[51]. По данным на конец 2015 года, в России 804 тысячи человек живут с ВИЧ-инфекцией, за период с 1986 по 2016 год умерло от разных причин 220 тысяч ВИЧ-инфицированных граждан России[52] (подробнее см. Статистика заболеваемости и смертности по России).
Диагностика
Основная статья: Тест на ВИЧ
Анализ крови позволяет обнаружить антитела к белкам вируса (ИФА), реакцию антител на белки вируса (вестерн-блот), РНК вируса (ОТ-ПЦР)[53]. Определение вирусной нагрузки (подсчёт количества копий РНК вируса в миллилитре плазмы крови) позволяет судить о стадии заболевания и эффективности лечения[54][55].
Обязательная проверка донорской крови в развитых странах в значительной степени сократила возможность передачи вируса при её использовании. Тестирование на ВИЧ беременных женщин позволяет своевременно начать приём лекарств и родить здорового ребёнка.
Существует мнение, что принудительное тестирование населения бесперспективно с точки зрения сдерживания эпидемии[56] и нарушает права человека[57]. В России проведение теста без согласия человека является незаконным[58], однако существуют ситуации, в которых предоставление результатов тестирования на ВИЧ является обязательным, но не насильственным (донорство, трудоустройство медицинских работников, для иностранных граждан, получающих разрешение на пребывание в РФ, в местах лишения свободы при наличии клинических показаний)[59].
Лечение
Основная статья: Высокоактивная антиретровирусная терапия
Из 35 миллионов человек, живущих с ВИЧ-инфекцией, часть остаётся в живых благодаря антиретровирусной терапии. В случае отсутствия антиретровирусной терапии ВИЧ-инфекции, смерть наступает в среднем через 9—11 лет после заражения[8][60]. При проведении антиретровирусной терапии продолжительность жизни пациента составляет 70—80 лет[14][15][16]. Антиретровирусные препараты мешают ВИЧ размножаться в клетках иммунной системы человека, блокируя внедрение вирионов в клетки и нарушая на разных этапах процесс сборки новых вирионов. Своевременно начатое лечение антиретровирусными препаратами в сотни раз снижает риск развития СПИДа и последующей смерти[61][62][63]. Антиретровирусные препараты у части пациентов вызывают побочные эффекты, в некоторых случаях даже требующие сменить схему лечения (набор принимаемых лекарств).
Терапию назначают при снижении иммунитета и/или высокой вирусной нагрузке. В случае, если число CD4+-лимфоцитов велико и вирусная нагрузка низкая, терапию не назначают. После назначения терапии лекарства нужно принимать ежедневно в одно и то же время и пожизненно, что создаёт неудобства для пациентов. Также следует учитывать высокую стоимость месячного курса лекарств. В 2014 году необходимые лекарства получали менее половины из 9,5 млн человек, нуждающихся в противовирусной терапии[64].
Также все беременные женщины с острой фазой ВИЧ-инфекции, должны начинать незамедлительную ВААРТ для предотвращения передачи ВИЧ плоду[65].
Согласно рекомендациям ВОЗ, ВААРТ следует незамедлительно начинать всем ВИЧ-инфицированным детям до полутора лет[66]. Начало терапии у детей, получивших ВИЧ от матери, в течение 3 месяцев после родов, снижает смертность на 75 %[67]. В отсутствие лечения, треть ВИЧ-инфицированных детей умирает в течение первого года жизни и 50 % в течение второго года. В случае, когда диагностика ВИЧ невозможна, лечение следует начинать в возрасте 9 месяцев, либо ранее, в случае появления симптомов[68].
По состоянию на февраль 2016 года было объявлено, что группе немецких учёных удалось полностью удалить тип ВИЧ-1 из живых клеток. Испытания проводились на клетках человека, вживлённых подопытным мышам. Испытания на людях должны проводиться в ближайшее время[69][70][71].
Классификация
Основная статья: Лентивирусы
Вирус иммунодефицита человека относят к семейству ретровирусов (Retroviridae), роду лентивирусов (Lentivirus). Название Lentivirus происходит от латинского слова lente — медленный. Такое название отражает одну из особенностей вирусов этой группы, а именно — медленную и неодинаковую скорость развития инфекционного процесса в макроорганизме. Для лентивирусов также характерен длительный инкубационный период[72].
Для вируса иммунодефицита человека характерна высокая частота генетических изменений, возникающих в процессе самовоспроизведения. Частота возникновения ошибок у ВИЧ составляет 10−3 — 10−4 ошибок на геном на цикл репликации, что на несколько порядков больше аналогичной величины у эукариот. Размер генома ВИЧ составляет примерно 104 нуклеотидов. Из этого следует, что практически каждый дочерний геном хотя бы на один нуклеотид отличается от своего предшественника. В современной классификации различают два основных вида ВИЧ — ВИЧ-1 и ВИЧ-2. Эти вирусы предположительно возникли в результате независимой передачи людям SIV (вируса иммунодефицита обезьян) шимпанзе и мангабеев соответственно[73].
И ВИЧ-1, и ВИЧ-2 способны вызывать серьёзный иммунодефицит, однако клиническое течение болезни несколько различается. Известно, что ВИЧ-2 менее патогенен и передаётся с меньшей вероятностью, чем ВИЧ-1. Вероятно, это связано с тем, что ВИЧ-2-инфекция характеризуется более низким числом вирусных частиц на миллилитр крови. Отмечено, что инфекция ВИЧ-2 обеспечивает носителю небольшую защиту от заражения ВИЧ-1. Однако описаны случаи двойной инфекции, причём заражение может происходить в любом порядке. Инфекция ВИЧ-2 реже заканчивается развитием СПИДа. Есть сведения о несколько большей частоте развития саркомы Капоши, кандидоза ротовой полости и хронической лихорадки при ВИЧ-1/СПИДе. При ВИЧ-2/СПИДе чаще развивается энцефалит, хроническая или бактериальная диарея, серьёзные цитомегаловирусные инфекции и холангит[73]. К роду Lentivirus также относят виды, вызывающие схожие заболевания у обезьян, кошек, лошадей, овец и т. д.[8][74][75].
ВИЧ-1
ВИЧ-1 описан в 1983 году и является наиболее распространённым и патогенным видом ВИЧ[76]. Глобальная эпидемия ВИЧ-инфекции главным образом обусловлена распространением ВИЧ-1. В подавляющем большинстве случаев, если не оговорено иначе, под ВИЧ подразумевают ВИЧ-1[77].
Вид ВИЧ-1 классифицируют на главную группу М и несколько побочных групп. Считается, что группы M, N, O, P образовались в результате независимых случаев передачи SIV от обезьяны к человеку, и последующей мутации вируса до ВИЧ[78].
- Вирусы группы М (англ. Main — основная) являются причиной более 90 % случаев ВИЧ-инфекции. Группу М классифицируют на несколько клад, называемых подтипами, также обозначаемых буквами:
- Подтип A широко распространён, например, в Западной Африке и России[79];
- Подтип B доминирует в Европе, Северной Америке, Южной Америке, Японии, Таиланде, Австралии[80];
- Подтип C преобладает в Южной и Восточной Африке, Индии, Непале, некоторых частях Китая[80];
- Подтип D обнаружен только в Восточной и Центральной Африке[80];
- Подтип E не был выявлен в нерекомбинантном виде, лишь совместно с подтипом А как CRF01_AE в Юго-Восточной Азии[80];
- Подтип F выявлен в Центральной Африке, Южной Америке и Восточной Европе[81];
- Подтип G и рекомбинантная форма CRF02_AG выявлены в Африке и Центральной Европе[81];
- Подтип H обнаружен только в Центральной Африке[81];
- Подтип I был предложен для описания штамма-продукта множественной рекомбинации CRF04_cpx нескольких подтипов[82];
- Подтип J распространён в Северной, Центральной и Западной Африке и странах Карибского бассейна[83];
- Подтип K обнаружен только в Конго и Камеруне[81].
- Группа O (англ. Outlier — непохожий) обнаружена в Центральной Африке и Западной Африке. Наиболее распространена в Камеруне, где в 1997 году более 2 % пациентов были заражены вирусом группы О[84] (около 100 000 человек, по данным на 2013 год)[85]. Вирусы этой группы не определялись ранними версиями тест-систем на ВИЧ-1, современные тесты определяют вирусы и группы О, и группы N[86].
- Группа N (англ. Non-M, non-O — ни M, ни O) обозначает штаммы не М и не О, описана в 1998 году и обнаружена только в Камеруне. С 2006 года выявлены лишь 10 заражений вирусами группы N[87].
- Группа P — в 2009 году была определена нуклеотидная последовательность РНК ВИЧ, значительно сходная с вирусом иммунодефицита обезьян, описанным у горилл (SIVgor), но не с SIV, характерным для шимпанзе (SIVcpz). Вирус был выделен из образцов, полученных от женщины камерунского происхождения, проживающей во Франции[88][89][90].
ВИЧ-2
ВИЧ-2 идентифицирован в 1986 году[91], генетически очень близок к T-лимфотропному вирусу SIVsmm мангабеев, и в меньшей степени к вирусу ВИЧ-1. Геномы ВИЧ-1 и ВИЧ-2 имеют гомологию консервативных генов gag и pol около 60 %, и до 45 % генов белков оболочки[92]. По состоянию на 2010 год, описано 8 групп ВИЧ-2, лишь группы A и B являются эпидемическими. Вирусы группы А распространены в Западной Африке, Анголе, Мозамбик, Бразилии, Индии и мало распространены в США и Европе[93][94]. Вирусы группы В распространены в Западной Африке[95][96].
Строение вириона
Строение вируса иммунодефицита человека
Вирионы ВИЧ имеют вид сферических частиц, диаметр которых составляет около 100—120 нанометров[97]. Это приблизительно в 60 раз меньше диаметра эритроцита[98]. В состав зрелых вирионов входит несколько тысяч белковых молекул различных типов.
Капсид зрелого вириона, состоящий из примерно 2000 молекул белка р24, имеет форму усечённого конуса[99].
Внутри капсида находится белково-нуклеиновый комплекс: две нити вирусной РНК, прочно связанные с белком нуклеокапсида p7, ферменты (обратная транскриптаза, протеаза, интеграза)[99]. С капсидом также ассоциированы белки Nef и Vif (7—20 молекул Vif на вирион). Внутри вириона (и, вероятнее всего, за пределами капсида) обнаружен белок Vpr[39]:8-11. Кроме того, с капсидом ВИЧ-1 (но не ВИЧ-2) связаны около 200 копий клеточного фермента пептидилпролилизомеразы A[en] (циклофилин А), необходимого для сборки вириона[100].
Капсид окружён оболочкой, образованной примерно 2000 молекул матриксного белка p17[99]. Матриксная оболочка в свою очередь окружена двуслойной липидной мембраной, являющейся наружной оболочкой вируса. Она образована молекулами фосфолипидов, захваченными вирусом во время его отпочковывания от клетки, в которой он сформировался[101]. В липидную мембрану встроены 72 гликопротеиновых комплекса Env, каждый из которых образован тремя молекулами трансмембранного гликопротеина gp41 (TM), служащего «якорем» комплекса, и тремя молекулами поверхностного гликопротеина gp120 (SU)[100]. С помощью белка gp120 вирус присоединяется к рецептору CD4 и корецептору, находящимся на поверхности Т-лимфоцитов человека. Стехиометрическое соотношение p24:gp120 в вирионе составляет 60—100:1[39]:11. При формировании наружной оболочки вируса также происходит захват некоторого количества мембранных белков клетки, в том числе человеческих лейкоцитарных антигенов (HLA) классов I и II и молекул адгезии[99][102].
Белки вириона интенсивно изучаются, поскольку являются мишенями разрабатываемых лекарств и вакцины против ВИЧ.
Функции важных структурных белков ВИЧ-1[99][102]
Сокращение | Описание | Функции |
---|---|---|
gp41 (TM, transmembrane) | Трансмембранный гликопротеин массой 41 кДа | Располагается во внешнем слое липидной мембраны, играет роль «якоря», удерживающего молекулы белка gp120 |
gp120 (SU, surface) | Гликопротеин массой 120 кДа | Наружный белок вириона. Нековалентно связан с трансмембранным белком gp41. С одной молекулой gp41 связаны 3—5 молекул gp120. Способен связывать рецептор CD4. Играет важную роль в процессе проникновения вируса в клетку. |
p24 (CA, capsid) | Белок массой 24 кДа | Образует капсид вируса |
p17 (MA, matrix) | Матриксный белок массой 17 кДа | Около двух тысяч молекул этого белка образуют слой толщиной 5—7 нм, располагающийся между внешней оболочкой и капсидом вируса. |
p7 (NC, nucleocapsid) | Нуклеокапсидный белок массой 7 кДа | Входит в состав капсида вируса. Образует комплекс с вирусной РНК. |
Геном и кодируемые белки
Геном ВИЧ-1[99]
Генетический материал ВИЧ представлен двумя копиями положительно-смысловой (+)РНК[100]. Геном ВИЧ-1 имеет длину 9000 нуклеотидов. Концы генома представлены длинными концевыми повторами (англ. long terminal repeat, LTR), которые управляют продукцией новых вирусов и могут активироваться и белками вируса, и белками инфицированной клетки.
9 генов ВИЧ-1 кодируют, по крайней мере, 15 белков[103]. Ген pol кодирует ферменты: обратную транскриптазу (RT), интегразу (IN) и протеазу (PR). Ген gag кодирует полипротеин Gag/p55, расщепляемый вирусной протеазой до структурных белков p6, p7, p17, p24. Ген env кодирует белок gp160, расщепляемый клеточной эндопротеазой фурином на структурные белки gp41 и gp120[39]:8-12. Другие шесть генов — tat, rev, nef, vif, vpr, vpu (vpx у ВИЧ-2) — кодируют белки, отвечающие за способность ВИЧ-1 инфицировать клетки и производить новые копии вируса. Репликация ВИЧ-1 in vitro возможна без генов nef, vif, vpr, vpu, однако их продукты необходимы для полноценной инфекции in vivo[104][105][106].
Gag
Полипротеин-предшественник Gag/p55 синтезируется с полноразмерной геномной РНК (которая в данном случае служит в качестве мРНК) в процессе стандартной кэп-зависимой трансляции, но возможна и IRES-зависимая трансляция. Предшественники функциональных белков располагаются в составе полипротеина Gag/p55 в следующем порядке: p17…p24…p2…p7…p1…p6[39]:8 (р1 и р2 — соединительные пептиды; другие продукты расщепления Gag/p55 описаны выше). Нерасщеплённый протеазой Gag/p55 содержит три основных домена: домен мембранной локализации (М, membrane targeting), домен взаимодействия (I, interaction) и «поздний» домен (L, late). Домен М, расположенный внутри области p17/МА, миристилируется (присоединяются остатки миристиновой кислоты) и направляет Gag/p55 к плазматической мембране. Домен I, находящийся внутри области p7NC (NC, nucleocapsid), отвечает за межмолекулярные взаимодействия отдельных мономеров Gag/p55. Домен L, также локализованный в области p7NC, опосредует отпочковывание вирионов от плазматической мембраны; в этом процессе участвует также р6 область полипротеина Gag/p55[39]:8[107].
Vpu
Двумя важными функциями белка Vpu являются: 1) разрушение клеточного рецептора CD4 в эндоплазматическом ретикулуме путём привлечения убиквитинлигазных комплексов и 2) стимуляция выделения дочерних вирионов из клетки, путём инактивации интерферон-индуцируемого трансмембранного белка CD317/BST-2, получившего также название «tetherin» за его способность подавлять выделение вновь образовавшихся дочерних вирионов посредством их удержания на поверхности клетки[104][105][108][109][110][111].
Vpr
Белок Vpr необходим для репликации вируса в неделящихся клетках, в том числе макрофагах. Этот белок, наряду с другими клеточными и вирусными белками, активирует транскрипцию с использованием длинных концевых повторов генома ВИЧ в качестве промоторов. Белок Vpr играет важную роль в переносе вирусной ДНК в ядро и вызывает задержку деления клетки в периоде G2[112].
Vif
Белок Vif играет важную роль в поддержке репликации вируса. Vif индуцирует убиквитинилирование и деградацию клеточного антивирусного белка APOBEC3G, который вызывает деаминирование ДНК, приводящее к мутационным заменам G на A в вирусной ДНК, синтезируемой в ходе обратной транскрипции. Штаммы, лишённые Vif, не реплицируются в CD4+-лимфоцитах, некоторых линиях T-лимфоцитов и макрофагах. Эти штаммы способны проникать в клетки-мишени и начинать обратную транскрипцию, однако синтез вирусной ДНК остаётся незавершённым[112].
Nef
Белок Nef выполняет несколько функций. Он подавляет экспрессию молекул CD4 и HLA классов I и II на поверхности инфицированных клеток, и тем самым позволяет вирусу ускользать от атаки цитотоксических T-лимфоцитов и от распознавания CD4+-лимфоцитами. Белок Nef может также угнетать активацию T-лимфоцитов, связывая различные белки-компоненты систем внутриклеточной передачи сигнала[112].
У инфицированных вирусом иммунодефицита макак-резусов активная репликация вируса и прогрессирование болезни возможны только при интактном гене nef. Делеции гена nef были обнаружены в штаммах ВИЧ, выделенных у группы австралийцев с длительным непрогрессирующим течением инфекции[113]. Однако у части из них со временем появились признаки прогрессирования инфекции, в том числе снижение числа CD4+-лимфоцитов. Таким образом, хотя делеции гена nef и могут замедлять репликацию вируса, это не гарантирует полной невозможности прогрессирования заболевания[114].
Tat и Rev
Регуляторные белки Tat (транс-активатор) и Rev накапливаются в ядре клетки и связывают определённые участки вирусной РНК. Белок Tat имеет молекулярную массу около 14-15 кДа, связывает вторичную структуру геномной РНК вблизи 5′-нетранслируемой области[112][115]., активирует обратную транскрипцию геномной РНК ВИЧ, синтез вирусных мРНК, необходим для репликации вируса почти во всех культурах клеток, регулирует выход вирионов из заражённых клеток[112][115], нуждается в клеточном кофакторе — циклине T1. Белок Rev регулирует экспрессию белков вириона, связывает мРНК гена env в области RRE (англ. Rev response element) интрона, разделающего экзоны генов Tat и Rev[112][115]
Белки Tat и Rev стимулируют транскрипцию провирусной ДНК и транспорт РНК из ядра в цитоплазму, а также необходимы для трансляции. Белок Rev обеспечивает также транспорт компонентов вируса из ядра и переключение синтеза регуляторных белков вируса на синтез структурных[112].
Жизненный цикл
До проникновения в клетку-мишень
После попадания вирионов ВИЧ на поверхность и внутрь организма, вирусные частицы оказываются в различных по своей агрессивности биологических жидкостях. Слюна и желудочный сок содержат ферменты, которые в бо́льшей степени разрушают вирионы ВИЧ, чем другие биологические жидкости (это не относится к младенцам первых месяцев жизни, у которых ещё не вырабатываются соответствующие ферменты пищеварения, из-за чего младенцы могут быть заражены через грудное молоко). Вирионы ВИЧ проникают в кровеносную и лимфатическую систему организма и перемещаются по организму в потоке крови и лимфы. Оказавшись рядом с CD4-клеткой, вирионы ВИЧ связывают рецептор CD4 на её плазматической мембране[116].
Проникновение в клетку и обратная транскрипция
Механизм слияния вириона ВИЧ и плазматической мембраны Т-лимфоцита человека 1. Взаимодействие вирусного белка gp120 с клеточным рецептором CD4 (указано красной стрелкой) 2. Конформационные изменения вирусного белка gp120 обеспечивают связывание с клеточным рецептором CCR5 (указано красной стрелкой) 3. Концевые участки вирусного белка gp41 проникают в плазматическую мембрану клетки (указано красной стрелкой) 4. Вирусный белок gp41 подвергается значительным конформационным изменениям (указано красной стрелкой), что приводит к сближению и слиянию мембран вириона и клетки |
Вирусный гликопротеин gp120 прочно связывает рецептор CD4. В результате такого взаимодействия gp120 претерпевает конформационные изменения, которые позволяют ему также связать молекулу корецептораCXCR4 или CCR5 (экспрессируемых на поверхности Т-лимфоцитов, макрофагов, дендритных клеток и микроглии)[117][118]. В зависимости от способности связывать эти корецепторы, ВИЧ классифицируют на R5-тропные (связывают только корецептор CCR5), X4-тропные (связывают только корецептор CXCR4) и R5X4-тропные (могут взаимодействовать с обоими корецепторами) варианты[117]. При заражении, в основном, передаются R5-тропные и R5X4-тропные варианты[119]. Препараты, блокирующие корецепторы, могут быть эффективны против ВИЧ[120].
После описанных событий вирусный белок gp41 проникает в мембрану клетки и подвергается значительным конформационным изменениям, вследствие которых мембрана клетки и мембрана вириона ВИЧ сближаются друг с другом и затем сливаются. Вирусный белок gp41 очень важен для слияния мембран, поэтому его рассматривают в качестве мишени для разработки противовирусных препаратов.
После слияния мембран содержимое вириона проникает внутрь клетки. Внутри клетки вирусная РНК высвобождается из капсида. Затем под действием обратной транскриптазы происходит обратная транскрипция — процесс синтеза ДНК на основании информации в одноцепочечной геномной РНК вируса[121]. Большая часть лекарственных препаратов, одобренных для применения при ВИЧ-инфекции, направлена на нарушение работы обратной транскриптазы[8].
Транспорт вирусной ДНК в ядро и интеграция в геном
После завершения обратной транскрипции в CD4+-лимфоците вирусный геном представлен невстроенной ДНК. Для встраивания вирусной ДНК в геном клетки-хозяина и для образования новых вирусов необходимаактивация T-лимфоцитов. Активация CD4+-лимфоцитов происходит при их контакте с антигенпредставляющими клетками в лимфоидной ткани. Наличие вирусов на поверхности фолликулярных дендритных клеток и присутствие провоспалительных цитокинов (ИЛ-1, ИЛ-6 и ФНОα) способствуют размножению ВИЧ в инфицированных клетках. Именно поэтому лимфоидная ткань служит самой благоприятной средой для репликации ВИЧ[122].
Синтезированная вирусная ДНК транспортируется внутрь ядра клетки в составе пре-интеграционного комплекса, в который также входят белки ВИЧ p17/MA, Nef и интеграза[123]. Далее вирусная ДНК встраивается в хромосому активированного T-лимфоцита под действием интегразы. Несколько препаратов, ингибирующих интегразу, широко используются в современной комплексной антиретровирусной терапии. Вирусная ДНК, встроившаяся в хромосому клетки, называется провирусом[8].
Транскрипция, сплайсинг, транспорт РНК из ядра в цитоплазму и трансляция
В ядре клеточная РНК-полимераза синтезирует предшественник вирусных информационных РНК (мРНК), длина которого равна длине геномной РНК ВИЧ-1. Этот предшественник мРНК подвергается 5′-концевому кэпированию и 3′-концевому полиаденилированию. Кроме того, предшественник мРНК подвергается сплайсингу, в результате которого образуются более 40 разных мРНК, которые можно разделить на 3 класса[124]:
- несплайсированная РНК длиной около 9.3 kb — далее используется в качестве мРНК для синтеза белков Gag и Gag-Pol, а также в качестве геномной РНК;
- неполностью сплайсированные РНК размером около 4 kb — используются как мРНК для синтеза белков Vif, Vpr, Tat, Vpu и Env;
- полностью сплайсированные РНК размером около 2 kb — используются как мРНК для синтеза белков Vpr, Tat, Rev и Nef.
На ранней стадии экспрессии генов, в отсутствие белка Rev, несплайсированная и неполностью сплайсированные РНК ВИЧ-1 нестабильны и быстро разрушаются в ядре. В то же время, полностью сплайсированные мРНК ВИЧ-1 являются стабильными и транспортируются из ядра в цитоплазму[124]. В цитоплазме с помощью рибосом происходит процесс трансляции — биосинтез белка из аминокислот по заданной матрице на основе генетической информации, содержащейся в мРНК. Синтезированный в цитоплазме белок Rev транспортируется в ядро, где связывается с областью RRE несплайсированной и неполностью сплайсированных РНК, что стабилизирует эти РНК. Кроме того, Rev взаимодействует с клеточным белком CRM1 (экспортин 1), и это взаимодействие стимулирует транспорт несплайсированной и неполностью сплайсированных РНК из ядра в цитоплазму, где происходит синтез закодированных в них белков[124].
Сборка и отпочковывание вирионов
Геномная РНК вируса, а также вирусные белки транспортируются к местам сборки вирионов — к мембране. Вирионы первоначально формируются из полипротеинов-предшественников структурных белков и ферментов и на этой стадии не являются инфекционными. В ходе созревания вирусной частицы вирусная протеаза расщепляет белки-предшественники до функциональных компонентов[8]. Несколько одобренных противовирусных препаратов ингибируют работу протеазы и препятствуют формированию зрелых вирионов[8].
Новые вирусные частицы отпочковываются от поверхности клетки, захватывая часть её мембраны, и выходят в кровяное русло, а клетка хозяина, несущая рецептор CD4, погибает[125][126]. Недавние исследования показали, что процесс отпочковывания вирионов может быть более сложным, чем считалось ранее. Так было обнаружено, что благодаря взаимодействию белка Gag с компонентами клетки вирионы накапливаются в особых внутриклеточных мультивезикулярных тельцах, которые обычно служат для экспорта белков. Таким образом вирусные частицы высвобождаются из клетки, эксплуатируя её собственную систему транспорта макромолекул[8].
Распространение по организму
Только что выделившийся из зараженного лимфоцита вирион ВИЧ в плазме крови живёт в среднем около 8 часов[116]. Продолжительность полужизни (время, за которое погибает 50 % вирионов ВИЧ) в плазме крови составляет примерно 6 часов[116]. В остальных средах продолжительность полужизни вирионов ВИЧ на порядки меньше[127].
В период острой фазы ВИЧ-инфекции отсутствие специфического иммунного ответа позволяет вирусу активно реплицироваться и достигать высоких концентраций в крови. Вирус заселяет органы лимфатической системы, CD4+-лимфоциты, макрофаги, а также другие клетки: альвеолярные макрофаги лёгких, клетки Лангерганса, фолликулярные дендритные клетки лимфатических узлов, клетки олигодендроглии и астроциты мозга и эпителиальные клетки кишки[128][129]. В лимфоидной ткани ВИЧ размножается на протяжении всего заболевания, поражая макрофаги, активированные и покоящиеся CD4+-лимфоциты и фолликулярные дендритные клетки[130][131]. Количество клеток, содержащих провирусную ДНК, в лимфоидной ткани в 5—10 раз выше, чем среди клеток крови, а репликация ВИЧ в лимфоидной ткани на 1—2 порядка выше, чем в крови. Основным клеточным резервуаром ВИЧ являются CD4+-Т-лимфоциты иммунологической памяти[132].
Для активации CD8+-лимфоцитов и образования антиген-специфических цитотоксических T-лимфоцитов необходима презентация пептидного антигена в комплексе с человеческим лейкоцитарным антигеном класса I. Дендритные клетки, необходимые для начала первичных антиген-специфичных реакций, захватывают антигены, перерабатывают и переносят их на свою поверхность, где эти антигены в комплексе с дополнительными стимулирующими молекулами активируют T-лимфоциты. Заражённые клетки часто не выделяют дополнительных стимулирующих молекул и поэтому не способны вызвать активацию достаточного числа B- и T-лимфоцитов, функция которых зависит от дендритных клеток[122].
На 2015 год ВИЧ-инфекция остаётся неизлечимым заболеванием, так как геном вируса интегрируется в хромосомы клеток и может реактивироваться даже после курса антиретровирусной терапии. В настоящее время идёт поиск безопасных способов редактирования генома человека и исключения из него провирусной ДНК[133][134]. В 2014 году был предложен метод удаления генома ВИЧ-1 из заражённых клеток при помощи системы CRISPR/Cas9. С помощью этого метода исследователям удалось вырезать фрагмент провирусной ДНК, заключённый между 5′- и 3′-концевыми LTR-областями из хромосом заражённых клеток в культуре. Кроме того, этот метод оказался также эффективным для профилактики заражения неинфицированных клеток. Описанный подход может привести к разработке способа полного избавления от ВИЧ-инфекции[135][136].
Происхождение
Филогенетическое дерево вирусов:
HIV — вирус иммунодефицита человека
SIV — вирус иммунодефицита обезьян
Методом молекулярной филогении показано, что вирус иммунодефицита человека образовался в конце XIX или в начале XX века[137][138][139][140][141], скорее всего в 1920-х гг[142].
Оба типа вируса иммунодефицита человека ВИЧ-1 и ВИЧ-2 возникли в Западной и Центральной Африке южнее Сахары и передались от обезьян к людям в результате зоонозиса. ВИЧ-1 возник на юге Камеруна в результате эволюции эндемичного вируса иммунодефицита обезьян SIV-cpz, который заражает черномордых шимпанзе (Pan troglodytes troglodytes)[143][144]. ВИЧ-1, как полагают, перешёл видовой барьер по крайней мере трижды и породил три группы вирусов: M, N и О[145].
ВИЧ-2 возник на территории Западной Африки (от южного Сенегала до запада Берега Слоновой Кости) в результате эволюции вируса иммунодефицита обезьян SIV-smm, который заражает тёмно-коричневых мангабеев (Cercocebus atys) и узконосых обезьян[146].
Существует доказательство того, что охотники на диких животных (обезьян) или поставщики мяса в Западной и Центральной Африке подвергаются заражению вирусом иммунодефицита обезьян, причём вероятность заражения коррелирует с частотой взаимодействия с обезьянами и их мясом[147]. Однако вирус иммунодефицита обезьян — слабый вирус, и, как правило, подавляется иммунной системой человека в течение недели после заражения. Считается, что необходимо несколько передач вируса от человека к человеку в быстрой последовательности, чтобы вирусу хватило времени мутировать в ВИЧ[148]. Хотя передача вируса иммунодефицита обезьян от человека к человеку происходит редко, определённые социальные факторы могут существенно влиять на частоту заражений. Предполагают, что условия для распространения вируса были неблагоприятны в Африке до XX века. Сопоставление периодов ускоренной эволюции ВИЧ с социо-экономическими изменениями позволяет делать предположения о природе факторов, ускоривших распространение ВИО и ВИЧ.
Генетические исследования показывают, что последний общий предок ВИЧ-1 группы М существовал около 1910 года[149]. Сторонники этой даты связывают распространение ВИЧ с развитием колониализма в Африке и ростом больших городов. Эти факторы привели к таким социальным изменениям в обществе, как увеличение частоты беспорядочных половых связей, распространение проституции и заболеваний, передающихся половым путём (ЗППП)[150]. ЗППП, такие как сифилис, могут сопровождаться генитальными язвами. Исследования показывают, что вероятность передачи ВИЧ во время вагинального полового акта, достаточно низкая при обычных условиях, может быть увеличена в десятки, если не в сотни раз, если один из партнёров страдает от генитальных язв. О степени распространённости ЗППП в колониальных городах в начале 1900-х можно судить по следующим цифрам: в 1928 году по меньшей мере 45 % жительниц восточного Леопольдвиля (ныне — Киншаса, ранний центр распространения ВИЧ группы М) были проститутками, а в 1933 году около 15 % всех жителей этого же города были заражены одной из форм сифилиса. Ретроспективный анализ показал, что начало эпидемии ВИЧ-инфекции в Киншасе совпало с пиком эпидемии генитальных язв в середине 1930-х годов[150].
Альтернативная точка зрения гласит, что основным фактором, способствовавшим адаптации ВИЧ к людям и его распространению, была небезопасная медицинская практика в Африке в годы после Второй мировой войны, такая как использование нестерильных многоразовых шприцов при массовых вакцинациях, инъекциях антибиотиков и противомалярийных средств[96][151][152].
В результате ретроанализа образцов крови взятых после Второй мировой войны зафиксирован самый ранний документальный случай наличия ВИЧ в организме человека, кровь у которого взяли в 1959 году[153]. Вирус, возможно, присутствовал в Соединённых Штатах уже в 1966 году[154], но подавляющее большинство случаев заражения ВИЧ, идентифицированных за пределами тропической Африки, можно проследить до одного неустановленного человека, который заразился ВИЧ на Гаити, а затем перенёс инфекцию в США около 1969 года[155].
Естественная устойчивость к ВИЧ
См. также: CCR5 § Мутация CCR5-Δ32
Описаны случаи устойчивости людей к ВИЧ. Проникновение вируса в клетку иммунной системы связано с его взаимодействием с поверхностным рецептором, белком CCR5. Делеция (утеря участка гена) CCR5-дельта32 приводит к невосприимчивости её носителя к ВИЧ. Предполагается, что эта мутация возникла примерно две с половиной тысячи лет назад и со временем распространилась в Европе. Сейчас к ВИЧ фактически устойчив в среднем 1 % жителей Европы, 10—15 % европейцев имеют частичную сопротивляемость к ВИЧ[156]. Учёные Ливерпульского университета объясняют распространение мутации гена CCR5 тем, что она усиливает сопротивляемость к бубонной чуме. Эпидемия «чёрной смерти» 1347 года (а в Скандинавии ещё и 1711 года) способствовала увеличению частоты этого генотипа в Европе.
См. также: Нонпрогрессор
Мутация в гене CCR2 также уменьшает шанс проникновения ВИЧ в клетку и приводит к задержке развития СПИДа. Существует небольшой процент ВИЧ-положительных людей (около 10 %), у которых СПИД не развивается в течение долгого времени. Их называют нонпрогрессорами[157][158].
Важный клеточный компонент защиты против ВИЧ — антивирусный белок APOBEC3G, который вызывает деаминирование ДНК, приводящее к мутационным заменам G на A в вирусной ДНК, синтезируемой в ходе обратной транскрипции. APOBEC3G инактивируется белком Vif ВИЧ-1, который вызывает его убиквитинилирование и деградацию[159].
Обнаружено, что одним из главных элементов антивирусной защиты человека и других приматов является белок TRIM5a, способный распознавать капсид вирусных частиц и препятствовать размножению вируса в клетке. TRIM5a человека и шимпанзе несколько отличаются друг от друга и эффективны против разных вирусов: этот белок защищает шимпанзе от ВИЧ и родственных ему вирусов, а человека — от вируса PtERV1[160]. Обезьяны Нового Света, за исключением мирикины, которая имеет химерный ген TRIM5-CypA, устойчивостью к ВИЧ не обладают[161].
Другой важный элемент антивирусной защиты — интерферон-индуцируемый трансмембранный белок CD317/BST-2 (англ. bone marrow stromal antigen 2)[108][109][162]. CD317 — трансмембранный белок 2го типа с необычной топологией: он имеет трансмембранный домен рядом с N-концом и гликозилфосфатидилинозитол (GPI) на С-конце, между которыми расположен внеклеточный домен[163]. Показано, что CD317 непосредственно взаимодействует со зрелыми дочерними вирионами, «привязывая» их к поверхности клетки[164]. Для объяснения механизма такого «привязывания» предложено несколько альтернативных моделей, которые, тем не менее, сходятся в следующем. Молекулы CD317 формируют параллельный гомодимер; один или два гомодимера связываются одновременно с одним вирионом и клеточной мембраной. При этом с мембраной вириона взаимодействуют либо оба мембранных «якоря» (трансмембранный домен и GPI) одной из молекул CD317, либо один из них[164]. Спектр активности CD317 включает, по крайней мере, четыре семейства вирусов: ретровирусы, филовирусы, аренавирусы и герпесвирусы[162]. Активность данного клеточного фактора ингибируется белками Vpu ВИЧ-1, Env ВИЧ-2 и SIV, Nef SIV, гликопротеином оболочки вируса Эбола и белком К5 герпесвируса саркомы Капоши[104][105][110][111][162][165][166]. Обнаружен кофактор белка CD317 — клеточный белок ВСА2 (Breast cancer-associated gene 2; Rabring7, ZNF364, RNF115) — Е3-убиквитинлигаза класса RING. BCA2 усиливает интернализацию вирионов ВИЧ-1, «привязанных» белком CD317 к поверхности клетки, в CD63+ внутриклеточные везикулы с их последующим разрушением в лизосомах[167].
Материал из Википедии — свободной энциклопедии
Страница статьи : Вопросы вирусологии
Жирнов О.П., Букринская А.Г. Белки вируса гриппа. Включение вновь синтезированных вирусных белков в вирионы. Вопросы вирусологии. 1982; (5): 549-56.
Жирнов О.П., Маныкин А.А. рН-зависимые перестройки в структуре вируса гриппа А. Вопросы вирусологии. 2014; 59 (3): 41-6.
Жирнов О.П. Белки вируса гриппа: солюбилизация in vitro матриксного белка М1 вириона зависит от протеолитического нарезания гемагглютинина и от рН. В кн.: Каверин Н.В., ред. Молекулярная биология и генетическая инженерия вирусов. М.; 1989: 50-7.
Kilbourne E.D., Murphy J.S. Genetic studies of influenza viruses. I. Viral morphology and growth capacity as exchangeable genetic traits. Rapid in ovo adaptation of early passage Asian strain isolates by combination with PR8. J. Exp. Med. 1960; 111: 387-406.
Roberts P.C., Lamb R.A., Compans R.W. The M1 and M2 proteins of influenza A virus are important determinants in filamentous particle formation. Virology. 1998; 240 (1): 127-37.
McCown M.F., Pekosz A. The influenza A virus M2 cytoplasmic tail is required for infectious virus production and efficient genome packaging. J. Virol. 2005; 79 (6): 3595-605.
Iwatsuki-Horimoto K., Horimoto T., Noda T., Kiso M., Maeda J., Watanabe S. et al. The cytoplasmic tail of the influenza A virus M2 protein plays a role in viral assembly. J. Virol. 2006; 80 (11): 5233-40.
Elleman C.J., Barclay W.S. The M1 matrix protein controls the filamentous phenotype of influenza A virus. Virology. 2004; 321 (1): 144-53.
Roberts K.L., Leser G.P., Ma C., Lamb R.A. The amphipathic helix of influenza a virus M2 protein is required for filamentous bud formation and scission of filamentous and spherical particles. J. Virol. 2013; 87 (18): 9973-82.
Bruce E.A., Digard P., Stuart A.D. The Rab11 pathway is required for influenza A virus budding and filament formation. J. Virol. 2010; 84 (12): 5848-59.
Choppin P.W., Murphy J.S., Tamm I. Studies of two kinds of virus particles which comprise influenza A2 virus strains. III. Morphological characteristics: independence to morphological and functional traits. J. Exp. Med. 1960; 112: 945-52.
McHardy A.C., Adams B. The role of genomics in tracking the evolution of influenza A virus. PLoS Pathog. 2009; 5 (10): e1000566.
Eisfeld A.J., Neumann G., Kawaoka Y. At the centre: influenza A virus ribonucleoproteins. Nat. Rev. Microbiol. 2015; 13 (1): 28-41.
Zhirnov O.P., Klenk H.D., Wright P.F. Aprotinin and similar protease inhibitors as drugs against influenza. Antiviral. Res. 2011; 92 (1): 27-36.
Zhirnov O.P., Manykin A.A. Abnormal morphological vesicles in influenza a virus exposed to acid pH. Bull. Exp. Biol .Med. 2015; 158 (6): 776-80.
Pinto L.H., Lamb R.A. The M2 proton channels of influenza A and B viruses. J. Biol. Chem. 2006; 281 (14): 8997-9000.
границ | SDN2GO: интегрированная модель глубокого обучения для прогнозирования функции белков
1. Введение
Как важная структурная молекула, белок является жизненно важным компонентом всех биологических тканей и клеток, а также основным носителем жизнедеятельности (Weaver, 2011). Понимание функции белков важно как для биологии, так и для медицины и фармацевтики. Например, выяснение функции белка может обеспечить цель для генетических манипуляций и обеспечить надежную основу для создания нового белка или трансформации существующего белка и т. Д.Таким образом, точное описание функций белков является важной и важной задачей. Традиционные экспериментальные методы требуют много ресурсов и времени для определения функции белка, несмотря на их высокую точность и надежность. С постоянным развитием технологии высокопроизводительного секвенирования и геномики последовательность белков резко выросла, но лишь небольшой процент от общего числа известных и предсказанных последовательностей белков был подробно аннотирован относительно их функций.В настоящее время экспериментально аннотировано только <0,1% из более чем 179 миллионов белков в UniProtKB (Consortium, 2019). Однако непросто расширить экспериментальный метод для размещения такого большого количества данных о последовательностях белков, что срочно требует разработки вычислительных методов, помогающих аннотировать функции белков (Radivojac et al., 2013).
Gene Ontology, запущенная в 1998 году, широко используется в области биоинформатики, и первоначальная цель GO состояла в том, чтобы предоставить репрезентативную платформу для описания терминологии или интерпретации слов генов и характеристик генных продуктов.Это позволяет исследователям биоинформатики обобщать, обрабатывать, интерпретировать и делиться данными о генах и генных продуктах (Ashburner et al., 2000). Генная онтология — это онтология типа направленного ациклического графа (DAG). В настоящее время GO содержит более 45 000 биологических концепций, включая функции и расположение клеток, и делится на три категории, охватывающие три аспекта биологии: биологический процесс, молекулярную функцию и клеточный компонент. Белок обычно имеет несколько аннотаций GO; следовательно, предсказание функции белков — это очень крупномасштабная проблема классификации с несколькими метками (Zhang and Zhou, 2013), и точное определение GO-терминов для белков является сложной задачей.
В последние годы некоторые организации и группы разработали алгоритмы, инструменты и системы для прогнозирования функции белков с использованием передовых компьютерных технологий, таких как машинное обучение и глубокие нейронные сети (Kulmanov et al., 2018; You et al., 2018, 2019 ; Hakala et al., 2019; Lv et al., 2019b; Piovesan, Tosatto, 2019; Rifaioglu et al., 2019; Kulmanov, Hoehndorf, 2020). Исследователи предсказывают функции белков по одному или нескольким из следующего: последовательности белков (Кулманов и др., 2018; You et al., 2018, 2019; Hakala et al., 2019; Пиовезан и Тосатто, 2019 г .; Kulmanov, Hoehndorf, 2020), белковые структуры (Yang et al., 2015; Zhang et al., 2018), сеть белок-белковых взаимодействий (PPI) (Kulmanov et al., 2018; Zhang et al., 2018; You et al. ., 2019) и др. (Kahanda, Ben-Hur, 2017; Hakala et al., 2019; Piovesan, Tosatto, 2019; Rifaioglu et al., 2019). Например, в частности, GOLabeler (You et al., 2018) интегрировал пять различных типов информации, основанной на последовательностях, и изучил идею ранжирования веб-страниц, чтобы обучить модель регрессии LTR (обучение ранжированию) для получения этих пяти типов информации для добиться точной аннотации терминов GO.В результате эта модель получила лучшую общую производительность среди всех представленных 3-й критической оценки функциональной аннотации (CAFA3). NetGO (You et al., 2019), предложенный командой GOLabeler, основан на GOLabeler и включает огромное количество сетевой информации белок-белкового взаимодействия (PPI) в структуру LTR. По сравнению с GOLabler, он достиг значительного улучшения характеристик прогнозирования функции белка. Hakala et al. (2019) разработали интегрированную систему, которая получает функции из нескольких различных инструментов или методов: BLASTP, InterproScan, NCBI Taxonomy, NucPred, NetAcet, PredGPI и Amino Acid Index (Kawashima and Kanehisa, 2000; Heddad et al., 2004; Kiemer et al., 2005; Pierleoni et al., 2008; Камачо и др., 2009; Федерхен, 2012; Jones et al., 2014), а затем соответственно передать все характеристики двум классификаторам на основе нейронной сети и случайного леса и, наконец, объединить классификатор NN и классификатор RF для достижения наилучшей производительности прогнозирования. DeepGO (Кулманов и др., 2018) кодирует аминокислотную последовательность белка с помощью триграмм и сопоставляет триграммы с вектором с помощью однократного кодирования и плотного встраивания, а затем передает его в сверточную нейронную сеть (CNN) для извлечения признака. карта.Затем комбинированный вектор признаков, состоящий из функций CNN и функций встраивания сети PPI, вводится в иерархически структурированные уровни классификации для классификации терминов GO. INGA2.0 (Piovesan and Tosatto, 2019) использует четыре компонента: гомологию, выведенную из сходства последовательностей, архитектуру домена, сети белок-белкового взаимодействия и интегрированную информацию из «темного протеома», который включает неупорядоченные и трансмембранные области, для прогнозирования функции белка. . Этот метод имеет лучшие возможности для предсказания некоторых чрезвычайно редких терминов GO по сравнению с другими.В целом, эти высококонкурентные модели и системы доказали свою выдающуюся эффективность в прогнозировании функции белков и постоянно оптимизируются.
Аминокислотная последовательность имеет решающее значение для понимания и анализа белков различных видов. Некоторые исследования показали, что методы BLAST, основанные на гомологии последовательностей, очень конкурентоспособны в прогнозировании функции белков (Altshul, 1997; Gillis and Pavlidis, 2013; Hamp et al., 2013). Кроме того, существует несколько физиологических функций высокого уровня, таких как апоптоз или регуляция ритма, которые часто являются результатом взаимодействия нескольких белков (Кулманов и др., 2018), и согласно так называемому принципу «вины по ассоциации», взаимодействующие белки должны иметь некоторые сходные функции (Oliver, 2000; Schwikowski et al., 2000). Это показывает, что информация о последовательности белка и информация о сети PPI важны для прогнозирования функции белка. Мы также заметили критическое положение белкового домена в функциях, связанных с белком. Домен представляет собой структурный мотив, который существует независимо в различных комбинациях и порядках в белке (Forslund and Sonnhammer, 2008) и представляет собой белковый компонент более высокого уровня, чем аминокислотная последовательность (Richardson, 1981).Следовательно, имеет смысл проанализировать и изучить влияние содержания домена на функцию белка и попытаться использовать его для прогнозирования функции белка. Кроме того, машинное обучение (ML) в настоящее время популярно и эффективно для задач биоинформатики (You et al., 2018, 2019; Lai et al., 2019; Tan et al., 2019; Wang et al., 2019a; Zhu et al. , 2019; Dao et al., 2020), особенно благодаря своей сильной способности соответствовать многомерным, разреженным и сильно коллинеарным сложным данным, технология глубокого обучения широко используется в областях биоинформатики, таких как структура и функция белков ( Sønderby and Winther, 2014; Spencer et al., 2014; Wei et al., 2018; Kulmanov and Hoehndorf, 2020), регуляция экспрессии генов (Chen et al., 2016; Lanchantin et al., 2016), классификация белков (Asgari, Mofrad, 2015; Sønderby et al., 2015), а также структура и функции нуклеиновой кислоты. (Zhang et al., 2016; Lv et al., 2019a; Wang et al., 2019a, b). Исходя из этих соображений, здесь мы предложили интегрированную модель глубокого обучения, основанную на белковых последовательностях, содержании белковых доменов и известных сетях белок-белковых взаимодействий для прогнозирования функции белков.Сначала мы построили три разных модуля нейронных сетей для изучения функций из последовательностей белков, содержимого домена и PPI Net по отдельности, а затем объединили функции из этих трех разных источников и ввели их в классификатор нейронной сети, чтобы предсказать вероятность каждого члена GO. Результаты экспериментов показывают, что наш метод добавления содержимого домена для прогнозирования функции белка является успешным, а наша модель показала лучшую производительность, чем BLAST и два других недавних высокопроизводительных метода на независимом наборе данных, построенном с использованием правил временной задержки.
2. Материалы и методы
2.1. Источник данных
2.1.1. Данные обучения
• Данные последовательности
Для наших экспериментов мы загрузили информацию о последовательностях белков, необходимых для исследования, из базы данных UniProt в виде файлов в формате FASTA (http://www.uniprot.org/downloads) (Consortium, 2015). Затем инструмент CD-hit был использован для де-избыточности загруженных данных последовательности белка. Мы сгруппировали белки со сходством последовательностей> 60% в один кластер, и только один белок на кластер был сохранен.Наконец, мы получили эталонный тест для людей, содержащий 13 704 белка, а эталонный тест для дрожжей — 6 623 белка.
• Данные аннотации
Мы загрузили данные аннотации GO для белков из GOA (http://www.ebi.ac.uk/GOA) (Barrell et al., 2009), опубликованные в декабре 2013 года. Обратите внимание, что данные аннотации GO здесь предназначены только для обучения. , и все данные аннотированы за 2013 год или ранее. Наконец, аннотационные данные содержат 13 882 категории (9 221 для BP, 3 483 для MF и 1178 для CC) для человека и 4796 категорий (2439 для BP, 1733 для MF и 624 для CC) для дрожжей.
• Сетевые данные о взаимодействии белков и белков (PPI)
Мы добавили сетевые данные белок-белкового взаимодействия (PPI), которые получены из базы данных STRING v10 (https://string-db.org/) (Szklarczyk et al., 2015), чтобы улучшить производительность эксперимента. . Среди них данные PPI человека содержат 11 759 455 оцененных звеньев 19 257 белков, а данные Yeast PPI содержат 1845 966 оцененных звеньев 6507 белков.
• Данные белкового домена
Мы загрузили данные белковой области из общедоступной базы данных interpro (Hunter et al., 2009) (http://www.ebi.ac.uk/interpro/download/), который содержит все белки UniProtKB, записи InterPro и индивидуальные сигнатуры, которым они соответствуют. Для конкретного белка мы можем получить типы, количество и расположение всех доменов, которые он содержит, а также указать начальное и конечное положения в последовательности белка домена. Мы провели поиск по UniProt ID белка, чтобы получить данные о доменах всех необходимых нам белков. Затем мы выполнили де-избыточность; для той же информации о домене, подтвержденной противоречивыми доказательствами, мы сохранили только одну из них.В итоге данные нашего домена содержат 113 972 единиц информации о 14 242 доменах для человека и 23 326 единиц информации о 6 707 доменах для дрожжей.
2.1.2. Данные независимого тестирования
Независимый набор тестовых данных используется для сравнения с конкурирующими методами. Сбор данных обычно осуществляется в соответствии с правилом отложенного запроса CAFA. Мы загрузили данные аннотаций GO для белков из GOA, опубликованные в январе 2016 г., а затем получили аннотации GO для белков, добавленные после 2013 г. (2014 и 2015 гг.).В частности, мы удалили данные аннотаций, опубликованные в декабре 2013 г., из данных аннотаций, опубликованных в январе 2016 г., и сохранили только недавно добавленные данные аннотаций белков. Затем мы построили независимый тестовый тест на основе недавно добавленных данных аннотации; обратите внимание, что все белки, содержащиеся в этом тесте, не имеют аннотаций GO до 2014 года. Точно так же мы отфильтровали те белки, которые были аннотированы только терминами GO, которые встречаются крайне редко. Отфильтрованный независимый тестовый набор содержит 68 белков для BP, 136 белков для MF и 106 белков для CC.
2.2. Представление данных
2.2.1. Данные о последовательности белков
Информация о последовательности белка является одним из входных параметров нашей модели. Последовательность каждого белка представляет собой строку, состоящую из 20 конкретных кодов аминокислот разной длины. В этом эксперименте мы отбирали только белки с длиной последовательности, не превышающей 1500. Если длина последовательности <1500, мы добавили ноль в конце последовательности, чтобы гарантировать, что длина каждой входной информации о последовательности белка является фиксированной.Чтобы полностью извлечь контекст и семантические сведения о последовательности, мы использовали ProtVec от BioVec (Asgari and Mofrad, 2015), который представляет собой биологическое представление последовательности и метод извлечения признаков, для отображения информации о последовательности. Этот метод заимствует идеи «встраивания слов» из Natural Language Processing (NLP) и получает векторные представления биологических последовательностей посредством обучения, а ProtVec используется для белковых последовательностей. Мы следовали ProtVec и использовали 3-граммовую кодировку для белковых последовательностей, то есть использовали окно длиной 3 с размером шага 1 для сдвига белковой последовательности, чтобы получить 3-граммовую последовательность длиной 1498 для каждого белка.
Для преобразования информации о 3-граммовых последовательностях в векторы, которые могут быть получены компьютерной моделью, мы использовали таблицу ProtVec-100d-3grams, выпущенную BioVec. Мы загрузили эти данные из Harvard Dataverse (http://dx.doi.org/10.7910/DVN/JMFHTN). В этой таблице белковый вектор представляет собой распределенное представление белков, а 100-D вектор представляет каждый 3-граммовый. Для нашего эксперимента, согласно ProtVec, каждый белок будет представлен в виде векторной матрицы 1,498 * 100, а затем использован в качестве входных данных для модели.В частности, в соответствии с тем, как мы обрабатываем белки длиной менее 1500, если 3-граммовое слово содержит один или несколько дополненных нами нулей, то 3-граммовое слово будет представлено как нулевой вектор 100D.
2.2.2. Данные белковой сети
Данные белковой сети, которые мы загрузили, представляют собой оцененные связи между белками. Чем выше оценка, тем больше вероятность взаимодействия между белками. Мы отфильтровали все ссылки с оценкой 400 баллов, оставив только ссылки с оценкой выше 400, а затем интегрировали данные отфильтрованной белковой сети в матрицу оценок PPI.Каждая строка этой матрицы представляет собой вектор, который представляет взаимодействие белка с другими белками. Если белок A взаимодействует с другим белком B в выбранных данных, мы устанавливаем значение в соответствующей позиции в векторе для доли этих двух белков; в противном случае мы устанавливаем его на 0.
2.2.3. Данные белкового домена
В белках типы и количество доменов и относительные положения различных доменов будут влиять на функции белка. Чтобы полностью обнаружить и извлечь исчерпывающую информацию о типе, количестве и положении доменов в белках, чтобы улучшить производительность модели, нам сначала нужно отсортировать домены, содержащиеся в каждом белке, в соответствии с информацией о положениях в данных домена, так что мы можем получить информацию о взаимном расположении различных доменов.Однако информация о положении, предоставленная базой данных, представляет собой только возможный диапазон доменов в последовательности белка. Например, если в базе данных указано положение домена D в последовательности белка P 60–200, это указывает только на то, что домен D существует в области 60–200 в белке P, но мы не можем получить фактическую длину и расположение этого домена D. Это результат технических ограничений, которые приводят к перекрытию существования разных доменов, даже если область полностью содержит другую область в белке, и затрудняет сортировку доменов.
В наших экспериментах мы предложили простой метод сортировки, основанный на точках регионального центра, чтобы решить эту проблему. В частности, в конкретном белке есть три возможности для географической взаимосвязи между любыми двумя разными доменами: отсоединенный, пересекающийся и содержащий. Если связь разорвана, мы можем быстро отсортировать два домена. Если это перекрестная связь или вмещающая связь, мы вычислили центральные точки двух областей отдельно, а затем поместили область с передней центральной точкой перед другой.После этого получают информацию о типе, количестве и относительном положении домена в белке. Затем мы извлекли уроки из идеи обработки естественного языка и рассматривали каждый домен как биологическое слово, поэтому информация о доменах, описывающих конкретный белок, представляет собой биологическое предложение, состоящее из некоторых слов домена в определенном порядке, в то время как функции белка что означает биологическое предложение. Цель модуля домена состоит в том, чтобы получить биологическое предложение белка, а затем абстрагироваться от функций, которые представляют значение предложения.Поскольку количество доменов, содержащихся в разных белках, несовместимо, здесь нам также необходимо решить проблему несовместимого размера входных данных модели. Мы получили максимальное количество доменов белков и использовали это максимальное количество (357 для человека и 41 для дрожжей) в качестве стандарта, а белки с меньшим количеством доменов, чем максимальное количество, были дополнены 0. Мы кодировали домены словом Embedding, чтобы ввести его в модель. В частности, мы использовали слой PyTorch Sparse, который может инициализировать простую таблицу поиска для сопоставления разреженных векторов с плотными векторами, чтобы сгенерировать фиксированную таблицу поиска для доменов.В этой таблице поиска каждый домен представлен 128-мерным вектором. В принципе, слой Sparse автоматически сопоставляет одномерные горячие векторы высокой размерности с плотными векторами низкой размерности и обеспечивает индекс плотных векторов. Размеры как горячих векторов, так и плотных векторов задаются пользователем вручную по мере необходимости, и мы могли бы получить требуемый плотный вектор, введя индекс. Следовательно, предложение доменов для Human представлено двумерной матрицей 357 * 128, а предложение доменов для Yeast представлено двумерной матрицей 41 * 128.Слой Sparse будет интегрирован в модель и обучен вместе, то есть по мере непрерывной оптимизации модели векторы представления доменов в таблице поиска будут становиться все более точными.
2.2.4. Protein GO Термины
Учитывая, что большое количество конкретных GO-терминов часто существует только в наборах аннотаций небольшого количества белков (You et al., 2018), и учитывая предел вычислений, мы ранжировали GO-термины в соответствии с количеством аннотаций в белков, а затем используйте набор пороговых значений (40 для BP, 20 для MF и 20 для CC) для выбора терминов GO, который содержит 491 термин BP, 321 термин MF и 240 терминов CC для человека и набор пороговые значения (10 для BP, 10 для MF и 10 для CC) для выбора терминов GO, которые содержат 373 термина BP, 171 член MF и 151 член CC для дрожжей.Мы создали три бинарных вектора для каждого белка, чтобы представить метки трех суб-онтологий GO: BP Ontology, MF Ontology и CC Ontology. Если белок аннотирован термином GO, значение в соответствующей позиции вектора метки устанавливается равным 1, а в противном случае устанавливается равным нулю. Обратите внимание, что в векторах меток выбраны все категории GO.
2.3. Глубокая модель
Мы обучили три модели для трех суб-онтологий GO. Мы случайным образом извлекли 80% обучающих данных для итеративного обучения модели, а оставшиеся 20% использовали для проверки производительности модели после каждой итерации и сохранили модель с наилучшей производительностью обобщения.Учитывая, что наша модель должна получать входные данные от трех аспектов последовательности, содержимого домена и сетевой информации PPI, как показано на рисунке 1, мы разделили модель на четыре компонента: подмодель последовательности, подмодель домена, подмодель PPI-Net. -модель и взвешенный классификатор.
Рисунок 1 . Интегрированная архитектура модели глубокого обучения. (1) Подмодель последовательности использует одномерные сверточные нейронные сети для извлечения признаков из входных данных последовательности, которые были закодированы как 3-граммы, а затем отображены в 3-граммовую векторную матрицу.(2) Подмодель PPI Net генерируется для уплотнения функций из PPI Network с использованием классических нейронных сетей. (3) Подмодель домена инициализирует разреженный слой, который интегрируется в подмодель для оптимизации, для создания таблицы поиска для доменов, а предложение отсортированных доменов, обработанное разреженным слоем, вводится в одномерную сверточную нейронную систему. сети для извлечения функций. (4) Все выходные характеристики трех подмоделей объединяются и вводятся во взвешенный классификатор, а выходной вектор представляет вероятность условий GO.
2.3.1. Подмодель последовательности
Входными данными этой подмодели является двумерная векторная матрица размером 3 грамма, которая представляет информацию о последовательности белков. Чтобы извлечь подробные многомерные характеристики биологических последовательностей белков, мы разрабатываем и реализуем модель, основанную на сверточных нейронных сетях (CNN). Нейронная сеть — это модель математического алгоритма, которая имитирует поведенческие характеристики биологических нейронных сетей для распределенной и параллельной обработки информации (Хайкин, 1994).В CNN есть структура глубины, и входные данные свертываются для получения выходных данных (LeCun et al., 1998), слой свертки содержит несколько ядер свертки, которые могут заставить модель извлекать больше функций в различных аспектах. В нашем эксперименте мы использовали одномерную сверточную нейронную сеть, которая использует одномерное ядро свертки для выполнения операций свертки над входными данными. После того, как входная последовательность преобразована для извлечения объектов, выходная карта объектов передается на слой объединения для выбора объектов и фильтрации информации; это потому, что карта функций все еще содержит избыточность.Здесь мы используем слой max-pooling для обработки карты объектов. После обработки выбранная карта объектов будет передана следующему слою в качестве входных данных. В частности, для подмодели последовательности были установлены три сверточных слоя, которые были соединены встык. Карта характеристик, полученная после операции свертки каждого сверточного слоя, использует максимальный слой объединения для фильтрации информации для удаления избыточности. Внутренние каналы первого сверточного слоя имеют ту же ширину, что и информационная матрица входной последовательности, и установлены на 100.Входящие каналы двух других сверточных слоев такие же, как выходные каналы предыдущего уровня, а выходные каналы трех сверточных слоев установлены как 64, 32 и 16 соответственно. Для каждого слоя свертки ядро свертки размером 16 используется для операции свертки с размером шага 1. Чтобы полностью извлечь входные характеристики, на входе выполнялось заполнение 0 перед каждой сверткой. Каждый максимальный уровень объединения фильтруется с использованием ядра размера 2 с размером шага 2.Выходная карта объектов последнего слоя объединения будет разбита на одно измерение и введена в полностью связанные (FC) слои для уменьшения размерности. Наконец, был получен вектор признаков, представляющий информацию о последовательности белка. Количество узлов в выходном слое полносвязного слоя устанавливается в соответствии с количеством трех субонтологий GO. В частности, для человека он был установлен как 491 для BP, 321 для MF и 240 для CC, а для дрожжей он был установлен как 373 для BP, 171 для MF и 151 для CC.
2.3.2. Подмодель PPI-Net
В матрице с оценкой PPI векторы признаков, которые характеризуют взаимодействие между белками и другими белками, имеют большие размеры, которые составляют 18 901 для человека и 6054 для дрожжей, соответственно, поэтому мы построили модуль трехслойной трапециевидной нейронной сети для плотного определения PPI. Особенности. В этом модуле количество узлов во входном слое такое же, как размер входного вектора признаков, который составляет 18 901 для человека и 6 054 для дрожжей.Для количества узлов в скрытом слое установлено промежуточное значение в соответствии с количеством узлов на входном и выходном уровнях, которые составляют 4096 для человека и 2048 для дрожжей. А размер выходного слоя зависит от различных видов и суб-онтологии GO и совпадает с размером выходного слоя субмодели Sequence.
2.3.3. Подмодель домена
На вход подмодели домена поступает отсортированная информация о содержании белкового домена. Согласно входным данным, первая структура модуля представляет собой интегрированный разреженный слой, количество внедрений составляет 14 243 для человека и 6 708 для дрожжей, а размер встраивания установлен на 128.Для конкретного белка выходом разреженного слоя входного предложения домена является двумерная матрица. Поэтому, аналогично подмодели последовательности, мы построили модуль сверточных нейронных сетей, содержащий два одномерных сверточных слоя и два слоя с максимальным объединением. Входящие каналы первого сверточного слоя установлены на 357 для человека и 41 для дрожжей, входящие каналы второго сверточного слоя согласуются с исходящими каналами предыдущего слоя, а выходные каналы двух сверточные слои установлены на 128 и 64.Кроме того, каждый сверточный слой использовал ядро свертки размера 2 для выполнения операции свертки с размером шага 2. Чтобы полностью извлечь входные функции, мы дополняли вход 0 перед каждой сверткой. Настройка двух максимальных уровней объединения такая же, как настройка максимального уровня объединения в подмодели Sequence. Выходная карта объектов последним объединяющим слоем разбивается на одно измерение, а затем вводится в полностью связанные слои, чтобы уменьшить размер и выходной слой полностью подключенного слоя.Размер выходного слоя зависит от различных видов и субонтологии GO и совпадает с размером выходного слоя субмодели Sequence.
2.3.4. Взвешенный классификатор
Взвешенный классификатор принимает выходные векторы из трех подмоделей: подмодели последовательности, подмодели домена, подмодели PPI-Net. В процессе обучения каждый классификатор GO изучает и оптимизирует веса, которые получают характеристики из трех подмоделей, для достижения наилучшего эффекта от классификации с несколькими метками. Обратите внимание, что выходные векторы трех модулей имеют одинаковые размеры.В целом наш весовой классификатор представляет собой трехуровневую несвязную сетевую модель. Количество узлов во входном слое является суммой количества выходных узлов трех подмоделей, и как узлы скрытого слоя, так и узлы внешнего слоя такие же, как узлы выходного слоя трех подмоделей. -модели, которые устанавливаются в соответствии с различными видами и субонтологией GO. С точки зрения единственного классификатора GO структура показана на рисунке 2. Для конкретного классификатора GO скрытый узел принимает только три функции, которые находятся в соответствующей позиции выходного вектора трех подмоделей, соответственно, соответствующих в категорию GO, и для выделения соответствующей области мы использовали матрицу двоичных масок для реализации этого управления подключением.Узел вывода классификатора также принимает только вывод соответствующего скрытого узла, и мы также использовали матрицу двоичных масок для реализации управления подключением. В общем, пусть снова весь весовой классификатор в целом, каждый узел в скрытом слое подключен только к трем соответствующим узлам в выходном слое, а каждый узел в выходном слое подключен только к одному соответствующему узлу скрытого слоя. Следовательно, веса между узлами скрытого слоя и узлами входного слоя представляют предпочтение Классификатора для объектов из трех подмоделей, а веса между узлами выходного слоя и узлами скрытого слоя глобально балансируют выходные значения Классификатора с тот же уровень.
Рисунок 2 . Архитектура единого классификатора GO во взвешенном классификаторе.
Для всех компонентов модели мы использовали Rectified-linear-unit (ReLU) (Glorot et al., 2011), который может улучшить вычислительную эффективность и сохранить градиент (Nair and Hinton, 2010) в качестве функции активации. Кроме того, запуская специальные алгоритмы оптимизации для минимизации функции потерь, модель DNN можно итеративно оптимизировать, обновляя веса и смещения.В частности, модель обучается с использованием адаптивного оптимизатора Адама (Kingma and Ba, 2014).
2,4. Методы оценки
Мы оцениваем производительность модели с помощью трех показателей: F-max, AUPR (площадь под кривой точности-отзыва) и AUC (площадь под кривой характеристик оператора приемника), где F-max и AUC используются в проблема CAFA (Radivojac et al., 2013). Мы используем стандарт CAFA для расчета F-max и следующие формулы:
Fmax = maxt {2 · pr (t) · rc (t) pr (t) + rc (t)} (1)
, где pr ( t ) и rc ( t ), соответственно, представляют точность и отзыв порога t ∈ [0, 1] и могут быть вычислены по следующим формулам:
pr (t) = 1m (t) · ∑i = 1m (t) pri (t) (2)
и
rc (t) = 1n · ∑i = 1nrci (t) (3)
, где m ( t ) — это количество белков, аннотированных по крайней мере одним GO-членом с использованием порога t , n — общее количество белков в целевом наборе данных. pr i ( t ) и rc i ( t ) представляют точность и отзыв определенного белка i с использованием порогового значения t и рассчитываются следующим образом: следующие формулы:
pri (t) = ∑fI (f∈Pi (t) ∧f∈Ti) ∑fI (f∈Pi (t)) (4)
и
rci (t) = ∑fI (f∈Pi (t) ∧f∈Ti) ∑fI (f∈Ti) (5)
, где f — это функциональный термин в онтологии, функция I (·) — это стандартная индикаторная функция. T i — это набор истинных меток для белка i , а P i ( t ) — набор предсказанных меток для белка i с использованием порога t. . Как только точность и напоминание, рассчитанные по различным значениям t для конкретного функционального члена, были определены для всех белков, мы могли затем рассчитать AUPR, используя правило трапеций. По сравнению с AUC, AUPR имеет больший штраф за ложные срабатывания [6].
Мы также вычисляем значение AUC для каждой модели субонтологии GO, формулы расчета следующие:
AUC = ∫-∞∞TPR (t) (- FPR (t)) dt, (6)
TPR (t) = TP (t) TP (t) + FN (t) (7)
и
FPR (t) = FP (t) FP (t) + TN (t) (8)
, где TP — количество истинных срабатываний, FP — количество ложных срабатываний, а TN — количество истинно отрицательных результатов, FN — количество ложных отрицательных результатов.
2,5. Реализация модели и вычислительная среда
Для реализации нашей модели мы использовали PyTorch, фреймворк глубокого обучения на основе Python.Для ускорения процесса обучения мы использовали сервер RHEL с четырьмя установленными видеокартами NVIDIACorporationGM 107 GL и общим объемом видеопамяти 32 ГБ. При заданном наборе параметров все время обучения для наиболее ресурсоемкой модели АД составляет <10 часов. С точки зрения прогнозирования, в случае, когда входная информация о последовательности, домене и PPI прогнозируемого белка была обработана заранее, использование оптимизированной модели для прогнозирования 1000 белков занимает около 6 минут.
3. Результаты
3.1. Эксперимент
Из-за сложности композиции нашей модели и необходимости определения большого количества гиперпараметров мы сначала предварительно обучили трехкомпонентные подмодели: последовательность, домен и сеть PPI. Мы использовали аннотации белков GO в качестве метки и вычислили бинарную кросс-энтропию между предсказанными значениями и фактическими значениями и использовали это как потерю для обратного распространения для обновления весов и смещений между узлами, подключенными в модели.Мы вручную скорректировали гиперпараметры, такие как скорость обучения и размер пакета каждого модуля, и выбрали оптимальную модель на основе значения потерь при проверке с использованием обучающего набора. После настройки параметров трех подмодулей мы использовали выходные данные этих трех точно настроенных моделей в качестве входных данных для ручной корректировки гиперпараметров взвешенного классификатора, а также выбора оптимальной модели на основе значения потерь при проверке с использованием обучающего набора. . Таблицы S1 – S4 показывают детали обучения различных гиперпараметров.
Мы использовали 5-кратную перекрестную проверку на обучающем наборе, чтобы проверить производительность модели, и результаты показаны в таблице 1. Ясно, что модель достигла благоприятного значения F-max для каждой суб-онтологии GO, что указывает на то, что наш метод является эффективным методом прогнозирования функции белка.
Таблица 1 . Результаты 5-кратной перекрестной проверки данных обучения.
3.2. Оценка эффективности использования содержимого домена
Использование исчерпывающей информации о типах, количествах и положениях содержания белковых доменов для прогнозирования функции белков является важнейшим компонентом и акцентом этого исследования.Чтобы исследовать и объяснить критическую роль всеобъемлющей информации о предметной области в прогнозировании функции белков, были построены глубокие модели без модуля предметной области для трех суб-онтологий GO, и каждая модель содержала только подмодель последовательности, подмодель PPI-Net. -модель и взвешенный классификатор, и мы назвали его SN2GO. Для SN2GO, поскольку подмодель Sequence и подмодель PPI-Net в модели SDN2GO предварительно обучаются отдельно, структура и настройки гиперпараметров подмодели Sequence и подмодели PPI-Net такие же, как и у SN2GO. соответствующих модулей в модели SDN2GO, а взвешенный классификатор удаляет соответствующую часть домена из входного слоя, настройки скрытого слоя и выходного слоя остаются такими же, как и у взвешенного классификатора SDN2GO.Чтобы обеспечить справедливость сравнения, мы также вручную скорректировали скорость обучения и гиперпараметры размера пакета и выбрали оптимальную модель взвешенного классификатора для SN2GO.
Мы наблюдали производительность SN2GO на обучающей выборке и сравнивали ее с SDN2GO. Точно так же мы использовали SN2GO для проведения эксперимента с 5-кратной перекрестной проверкой на обучающей выборке. В таблице 1 показаны результаты перекрестной проверки SN2GO. Мы обнаружили, что по сравнению с SN2GO, производительность SDN2GO, использующего информацию домена, была значительно улучшена во всех суб-онтологиях GO, особенно в MF Ontology людей, значение F-меры SDN2GO было увеличено почти на 20 % (0.65 против 0,55) по сравнению с SN2GO. Как показано на рисунке 3, кривые PR SDN2GO и SN2GO на данных проверки людей, ясно, что красная кривая PR окружает другую в каждой суб-онтологии. Этот результат показывает, что информация о домене играет важную роль в прогнозировании функции белка, и доказывает, что наши методы кодирования и обработки информации о домене белка и модели подглубокого обучения для доменов полезны и значимы.
Рисунок 3 . Кривые прецизионного отзыва (P-R) SDN2GO и SN2GO.Эффективность двух методов оценивалась на основе данных проверки человека в каждой субонтологии GO (генная онтология).
3.3. Сравнение с конкурирующими методами
Чтобы дополнительно проверить производительность SDN2GO, мы сравнили два новых метода, NetGO и DeepGO, на независимом тестовом наборе. Оба этих метода являются конкурентоспособными и превосходными в прогнозировании функции белков и достигли выдающихся результатов на некоторых наборах данных. NetGO представляет собой современный метод машинного обучения для прогнозирования функции белков и предлагает конструктивные идеи о том, как интегрировать функции, основанные на различных источниках.В то же время DeepGO вполне демонстрирует использование технологии глубокого обучения для прогнозирования функции белков. В частности, NetGO объединяет пять различных типов доказательств на основе последовательностей и массивную сетевую информацию в структуру обучения ранжированию (LTR) для прогнозирования функции белков. Мы загрузили последовательность белков независимого тестового набора в формате Fasta на веб-сервер AFP (автоматическое прогнозирование функций) (http://issubmission.sjtu.edu.cn/netgo/), выпущенный NetGO, а затем загрузили результат прогнозирования NetGO в txt через некоторое время.DeepGO использует сверточные нейронные сети для извлечения функций последовательности белков и объединяет известную сетевую информацию PPI в качестве комбинированных функций для прогнозирования функций белков. Мы загрузили весь исходный код DeepGO с GitHub и загрузили необходимые данные, а также точные модели нейронных сетей, сохраненные в формате PKL с предоставленного веб-сервера (http://deepgo.bio2vec.net/data/deepgo/), а затем вошли тестовая последовательность белка в формате Fasta для этого инструмента с открытым исходным кодом и получила результаты прогнозирования DeepGO.Кроме того, BLAST также использовался в сравнительных экспериментах.
Результаты сравнения показаны в таблице 2. Мы заметили, что BLAST хорошо работает с каждой субонтологией GO, что еще раз показывает, что метод BLAST, основанный на гомологии последовательностей, по-прежнему весьма конкурентоспособен. NetGO и DeepGO хорошо справились с MFO и BPO соответственно, но не достигли заявленных эффектов для других суб-онтологий. Мы дополнительно проанализировали результаты прогнозирования этих двух методов и обнаружили, что ложноположительные результаты обоих из них относительно высоки, что приводит к их неспособности получить значения высокой точности.Рисунок 4, на котором показаны кривые PR MFO на независимых тестовых наборах для различных методов, демонстрирует результаты нашего анализа с одного аспекта. Кривые PR BPO и CCO и другие конкретные детали можно увидеть на рисунках S1, S2. Очевидно, что SDN2GO превзошел другие методы по всем суб-онтологиям, особенно по MFO. Это показывает, что наша модель обладает отличными характеристиками обобщения и в настоящее время является конкурентоспособным методом прогнозирования функции белков. В частности, мы обратили внимание на производительность SN2GO, в тестовом наборе которой отсутствует подмодель домена.Результаты показывают, что его производительность в отношении BPO и MFO намного хуже, чем у SDN2GO, и доказывают, что извлечение признаков из белковых доменов для прогнозирования функции белка возможно и повысит точность маркировки GO-терминов для белков, особенно для BPO и MFO. .
Таблица 2 . Результаты сравнения конкурирующего метода на независимой тестовой выборке.
Рисунок 4 . Кривые прецизионного отзыва (P-R) для BLAST, DeepGO, NetGO, SN2GO и SDN2GO.Эффективность пяти методов оценивалась на независимом тестовом наборе в MFO (онтология молекулярных функций).
4. Обсуждение
SDN2GO, интегрированная весовая модель, основанная на глубоком обучении, которую мы предложили, объединяет три аспекта информации: последовательность белка, содержание белкового домена и известные сети белок-белкового взаимодействия. Мы построили три подмодели для этих трех аспектов информации, а затем изучили и извлекли три компонента функций посредством предварительного обучения подмоделей.Каждый член GO белка был окончательно оценен и аннотирован с помощью интегрированного классификатора веса с глубоким обучением. Результаты 5-кратной перекрестной проверки показывают, что SDN2GO является стабильным и надежным методом прогнозирования функции белков. Для дальнейшей проверки обобщающих характеристик и конкурентоспособности SDN2GO мы построили независимый набор тестов, основанный на принципе временной задержки, для сравнения с новым методом и классическим методом BLAST. Результаты сравнения показывают, что наш метод достиг максимального значения F-max для каждой суб-онтологии GO.
Многие исследования показали, что последовательность белка и сеть PPI действительны для функции белка (Kirac and Ozsoyoglu, 2008; Jiang and McQuay, 2011; Nguyen et al., 2011; Baryshnikova, 2016; Kulmanov et al., 2018). Кроме того, некоторые исследователи использовали информацию о белковом домене для прогнозирования функции белка (Altshul, 1997; Forslund and Sonnhammer, 2008), но они сосредоточились только на одном аспекте типа или структуры домена и не смогли полностью изучить общие характеристики различных аспекты домена.Мы учли это и усвоили уроки из принципа НЛП для кодирования доменов для интеграции информации о типе, количестве и положении белковых доменов, и использовали сверточную нейронную сеть для извлечения общих характеристик доменов, что является преимуществом нашей системы. модель. Мы построили сравнительную модель SN2GO на основе SDN2GO без подмодели предметной области и провели сравнительные эксперименты как с обучающими данными, так и с независимым тестовым набором. Результаты показывают, что информация о предметной области значительно улучшила эффект прогнозирования модели, особенно в BPO On MFO; это может быть связано с тем, что информация о домене как характеристика белка более высокого уровня, чем последовательность, более интуитивно понятна в экспрессии и ближе к функциям белка.И в определенной степени результаты сравнения продемонстрировали правильность и обобщаемость наших методов обработки информации о домене белка и выделения признаков.
В будущем мы продолжим улучшать нашу модель, например добавляя больше категорий аннотаций GO, чтобы расширить масштаб классификации с несколькими метками. Кроме того, мы также попытаемся интегрировать больше аспектов связанных с белками функций, таких как информация о структуре белка и информация о совместной экспрессии, в нашу модель, чтобы исследовать роль различной информации в прогнозировании функции белка.
Заявление о доступности данных
В данном исследовании были проанализированы общедоступные наборы данных. Эти данные можно найти здесь: https://github.com/Charrick/SDN2GO/tree/master/data.
Авторские взносы
YC и LD разработали эту работу и разработали эксперименты. YC и JW создали экспериментальную среду. YC проводил эксперименты. YC, LD и JW собрали данные и проанализировали результаты. YC и LD написали, отредактировали и одобрили рукопись.
Финансирование
Это исследование финансировалось Национальным фондом естественных наук Китая в рамках гранта №№.61972422 и 61672541.
Конфликт интересов
Авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могут быть истолкованы как потенциальный конфликт интересов.
Благодарности
Мы хотели бы поблагодарить Экспериментальный центр школы компьютерных наук Центрального Южного университета за предоставление вычислительных ресурсов.
Дополнительные материалы
Дополнительные материалы к этой статье можно найти в Интернете по адресу: https: // www.frontiersin.org/articles/10.3389/fbioe.2020.00391/full#supplementary-material
Список литературы
Альтшул, С. Ф. (1997). Gapped blast и psi-blast: новое поколение программ поиска по базам данных белков. Нуклеиновые Кислоты Res . 25, 3389–3402. DOI: 10.1093 / nar / 25.17.3389
CrossRef Полный текст | Google Scholar
Э. Асгари и М. Р. Мофрад (2015). Непрерывное распределенное представление биологических последовательностей для глубокой протеомики и геномики. PLoS ONE 10: e0141287.DOI: 10.1371 / journal.pone.0141287
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Эшбернер М., Болл К. А., Блейк Дж. А., Ботштейн Д., Батлер Х., Черри Дж. М. и др. (2000). Генная онтология: инструмент для объединения биологии. Nat. Genet . 25, 25–29. DOI: 10.1038 / 75556
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Баррелл Д., Диммер Э., Хантли Р. П., Биннс Д., О’Донован К. и Апвейлер Р. (2009).База данных гоа в 2009 году — интегрированный ресурс аннотации онтологии генов. Нуклеиновые Кислоты Res . 37, D396 – D403. DOI: 10.1093 / nar / gkn803
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Камачо, К., Кулурис, Г., Авагян, В., Ма, Н., Пападопулос, Дж., Билер, К. и др. (2009). Blast +: архитектура и приложения. BMC Bioinformatics 10: 421. DOI: 10.1186 / 1471-2105-10-421
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Чен, Ю., Ли, Ю., Нараян, Р., Субраманян, А., Се, X. (2016). Вывод экспрессии генов с помощью глубокого обучения. Биоинформатика 32, 1832–1839. DOI: 10.1093 / биоинформатика / btw074
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Consortium, U. (2019). Uniprot: всемирный центр знаний о белках. Нуклеиновые Кислоты Res . 47, D506 – D515. DOI: 10.1093 / nar / gky1049
CrossRef Полный текст | Google Scholar
Дао, Ф.-Й., Львов, Х., Зульфикар, Х., Ян, Х., Су, В., Гао, Х. и др. (2020). Вычислительная платформа для определения происхождения сайтов репликации у эукариот. Краткое. Биоинформ. [Препринт] bbaa017. DOI: 10.1093 / bib / bbaa017
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Гиллис, Дж., И Павлидис, П. (2013). Характеристика современного состояния вычислительного назначения функции гена: уроки первой критической оценки функциональной аннотации (cafa). BMC Bioinformatics 14: S15.DOI: 10.1186 / 1471-2105-14-S3-S15
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Глорот X., Бордес А. и Бенжио Ю. (2011). «Глубокие нейронные сети с разреженным выпрямителем», в Труды четырнадцатой Международной конференции по искусственному интеллекту и статистике (Форт-Лодердейл, Флорида), 315–323.
Google Scholar
Hakala, K., Kaewphan, S., Björne, J., Mehryary, F., Moen, H., Tolvanen, M., et al. (2019). Нейронные сети и модели случайного леса в прогнозировании функции белков. BioRxiv 6
. DOI: 10.1101 / 6
CrossRef Полный текст | Google Scholar
Hamp, T., Kassner, R., Seemayer, S., Vicedo, E., Schaefer, C., Achten, D., et al. (2013). Вывод на основе гомологии устанавливает высокую планку для предсказания функции белков. BMC Bioinformatics 14: S7. DOI: 10.1186 / 1471-2105-14-S3-S7
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Хайкин, С. (1994). Нейронные сети: всеобъемлющий фундамент .Река Аппер Сэдл, Нью-Джерси: Prentice Hall PTR.
Google Scholar
Хеддад А., Брамейер М. и МакКаллум Р. М. (2004). «Развитие классификаторов последовательностей на основе регулярных выражений для ядерной локализации белка», в Workshops on Applications of Evolutionary Computing (Berlin; Heidelberg: Springer), 31-40. DOI: 10.1007 / 978-3-540-24653-4_4
CrossRef Полный текст | Google Scholar
Хантер, С., Апвейлер, Р., Этвуд, Т. К., Байрох, А., Бейтман, А., Binns, D., et al. (2009). Interpro: интегрированная база данных сигнатур белков. Нуклеиновые Кислоты Res . 37, D211 – D215. DOI: 10.1093 / nar / gkn785
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Цзян, Дж. К., и МакКуэй, Л. Дж. (2011). Прогнозирование функции белков с помощью коррелированного обучения с несколькими метками. IEEE / ACM Trans. Comput. Биол. Биоинформ . 9, 1059–1069. DOI: 10.1109 / TCBB.2011.156
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Джонс, П., Binns, D., Chang, H.-Y., Fraser, M., Li, W., McAnulla, C., et al. (2014). Интерпроскан 5: классификация функций белков в масштабе генома. Биоинформатика 30, 1236–1240. DOI: 10.1093 / биоинформатика / btu031
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Каханда, И., и Бен-Гур, А. (2017). «Gostruct 2.0: Автоматизированное предсказание функции белков для аннотированных белков», Труды 8-й Международной конференции ACM по биоинформатике, вычислительной биологии и медицинской информатике (Нью-Йорк, Нью-Йорк), 60–66.DOI: 10.1145 / 3107411.3107417
CrossRef Полный текст | Google Scholar
Кингма Д. П. и Ба Дж. (2014). Адам: Метод стохастической оптимизации. arXiv [препринт] arxiv : 1412.6980.
Google Scholar
Кирак, М., Озойоглу, Г. (2008). «Прогнозирование функции белков на основе паттернов в биологических сетях», Ежегодная международная конференция по исследованиям в области вычислительной молекулярной биологии (Берлин: Гейдельберг: Springer), 197–213.DOI: 10.1007 / 978-3-540-78839-3_18
CrossRef Полный текст | Google Scholar
Кулманов, М., Хан, М.А., Хендорф, Р. (2018). Deepgo: прогнозирование функций белка на основе последовательности и взаимодействий с использованием классификатора с глубокими онтологиями. Биоинформатика 34, 660–668. DOI: 10.1093 / биоинформатика / btx624
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Lai, H.-Y., Zhang, Z.-Y., Su, Z.-D., Su, W., Ding, H., Chen, W., et al. (2019).iproep: вычислительный предсказатель для предсказания промотора. Мол. Ther. Нуклеиновые кислоты 17, 337–346. DOI: 10.1016 / j.omtn.2019.05.028
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Ланчантин, Дж., Сингх, Р., Лин, З., и Ци, Ю. (2016). Глубокий мотив: визуализация классификации геномных последовательностей. arXiv [препринт] arxiv : 1605.01133.
Google Scholar
ЛеКун, Ю., Ботту, Л., Бенжио, Ю., и Хаффнер, П. (1998). Применение градиентного обучения для распознавания документов. Proc. IEEE 86, 2278–2324. DOI: 10.1109 / 5.726791
CrossRef Полный текст | Google Scholar
Lv, H., Zhang, Z.-M., Li, S.-H., Tan, J.-X., Chen, W., and Lin, H. (2019a). Оценка различных вычислительных методов идентификации сайтов 5-метилцитозина. Краткое. Биоинформ . DOI: 10.1093 / bib / bbz048
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Наир В., Хинтон Г. Э. (2010). «Выпрямленные линейные блоки улучшают ограниченные машины Больцмана», в Труды 27-й Международной конференции по машинному обучению (ICML-10), (Хайфа), 807–814.
Google Scholar
Нгуен, К. Д., Гардинер, К. Дж., И Чиос, К. Дж. (2011). Аннотации белков из сетей взаимодействия белков и генной онтологии. J. Biomed. Сообщите . 44, 824–829. DOI: 10.1016 / j.jbi.2011.04.010
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Radivojac, P., Clark, W. T., Oron, T. R., Schnoes, A. M., Wittkop, T., Sokolov, A., et al. (2013). Масштабная оценка предсказания вычислительной функции белка. Nat. Методы 10, 221–227. DOI: 10.1038 / Nmeth.2340
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Рифайоглу, А.С., Доган, Т., Мартин, М.Дж., Цетин-Аталай, Р., Аталай, В. (2019). Deepred: автоматическое предсказание функции белков с помощью многозадачных глубоких нейронных сетей с прямой связью. Sci. Репутация . 9, 1–16. DOI: 10.1038 / s41598-019-43708-3
CrossRef Полный текст | Google Scholar
Сёндерби, С. К., Сёндерби, К. К., Нильсен, Х., и Винтер, О. (2015). «Сверточные сети LSTM для субклеточной локализации белков», в Международной конференции по алгоритмам вычислительной биологии (Springer), 68–80. DOI: 10.1007 / 978-3-319-21233-3_6
CrossRef Полный текст | Google Scholar
Сёндерби, С. К., Винтер, О. (2014). Прогнозирование вторичной структуры белков с помощью сетей долгосрочной краткосрочной памяти. arXiv [препринт] arxiv : 1412.7828.
Google Scholar
Спенсер, М., Эйкхольт Дж. И Ченг Дж. (2014). Сетевой подход глубокого обучения к ab initio предсказанию вторичной структуры белка. IEEE / ACM Trans. Comput. Биол. Биоинформ . 12, 103–112. DOI: 10.1109 / TCBB.2014.2343960
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Шкларчик Д., Франческини А., Вайдер С., Форслунд К., Хеллер Д., Уэрта-Сепас Дж. И др. (2015). Строка v10: сети белок-белкового взаимодействия, интегрированные в древо жизни. Нуклеиновые Кислоты Res .43, D447 – D452. DOI: 10.1093 / nar / gku1003
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Tan, J.-X., Li, S.-H., Zhang, Z.-M., Chen, C.-X., Chen, W., Tang, H., et al. (2019). Идентификация гормонально-связывающих белков на основе методов машинного обучения. Math. Biosci. Eng . 16, 2466–2480. DOI: 10.3934 / mbe.2019123
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Ван Дж., Чжан Дж., Цай Ю. и Дэн Л. (2019a). Deepmir2go: определение функций микрорн человека с использованием модели глубокой классификации с несколькими метками. Внутр. J. Mol. Sci . 20: 6046. DOI: 10.3390 / ijms20236046
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Wang, L., Liu, Y., Zhong, X., Liu, H., Lu, C., Li, C., et al. (2019b). Dmfold: новый метод прогнозирования вторичной структуры РНК с помощью псевдоузлов, основанный на глубоком обучении и улучшенном принципе максимизации пары оснований. Фронт. Genet . 10: 143. DOI: 10.3389 / fgene.2019.00143
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Уивер Р.(2011). Молекулярная биология (WCB Cell и Молекулярная биология) . Нью-Йорк, Нью-Йорк: Образование Макгроу-Хилл.
Google Scholar
Вэй, Л., Дин, Ю., Су, Р., Тан, Дж., И Цзоу, К. (2018). Прогнозирование субклеточной локализации белков человека с помощью глубокого обучения. J. Parallel Distrib. Вычислить . 117, 212–217. DOI: 10.1016 / j.jpdc.2017.08.009
CrossRef Полный текст | Google Scholar
Янг, Дж., Ян, Р., Рой, А., Сюй, Д., Пуассон, Дж., и Чжан Ю. (2015). Пакет i-tasser: прогнозирование структуры и функции белков. Nat. Методы 12: 7. DOI: 10.1038 / nmeth.3213
PubMed Аннотация | CrossRef Полный текст | Google Scholar
You, R., Yao, S., Xiong, Y., Huang, X., Sun, F., Mamitsuka, H., et al. (2019). Netgo: улучшение крупномасштабного прогнозирования функции белков с помощью массивной сетевой информации. Нуклеиновые Кислоты Res . 47, W379 – W387. DOI: 10.1093 / nar / gkz388
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Ю, Р., Zhang, Z., Xiong, Y., Sun, F., Mamitsuka, H., and Zhu, S. (2018). Голабелер: улучшение предсказания крупномасштабной функции белка на основе последовательностей путем обучения ранжированию. Биоинформатика 34, 2465–2473. DOI: 10.1093 / биоинформатика / bty130
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Чжан К., Чжэн В., Фреддолино П. Л. и Чжан Ю. (2018). Метаго: Прогнозирование генной онтологии негомологичных белков с помощью предсказания структуры белка с низким разрешением и картирования белок-белковой сети. J. Mol. Биол . 430, 2256–2265. DOI: 10.1016 / j.jmb.2018.03.004
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Zhang, M.-L., and Zhou, Z.-H. (2013). Обзор алгоритмов многокомпонентного обучения. IEEE Trans. Знай. Data Eng . 26, 1819–1837. DOI: 10.1109 / TKDE.2013.39
CrossRef Полный текст | Google Scholar
Zhang, S., Zhou, J., Hu, H., Gong, H., Chen, L., Cheng, C., et al. (2016). Платформа глубокого обучения для моделирования структурных особенностей РНК-связывающих белков-мишеней. Нуклеиновые Кислоты Res . 44: e32. DOI: 10.1093 / nar / gkv1025
PubMed Аннотация | CrossRef Полный текст | Google Scholar
Zhu, X.-J., Feng, C.-Q., Lai, H.-Y., Chen, W., and Hao, L. (2019). Прогнозирование структурных классов белков для последовательностей с низким сходством путем оценки различных характеристик. Зн. На основе Syst . 163, 787–793. DOI: 10.1016 / j.knosys.2018.10.007
CrossRef Полный текст | Google Scholar
Ученые обнаружили эволюционную связь между структурой и функцией белка
- Новое исследование Университета Иллинойса демонстрирует эволюцию структуры и функции белка в течение трех лет.8 миллиардов лет.
- Фрагменты генетического кода, согласованные для разных организмов и времени, направляют белки к созданию «петель» или активных сайтов, которые наделяют белки их функциями.
- Связь между структурой и функцией белков можно рассматривать как тип сети.
- Демонстрация эволюции этой небольшой сети может помочь другим понять, как разные типы сетей, такие как Интернет или социальные сети, меняются с течением времени.
УРБАНА, штат Иллинойс. — Белки — это больше, чем просто диетическая потребность. Этот разнообразный набор молекул обеспечивает почти все клеточные операции в живом организме. Ученые могут знать структуру белка или его функцию, но не всегда могут связать их между собой.
«Большой проблемой в биологии является вопрос о том, как белок делает то, что он делает. Мы думаем, что ответ кроется в эволюции белка », — говорит профессор Иллинойского университета и специалист по биоинформатике Густаво Каэтано-Аноллес.
Геологи обнаружили остатки жизни, сохранившиеся в горных породах возрастом в миллиарды лет. В некоторых случаях сохранность микробов и тканей была настолько хорошей, что можно было обнаружить микроскопические клеточные структуры, которые когда-то были связаны со специфическими белками. Эта геологическая летопись дает ученым скрытую связь с эволюционной историей белковых структур на протяжении невероятно долгих периодов времени. Но до сих пор не всегда было возможно связать функцию с этими структурами, чтобы узнать, как белки вели себя в клетках миллиарды лет назад по сравнению с сегодняшним днем.
«Впервые мы проследили эволюцию в биологической сети», — отмечает Каэтано-Аноллес.
Каэтано-Аноллес и аспиранты Файез Азиз и Келси Каэтано-Аноллес использовали сети для исследования связи между структурой белка и молекулярной функцией. Они построили временную шкалу белковых структур, охватывающую 3,8 миллиарда лет в геологической летописи, но нуждались в способе связать структуры с их функциями. Для этого они изучили генетический состав сотен организмов.
«Оказывается, в наших генах есть небольшие фрагменты, которые невероятно сохраняются с течением времени», — говорит Каэтано-Аноллес. «И не только в геномах человека. Когда мы смотрим на высшие организмы, такие как растения, грибы и животные, а также на бактерии, археи и вирусы, всегда присутствуют одни и те же фрагменты. Мы видим их снова и снова ».
Исследовательская группа обнаружила, что эти крошечные генные сегменты сообщают белкам о создании «петель», которые представляют собой мельчайшие структурные единицы в белке.Когда петли собираются вместе, они создают активные центры или молекулярные карманы, которые обеспечивают белкам их функции. Например, гемоглобин, белок, переносящий кислород в крови, имеет две петли, которые создают активный центр, связывающий кислород. Петли объединяются, чтобы создать более крупные белковые структуры, называемые доменами.
Примечательно, что новое исследование показывает, что петли неоднократно использовались для выполнения новых функций и что этот процесс был активным и продолжался с самого начала жизни.
«Этот набор важен для понимания биологического разнообразия», — говорит Каэтано-Аноллес.
Один из важных аспектов исследования касается фактической связи между доменной структурой и функциональными петлями. Исследователи обнаружили, что эта связь характеризуется неожиданным свойством, которое раскрывается во времени, «возникающим» свойством, известным как иерархическая модульность.
«Петли — это связные модули, как и домены, белки, клетки, органы и тела.- объясняет Каэтано-Аноллес. «Мы все состоим из связанных модулей, в том числе наши человеческие тела. Это иерархическая модульность: объединение небольших связанных частей в более крупные и все более сложные целые ».
Иерархическая модульность также существует в искусственных сетях, таких как Интернет. Например, каждый маршрутизатор представляет собой «узел», который передает информацию на разные компьютеры. Когда миллионы компьютеров взаимодействуют друг с другом в сети, возникают более крупные и сложные объекты. Каэтано-Аноллес предполагает, что эволюцию искусственно созданных сетей можно нанести на карту таким же образом, как и эволюцию биологических сетей.
«С точки зрения информатики, мало кто изучает, как отслеживать сети во времени. Представьте, что вы изучаете, как Интернет растет и изменяется, когда добавляются новые маршрутизаторы, отключаются или соединяются друг с другом в сети. Это непростая задача, потому что нужно отслеживать миллионы маршрутизаторов, а интернет-коммуникация может быть очень динамичной. В нашем исследовании мы демонстрируем, как это можно сделать с помощью очень маленькой сети », — объясняет Каэтано-Аноллес.
Методы, разработанные Каэтано-Аноллесом и его командой, теперь могут объяснить, как изменения способны структурировать такие разнообразные системы, как Интернет, социальные сети или совокупность всех белков в организме.
Статья «Ранняя история и появление молекулярных функций и поведения модульной безмасштабной сети» опубликована в журнале Scientific Reports . Соавторами отчета выступили М. Файез Азиз и Келси Каэтано-Аноллес, также из Университета Иллинойса. Полный текст статьи можно найти по адресу: http://www.nature.com/articles/srep25058.
Структура и функции: Whitford, David: 9780471498940: Amazon.com: Books
«… Бесценный ресурс… студенты факультетов биохимии, химии, генетики, структурной биологии, а также студенты-медики и стоматологи получат большую пользу от чтения этого текста…» ( Annals of Biomedical Engineering , декабрь 2005 г.)
«… стоящие инвестиции для начинающих студентов или для продвинутых ученых, которые хотят лучше понять химию белков… »( Clinical Chemistry , ноябрь 2005 г.)
« Замечательный ресурс для вводных курсов по химии белков и надежный справочник для тех, кто интересуется белками.»( CHOIC E, ноябрь 2005 г.)
«… квинтэссенция лет чтения лекций и отзывов студентов. «( Journal of Biological Education, Spring 2006: Vol.40; 2)
Структура и функция белка — это всестороннее введение в изучение белков и их важность для современной биохимии. Каждая глава посвящена структуре и функциям белков с определенной темой, призванной улучшить понимание учащимися. Открываясь кратким историческим обзором предмета, книга переходит к обсуждению «строительных блоков» белков и их соответствующих химических и физических свойств.В последующих главах исследуются экспериментальные и вычислительные методы сравнения белков, методы очистки белков, а также фолдинг и стабильность белков.
Включены последние разработки в этой области, а ключевые концепции представлены в удобном для пользователя виде, чтобы студенты могли усвоить основы, прежде чем переходить к более углубленному изучению и анализу белков.
Бесценный ресурс для студентов факультетов биохимии, молекулярной биологии, медицины и химии, обеспечивающий современный подход к предмету «Белки».
- Доступное введение в принципы структуры и функции белков.
- Красиво иллюстрировано в полном цвете.
- Включает проблемы в конце главы, ссылки на дополнительную литературу и полный глоссарий терминов.
- Связанный веб-сайт, включающий веб-руководства, проблемы и дополнительный контент.
С задней обложки
Структура и функция белка — это всестороннее введение в изучение белков и их важность для современной биохимии.Каждая глава посвящена структуре и функциям белков с определенной темой, призванной улучшить понимание учащимися. Открываясь кратким историческим обзором предмета, книга переходит к обсуждению «строительных блоков» белков и их соответствующих химических и физических свойств. В последующих главах исследуются экспериментальные и вычислительные методы сравнения белков, методы очистки белков, а также фолдинг и стабильность белков.
Включены последние разработки в этой области, а ключевые концепции представлены в удобном для пользователя виде, чтобы студенты могли усвоить основы, прежде чем переходить к более углубленному изучению и анализу белков.
Бесценный ресурс для студентов факультетов биохимии, молекулярной биологии, медицины и химии, обеспечивающий современный подход к предмету «Белки».
- Доступное введение в принципы структуры и функции белков.
- Красиво иллюстрировано в полном цвете.
- Включает проблемы в конце главы, ссылки на дополнительную литературу и полный глоссарий терминов.
- Связанный веб-сайт, включающий веб-руководства, проблемы и дополнительный контент.
Об авторе
Дэвид Уитфорд , Queen Mary & Westfield College, Лондон, Великобритания.
Какие примеры функции белков?
Сводка таблицы:
1) Ферменты. Каждый процесс, происходящий в организме, в какой-то момент или полностью включает химическую реакцию. Химические реакции протекают в соответствии с физическим законом, известным как свободная энергия Гиббса. Этот закон гласит, что для протекания химической реакции в систему должна быть вложена энергия.Количество энергии, необходимое для начала реакции, называется «энергией активации». Эта энергия активации не всегда доступна; этот тип реакции не является спонтанным. Вот почему существует ферментов . Ферменты катализируют реакцию, что означает, что они ускоряют ее и позволяют ей протекать быстрее, чем это могло бы произойти спонтанно.
а. Фермент — это специализированный белок, который снижает энергию активации . Он не добавляет энергии системе, он уменьшает количество энергии, необходимое для начала реакции.Особое внимание следует уделить тому факту, что требования снижены, поскольку именно здесь студенты часто ошибаются. (Ферменты не добавляют энергии реакции ).
Ферменты понижающие энергию активации:
Ферменты снижают энергию активации, необходимую для реакции, связываясь со своим «субстратом» (молекулой, с помощью которой ферменты участвуют в реакции). Субстраты обычно подходят для определенных ферментов, что делает ферменты очень точными инструментами.
Примечание: фермент может иметь более одного субстрата.
В химических реакциях ничего не может произойти, пока молекулы не окажутся в непосредственной близости друг от друга. Следовательно, ферменты снижают энергию активации, связываясь с двумя соединениями, которые необходимы для химической реакции, — объединяя их. Это значительно увеличивает продуктивность клетки, так как избавляет от необходимости ждать, пока молекулы «столкнутся» друг с другом.
Примечание: если бы все реакции, необходимые для жизни, протекали без ферментов, даже самые простые бактерии не смогли бы выжить! Ферменты абсолютно необходимы.
Есть и другие способы, которыми фермент может способствовать реакции. Один из таких механизмов заключается в связывании с субстратом и последующем вскрытии субстрата, чтобы обнажить его функциональные группы. Это позволяет протекать реакции, которая обычно вообще не протекает (из-за закупоренного участка реакции).
2) Структурные белки. Ферменты включают большую часть функциональных белков, но белки также могут быть использованы во многих других областях. Например, клетки и ткани не могут поддерживать свою структуру без структурных белков .Коллаген — хорошо известный структурный белок. Этот белок часто находится во внеклеточном матриксе (пространстве за пределами клетки), удерживающем вместе такие вещи, как сухожилия и связки.
Другой структурный белок, обнаруженный в организме человека, называется актин. Это жизненно важная часть цитоскелета наших клеток, поэтому она очень важна для их формы и конформации.
3) Транспортные белки. Кислород, гормоны и многие другие вещества не могут перемещаться по телу без посторонней помощи.Для этого очень пригодятся транспортные белки. Думайте о них как о такси. Иногда человек оказывается в незнакомом месте и не может добраться до желаемого. Итак, он вызывает такси. Транспортные белки — это кабины. Кислород не может свободно плавать в крови человека по разным причинам, поэтому белок, называемый гемоглобином, связывается с ним и доставляет его к месту назначения.
4) Моторные белки. Мышцы важны, потому что они работают вместе, чтобы производить сложные движения.Эти движения были бы невозможны без существования моторных белков . Белки, такие как миозин, способны изменять свою конформацию в ответ на химический стимул, позволяя клеткам, обладающим ими, изменять свою форму. Так они ускоряют свое положение в трехмерном пространстве.
5) Белки хранения. Некоторые вещества, от которых зависит выживание нашего организма, опасны для окружающих тканей, если их беспрепятственно дрейфовать.Для этого существует запасных белков . Например, железо хранится в печени с помощью белка, известного как ферритин.
6) Сигнальные белки. Гормональная система организма функционирует как очень сложная почтовая система. Сигнальные белки , часто гормоны, представляют собой специализированные соединения, синтезированные для отправки сообщения в определенное или обширное место. Некоторые сигнальные белки посылают сообщение каждой клетке тела, а некоторые настолько специфичны, что их может распознать только один тип клеток.Эти белки несут команды, такие как фактор роста нервов ( NGF ), эпидермальный фактор роста ( EGF ) и многие другие.
7) Рецепторных белков. Если есть сигнальные белки, должен быть кто-то, кто их получит. Хорошо известным примером является рецептор ацетилхолина , обнаруженный в мышечных клетках в нервно-мышечных соединениях. Они содержат определенные конформации, способные распознавать определенные сигнальные белки.
8) Генные регуляторные белки. Экспрессия гена очень сложна; он регулируется белками, редактируется, иногда повреждается, повторно редактируется и иногда заглушается. Чтобы ген мог правильно транскрибироваться РНК-полимеразой, необходимо определенное направление. Если бы все гены экспрессировались одновременно, биологические организмы действительно были бы скоплением белков!
Чтобы исправить это, клетка использует белки, называемые регуляторными белками . Они связываются с молекулой ДНК и делают одно из двух: активируют экспрессию генов или подавляют ее.Бактерии содержат репрессор лактозы, который предотвращает экспрессию фермента, необходимого для катаболизма лактозы, когда такой сахар недоступен. Точно так же существуют белки, которые связываются с цепью ДНК, когда необходимо экспрессировать определенный ген — обычно это выполняется белком, участвующим в пути передачи сигнала.
Регуляторный белок, ингибирующий или отключающий ген:
9) Разное. Как было сказано выше, клетки обладают гораздо большим количеством белков, чем просто восемь категорий.Однако, помимо восьми широких категорий, белки, которые не входят в границы, обычно создаются специально для клетки / организма, которые их содержат. У некоторых медуз, например, есть белок, называемый , зеленый флуоресцентный белок ( GFP ), который придает им мистические, зеленые, светящиеся в темноте свойства.
Этот список ссылается на учебник под названием Essential Cell Biology, Fourth Edition во всем своем составе. Основная часть материала была найдена на странице 122.Среди авторов этой книги: Брюс Альбертс, Деннис Брей, Карен Хопкин, Александр Джонсон, Джулиан Льюис, Мартин Рафф, Кейт Робертс и Питер Уолтер. Для дальнейшего чтения этот учебник можно приобрести в Google Книгах [здесь]
(https://play.google.com/store/books/details/Bruce_Alberts_Essential_Cell_Biology_Fourth_Editio?id=Cg4WAgAAQBAJ).
Центр структуры и функций белков
Центр структуры и функций белков был основан в 2000 году на сумму 9,6 долларов США.
млн. грант COBRE от Национального исследовательского центра Национальных институтов здравоохранения
Ресурсы.Поддержка Центра была продолжена в 2005 году в виде гранта в размере 10,2 млн долларов США от
NIH NCRR, а также многочисленные другие гранты преподавателям Центра.
Центр изучения структуры и функции белка IDeA COBRE Университета Арканзаса NIH IDeA COBRE
была создана на период с 01.09.2000 по 31.08.2010 с COBRE Phase I / II NIH NCRR
Грант 1 P20 15 569 рупий на сумму 19,8 млн долларов США, срок действия — 01.09.2010 — 31.05.2015 с
NIH COBRE Phase III предоставляет 1P30RR031154 и 8P30GM103450 за 5 долларов.4 миллиона.
Белки выполняют почти всю работу в клетках нашего тела, начиная от функции мозга.
и нервная передача для выработки метаболической энергии и мышечного сокращения. Кроме того,
большинство заболеваний связано с нарушением функции белков. Будущие достижения в
понимание, диагностика и лечение болезней человека будут зависеть от лучшего
понимание структур, функций и взаимодействий тысяч белков
которые закодированы в геномах человека и патогенов человека.Такое понимание
появятся в результате подробных исследований молекулярной структуры и функции
белки, которые играют важную роль в заболеваниях человека.
Члены Центра COBRE Университета Арканзаса по структуре и функциям белков
стремятся внести значительный вклад в это фундаментальное понимание через междисциплинарные
исследовательские проекты с использованием новейших методов и оборудования.Центр
добилась отличных успехов с момента своего основания в октябре 2000 года, в результате чего
более 80 миллионов долларов США — это внешняя грантовая поддержка, включая 37 грантов NIH и 28 NSF,
Гранты DOE и EPA. Были наняты пятнадцать выдающихся новых преподавателей, и основные
оборудование в спектроскопии ЯМР, рентгеновской кристаллографии, масс-спектрометрии, крупномасштабных
налажено производство белка и химический синтез.
Центр COBRE проводит многочисленные биомедицинские исследовательские проекты, важные для
здоровье человека, в том числе разработка новых методов лечения остеопороза, гепатита
C, вирус гриппа, рак и болезни сердца. Например, цель одного проекта
заключается в разработке и тестировании слитого паратироидного гормона и белка связывающего коллаген домена
для лечения остеопороза.
Центр поддерживает междисциплинарные исследовательские проекты с участием более 30 преподавателей.
членов и 50 аспирантов на трех разных факультетах.
Фрэнк Миллетт, директор CPSF
Департамент химии и биохимии
Арканзасский университет
Фейетвилл, Арканзас 72701
Электронная почта: millett @ uark.edu
Телефон: 479-575-4999
’62 Центр театра и танца, ’62 Центр | ||
Касса | 597-2425 | |
Магазин костюмов | 597-3373 | |
Менеджер мероприятий / Помощник менеджера | 597-4808 | 597-4815 факс |
Производство | 597-4474 факс | |
Магазин сцен | 597-2439 | |
’68 Центр карьерного роста, Мирс | 597-2311 | 597-4078 факс |
Academic Resources, Парески | 597-4672 | 597-4959 факс |
Служба поддержки инвалидов, Парески | 597-4672 | |
Прием, Вестон Холл | 597-2211 | 597-4052 факс |
Программа позитивных действий, Хопкинс-холл, | 597-4376 | |
Africana Studies, Hollander | 597-2242 | 597-4222 факс |
Американские исследования, Шапиро | 597-2074 | 597-4620 факс |
Антропология и социология, Холландер | 597-2076 | 597-4305 факс |
Архивы и специальные коллекции, Sawyer | 597-4200 | 597-2929 факс |
Читальный зал | 597-4200 | |
Искусство (История, Студия), Spencer Studio Art / Lawrence | 597-3578 | 597-3693 факс |
Архитектурная студия, Spencer Studio Art | 597-3134 | |
Фотография Студия, Spencer Studio Art | 597-2030 | |
Printmaking Studio, Spencer Studio Art | 597-2496 | |
Скульптурная студия, Spencer Studio Art | 597-3101 | |
Senior Studio, Spencer Studio Art | 597-3224 | |
Видео / Фотостудия, Spencer Studio Art | 597-3193 | |
Asian Studies, Hollander | 597-2391 | 597-3028 факс |
Астрономия / Астрофизика, Thompson Physics | 597-2482 | 597-3200 факс |
Департамент легкой атлетики, физическое воспитание, отдых, Ласелл | 597-2366 | 597-4272 факс |
Спортивный директор | 597-3511 | |
Boat House, Озеро Онота | 443-9851 | |
Автобусы | 597-2366 | |
Фитнес-центр | 597-3182 | |
Hockey Rink Ice Line, Lansing Chapman | 597-2433 | |
Intramurals, Атлетический центр Чандлера | 597-3321 | |
Физическая культура | 597-2141 | |
Pool Wet Line, Атлетический центр Чандлера | 597-2419 | |
Sports Information, Hopkins Hall | 597-4982 | 597-4158 факс |
Спортивная медицина | 597-2493 | 597-3052 факс |
Площадки для игры в сквош | 597-2485 | |
Поле для гольфа Taconic | 458-3997 | |
Биохимия и молекулярная биология, Thompson Biology | 597-2126 | |
Биоинформатика, геномика и протеомика, Bronfman | 597-2124 | |
Биология, Thompson Biology | 597-2126 | 597-3495 факс |
Охрана и безопасность кампуса, Хопкинс-холл | 597-4444 | 597-3512 факс |
Карты доступа / системы сигнализации | 597-4970 / 4033 | |
Escort Service, Hopkins Hall | 597-4400 | |
Офицеры и диспетчеры | 597-4444 | |
Секретарь, удостоверения личности | 597-4343 | |
Коммутатор | 597-3131 | |
Центр развития творческого сообщества, 66 Stetson Court | 884-0093 | |
Центр экономики развития, 1065 Main St | 597-2148 | 597-4076 факс |
Компьютерный зал | 597-2522 | |
Вестибюль | 597-4383 | |
Центр экологических исследований, класс 1966 г. Экологический центр | 597-2346 | 597-3489 факс |
Лаборатория наук об окружающей среде, Морли | 597-2380 | |
Экологические исследования | 597-2346 | |
Лаборатория ГИС | 597-3183 | |
Центр иностранных языков, литератур и культур, Холландер | 597-2391 | 597-3028 факс |
Арабоведение, Холландер | 597-2391 | 597-3028 факс |
Сравнительная литература, Холландер | 597-2391 | |
Критические языки, Hollander | 597-2391 | 597-3028 факс |
лингафонный кабинет | 597-3260 | |
Россия, Холландер | 597-2391 | |
Центр обучения в действии, Brooks House | 597-4588 | 597-3090 факс |
Библиотека редких книг Чапина, Сойер | 597-2462 | 597-2929 факс |
Читальный зал | 597-4200 | |
Офис капелланов, Парески | 597-2483 | 597-3955 факс |
Еврейский религиозный центр, Стетсон-Корт 24, | 597-2483 | |
Мусульманская молитвенная комната, часовня Томпсона (нижний уровень) | 597-2483 | |
Католическая часовня Ньюмана, часовня Томпсона (нижний уровень) | 597-2483 | |
Chemistry, Thompson Chemistry | 597-2323 | 597-4150 факс |
Классика (греческий и латинский), Hollander | 597-2242 | 597-4222 факс |
Когнитивная наука, Бронфман | 597-4594 | |
College Marshal, Thompson Physics | 597-2008 | |
Отношения с колледжем | 597-4057 | |
Программа 25-го воссоединения, Фогт | 597-4208 | 597-4039 факс |
Программа 50-го воссоединения, Фогт | 597-4284 | 597-4039 факс |
Advancement Operations, Мирс-Вест | 597-4154 | 597-4333 факс |
Мероприятия для выпускников, Vogt | 597-4146 | 597-4548 факс |
Фонд выпускников | 597-4153 | 597-4036 факс |
Связи с выпускниками, Мирс Вест | 597-4151 | 597-4178 факс |
Alumni / Development Mail Services, Мирс-Уэст | 597-4369 | |
Разработка, Vogt | 597-4256 | |
Отношения с донорами, Vogt | 597-3234 | 597-4039 факс |
Офис по планированию подарков, Vogt | 597-3538 | 597-4039 факс |
Grants Office, Mears West | 597-4025 | 597-4333 факс |
Программа крупных подарков, Vogt | 597-4256 | 597-4548 факс |
Parents Fund, Vogt | 597-4357 | 597-4036 факс |
Prospect Management & Research, Мирс | 597-4119 | 597-4178 факс |
Начало занятий и академические мероприятия, Jesup | 597-2347 | 597-4435 факс |
Communications, Hopkins Hall | 597-4277 | 597-4158 факс |
Sports Information, Hopkins Hall | 597-4982 | 597-4158 факс |
Web Team, Southworth Schoolhouse | ||
Williams Magazines (ранее Alumni Review), Hopkins Hall | 597-4278 | |
Компьютерные науки, Thompson Chemistry | 597-3218 | 597-4250 факс |
Conferences & Events, Парески | 597-2591 | 597-4748 факс |
Запросы Elm Tree House, Mt.Ферма Надежды, | 597-2591 | |
Офис контролера, Хопкинс Холл | 597-4412 | 597-4404 факс |
Accounts Payable & Data Entry, Hopkins Hall | 597-4453 | |
Bursar & Cash Receipts, Hopkins Hall | 597-4396 | |
Financial Information Systems, Hopkins Hall | 597-4023 | |
Purchasing Cards, Hopkins Hall | 597-4413 | |
Студенческие ссуды, Хопкинс Холл | 597-4683 | |
Dance, 62 Центр | 597-2410 | |
Davis Center (ранее Multicultural Center), Jenness | 597-3340 | 597-3456 факс |
Харди Хаус | 597-2129 | |
Jenness House | 597-3344 | |
Rice House | 597-2453 | |
Декан колледжа, Hopkins Hall | 597-4171 | 597-3507 факс |
Декан факультета Хопкинс Холл | 597-4351 | 597-3553 факс |
Столовая, капельницы | 597-2121 | 597-4618 факс |
’82 Гриль, Парески | 597-4585 | |
Кондитерская, Парески | 597-4511 | |
Общественное питание, Дом факультета | 597-2452 | |
Driscoll Dining Hall, Дрисколл | 597-2238 | |
Eco Café, Научный центр | 597-2383 | |
Grab ‘n Go, Парески | 597-4398 | |
Lee Snack Bar, Парески | 597-3487 | |
Обеденный зал Mission Park, Mission Park | 597-2281 | |
Whitmans ‘, Paresky | 597-2889 | |
Economics, Schapiro | 597-2476 | 597-4045 факс |
Английский, Холландер | 597-2114 | 597-4032 факс |
Сооружения, служебное здание | 597-2301 | |
College Car Request | 597-2302 | |
Скорая помощь вечером / в выходные дни | 597-4444 | |
Запросы на работу производственных помещений | 597-4141 факс | |
Особые мероприятия | 597-4020 | |
Кладовая | 597-2143 | 597-4013 факс |
Клуб преподавателей, Дом факультетов / Центр выпускников | 597-2451 | 597-4722 факс |
Бронирование | 597-3089 | |
Fellowships Office, Hopkins Hall | 597-3044 | 597-3507 факс |
Financial Aid, Weston Hall | 597-4181 | 597-2999 факс |
Geosciences, Clark Hall | 597-2221 | 597-4116 факс |
Немецко-русский, Hollander | 597-2391 | 597-3028 факс |
Global Studies, Hollander | 597-2247 | |
Программа магистратуры по истории искусств, Кларк | 458-2317 факс | |
Службы здравоохранения и хорошего самочувствия, Thompson Ctr Health | 597-2206 | 597-2982 факс |
Медицинское просвещение | 597-3013 | |
Услуги интегративного благополучия (консультирование) | 597-2353 | |
Чрезвычайные ситуации с опасностью для жизни | Позвоните 911 | |
Медицинские услуги | 597-2206 | |
История, Холландер | 597-2394 | 597-3673 факс |
История науки, Бронфман | 597-4116 факс | |
Хопкинс Форест | 597-4353 | |
Розенбург Центр | 458-3080 | |
Отдел кадров, B&L Building | 597-2681 | 597-3516 факс |
Услуги няни, корпус B&L | 597-4587 | |
Льготы | 597-4355 | |
Программа помощи сотрудникам | 800-828-6025 | |
Занятость | 597-2681 | |
Заработная плата | 597-4162 | |
Ресурсы для супруга / партнера | 597-4587 | |
Занятость студентов | 597-4568 | |
Погодная линия (ICEY) | 597-4239 | |
Humanities, Schapiro | 597-2076 | |
Информационные технологии, Jesup | 597-2094 | 597-4103 факс |
Пакеты для чтения курса, Drop Box для офисных услуг | 597-4090 | |
Центр кредитования оборудования, приложение Додда | 597-4091 | |
Служба поддержки преподавателей / сотрудников, [электронная почта] | 597-4090 | |
Медиауслуги и справочная информация в классе | 597-2112 | |
Служба поддержки студентов, [электронная почта] | 597-3088 | |
Телекоммуникации / Телефоны | 597-4090 | |
Междисциплинарные исследования, Hollander | 597-2552 | |
Международное образование и учеба, Хопкинс Холл | 597-4262 | 597-3507 факс |
Инвестиционный офис, Хопкинс Холл | 597-4447 | |
Бостонский офис | 617-502-2400 | 617-426-5784 факс |
Еврейские исследования, Мазер | 597-3539 | |
Правосудие и закон, Холландер | 597-2102 | |
Latina / o Studies, Hollander | 597-2242 | 597-4222 факс |
Исследования лидерства, Шапиро | 597-2074 | 597-4620 факс |
Морские исследования, Бронфман | 597-2297 | |
Математика и статистика, Bascom | 597-2438 | 597-4061 факс |
Музыка, Бернхард | 597-2127 | 597-3100 факс |
Concertline (записанная информация) | 597-3146 | |
Неврология, Thompson Biology | 597-4107 | 597-2085 факс |
Окли Центр, Окли | 597-2177 | 597-4126 факс |
Управление институционального разнообразия и справедливости, Hopkins Hall | 597-4376 | 597-4015 факс |
Управление счетов студентов, Хопкинс-холл | 597-4396 | 597-4404 факс |
Performance Studies, ’62 Center | 597-4366 | |
Философия, Шапиро | 597-2074 | 597-4620 факс |
Физика, Thompson Physics | 597-2482 | 597-4116 факс |
Планетарий / Обсерватория Хопкинса | 597-3030 | |
Old Hopkins Observatory Theater | 597-4828 | |
Бронирование | 597-2188 | |
Политическая экономия, Шапиро | 597-2327 | |
Политология, Шапиро | 597-2168 | 597-4194 факс |
Офис президента, Хопкинс Холл | 597-4233 | 597-4015 факс |
Дом Президента | 597-2388 | 597-4848 факс |
Услуги печати и почты для преподавателей / сотрудников, ’37 House | 597-2022 | |
Программа обучения, Бронфман | 597-4522 | 597-2085 факс |
Офис Провоста, Хопкинс Холл | 597-4352 | 597-3553 факс |
Психология, психологические кабинеты и лаборатории | 597-2441 | 597-2085 факс |
Недвижимость, B&L Building | 597-2195 / 4238 | 597-5031 факс |
Ипотека для преподавателей / сотрудников | 597-4238 | |
Аренда жилья для преподавателей / сотрудников | 597-2195 | |
Офис регистратора, Хопкинс Холл | 597-4286 | 597-4010 факс |
Религия, Холландер | 597-2076 | 597-4222 факс |
Romance Languages, Hollander | 597-2391 | 597-3028 факс |
Планировщик помещений | 597-2555 | |
Соответствие требованиям безопасности и охраны окружающей среды, класс ’37, дом | 597-3003 | |
Библиотека Сойера, Сойер | 597-2501 | 597-4106 факс |
Службы доступа | 597-2501 | |
Приобретения / Серийные номера | 597-2506 | |
Каталогизация / Службы метаданных | 597-2507 | |
Межбиблиотечный абонемент | 597-2005 | 597-2478 факс |
Исследовательские и справочные службы | 597-2515 | |
Стеллаж | 597-4955 | 597-4948 факс |
Системы | 597-2084 | |
Научная библиотека Шоу, Научный центр | 597-4500 | 597-4600 факс |
Исследования в области науки и технологий, Бронфман | 597-2239 | |
Научный центр, Бронфман | 597-4116 факс | |
Магазин электроники | 597-2205 | |
Станочно-модельный цех | 597-2230 | |
Безопасность | 597-4444 | |
Специальные академические программы, Харди | 597-3747 | 597-4530 факс |
Sports Information, Hopkins Hall | 597-4982 | 597-4158 факс |
Студенческая жизнь, Парески | 597-4747 | |
Планировщик помещений | 597-2555 | |
Управление студенческими центрами | 597-4191 | |
Организация студенческих мероприятий | 597-2546 | |
Студенческий дом, Парески | 597-2555 | |
Вовлеченность студентов | 597-4749 | |
Программы проживания для старших классов | 597-4625 | |
Студенческая почта, Парески, | 597-2150 | |
Устойчивое развитие / Центр Зилха, Харпер | 597-4462 | |
Коммутатор, Хопкинс Холл | 597-3131 | |
Книжный магазин Уильямса | 458-8071 | 458-0249 факс |
Театр, 62 Центр | 597-2342 | 597-4170 факс |
Trust & Estate Administration, Sears House | 597-4259 | |
Учебники | 597-2580 | |
VP for Campus Life, Hopkins Hall | 597-2044 | 597-3996 факс |
Вице-президент по связям с колледжем, Мирс | 597-4057 | 597-4178 факс |
Вице-президент по финансам и администрированию, Hopkins Hall | 597-4421 | 597-4192 факс |
Центр визуальных ресурсов, Лоуренс | 597-2015 | 597-3498 факс |
Детский центр Williams College, Детский центр Williams | 597-4008 | 597-4889 факс |
Музей искусств колледжа Уильямс (WCMA), Лоуренс | 597-2429 | 597-5000 факс |
Подготовка музея | 597-2426 | |
Служба безопасности музея | 597-2376 | |
Музейный магазин | 597-3233 | |
Уильямс Интернэшнл | 597-2161 | |
Williams Outing Club, Парески | 597-2317 | |
Оборудование / стол для студентов | 597-4784 | |
Williams Project on Economics of Higher Education, Mears West | 597-2192 | |
Williams Record, Парески | 597-2400 | 597-2450 факс |
Программа Уильямса-Эксетера в Оксфорде, Оксфордский университет | 011-44-1865-512345 | |
Программа Williams-Mystic, Mystic Seaport Museum | 860-572-5359 | 860-572-5329 факс |
Исследования женщин, гендера и сексуальности, Schapiro | 597-3143 | 597-4620 факс |
Написание программ, Hopkins Hall | 597-4615 | |
Центр экологических инициатив «Зилха», Харпер | 597-4462 |
Шаг 3c: Функция белка
Как хвост светлячка светит (необязательно)
Это видео дает краткий обзор синтеза белка, от гена до функционального белка, на примере люциферазы светлячка.
Если ваши ученики не знакомы со светлячками, сначала покажите им видео «Фейерверк природы» (найдите поле «Что такое светлячки?» На веб-странице, ссылка на которую приведена ниже).
Спроектируйте видео для всего класса.
- Через белки информация в генах формирует характеристики на клеточном, тканевом и организменном уровнях.
- Клетки производят определенные белки, считывая генетический код определенных генов.
Структура и функции
Учащиеся видят реальный пример, демонстрирующий взаимосвязь между геном, белком, который он кодирует, и его функцией в организме.
5 минут
Как хвост светлячка делает свет (видео)
Что такое белки?
Это видео знакомит со структурой и разнообразием белков.
Спроектируйте видео для всего класса.
- Белки состоят из аминокислот.
- Различные комбинации аминокислот образуют разные белки.
5-10 минут
Проверка активности белка
В этом интерактивном интерактивном режиме учащиеся перетаскивают мышью, чтобы узнать, как форма белка может повлиять на его функцию в клетке.
Предложите учащимся изучить индивидуально или в парах.
- Для выполнения своей работы белки физически взаимодействуют друг с другом и с другими молекулами.
- Форма белка влияет на его функцию.
Структура и функции
Учащиеся видят реальный пример белка, узнают о его работе в клетке и видят, как различия в структуре белка влияют на его функцию.
20-30 минут
Компьютеры с доступом в Интернет
Проверить активность белка
Классический vs.Молекулярная генетика
Этот интерактивный онлайн-курс объединяет классические и молекулярные аспекты генетики. Изучая знакомые термины и примеры, он описывает, чем эти два представления различаются, а также как они связаны.
Предложите учащимся изучить индивидуально или в парах.
Молекулярная генетика предлагает подробное объяснение тех же явлений, которые наблюдали классические генетики.
20 минут
Компьютеры с доступом в Интернет
Classical vs.Молекулярная генетика (интерактивная)
Доминантная / рецессивная проблема
С точки зрения молекулярной генетики оба аллеля гена вносят вклад в фенотип, что делает термины «доминантный» и «рецессивный» проблематичными. Более полное понимание закономерностей наследования может прийти через понимание того, что происходит на уровне белка. Узнайте больше в этом коротком видео.
Спроектируйте видео для всего класса.
- Все аллели гена вносят вклад в фенотип.
10-20 минут
Доминантная / рецессивная проблема
Результат мутации
Как различие в последовательности ДНК гена приводит к различию наблюдаемых признаков? В этой статье исследуются 8 реальных примеров изменений в структуре и / или функции белка, которые приводят к совершенно разным характеристикам.
Проект на весь класс. Пройдите и обсудите несколько примеров.
- Вариации в последовательностях ДНК приводят к вариациям белков, которые приводят к вариациям признаков.