Понедельник, 22 июля

Белок функция: Белки, жиры, углеводы. Справка — РИА Новости, 23.08.2010

Найдены неожиданные функции белка, ответственного за программируемую гибель клеток

Семейство белков-каспаз участвует как в запуске, так и в усилении процесса апоптоза в ответ на различные повреждения клетки. Белок каспаза-2 – его самый эволюционно консервативный представитель, возникший довольно давно и мало изменившийся с тех пор. Но в последние годы стали появляться данные о том, что каспаза-2 участвует во множестве других процессов, не связанных напрямую с апоптозом. Так, этот белок может подавлять развитие раковых опухолей или регулировать обмен веществ в клетке.

«Для анализа потенциально возможной связи каспазы-2 с другими белками мы использовали хорошо известную дрожжевую двугибридную систему. С помощью этого метода мы получили достаточно большой список белков, которые могут связываться с каспазой-2. Аспирант лаборатории Алексей Замараев проверил этот список путем биоинформатического анализа и ранжировал их по вероятности взаимодействия. Благодаря такому анализу после детального биохимического исследования мы некоторое время назад нашли новый взаимодействующий с каспазой-2 регуляторный фактор», – рассказал о работе руководитель научной группы и ведущий автор статьи Борис Животовский, доктор биологических наук и руководитель лаборатории исследования механизмов апоптоза факультета фундаментальной медицины МГУ имени М.В. Ломоносова.

Этот регуляторный фактор, найденный во время одного из предыдущих исследований, называется RFXANK. Он участвует в управлении работой гена, контролирующего молекулы главного комплекса гистосовместимости, которые помогают специальным клеткам иммунной системы различать «своих» и «чужаков», защищая организм от инфекций.

Продолжив поиски, ученые обнаружили еще один белок, с которым взаимодействует каспаза-2. Обозначают его английской аббревиатурой FAN, а его полное название – активатор нейтральной сфингомиелиназы. Он управляет производством церамидов – важных компонентов многих липидов (в просторечии часто называемых жирами, хотя жиры – более узкая категория, нежели липиды). Кроме того, FAN контролирует миграцию клеток и производство интерлейкина-6 – молекулы, которая регулирует воспалительные процессы. Другая важная функция FAN – руководить образованием везикул, маленьких внутриклеточных пузырьков, состоящих из того же белково-липидного двухслойного «материала», что и клеточная мембрана. В таких пузырьках различные молекулы могут перемещаться по клетке, «перевариваться» с помощью специальных белков или выбрасываться наружу.

Определить, на какие из этого множества ролей белка FAN влияет каспаза-2, помог современный биологический метод – липидомика. В отличие от своих более популярных «сестер»: протеомики, которая занимается взаимодействиями белков (протеинов), и геномики, изучающей гены и геномы, — липидомика помогает построить сети реакций, в которые вовлечены липиды. Именно эти реакции были важны для понимания работы FAN, функции которого так тесно с ними связаны.

«Совместная работа исследователей МГУ и Каролинского института (Швеция) позволила, используя липидомику, исключить участие каспазы-2 в образовании церамидов, но установить, что взаимодействие каспазы-2 с FAN отвечает за регулирование выхода из клетки интерлейкина-6, размер везикул и скорость миграции клеток, – суммирует выводы исследования Борис Животовский. – Последнее принципиально важно для понимания процесса метастазирования опухоли».

На первый взгляд кажется непонятным, какое отношение FAN может иметь к образованию метастаз – вторичных очагов роста опухоли. Но миграция клеток, которую упоминает ученый, такой же двоякий процесс, как и усиленное их деление, пролиферация. С одной стороны, оба они важны для роста тканей и заживления ран. Но ускоренные без надобности пролиферация и миграция могут сослужить организму и плохую службу, помогая раковой опухоли расти и добираться в новые и новые части организма. В ходе исследования ученые экспериментально доказали, что каспаза-2 через взаимодействие с FAN не ускоряет деление клеток, но помогает им двигаться быстрее. Теоретически, если научиться правильно выключать взаимодействие каспазы-2 и FAN, то можно замедлить процесс образования метастаз, а его включение помогло бы улучшить заживление ран.

Перед применением этого подхода на практике нужно удостовериться, что другие многочисленные функции обоих белков не слишком пострадают от подобного лечения. Как мы помним, открытое в ходе этой же работы взаимодействие каспазы-2 с FAN влияет и на формирование везикул. Подавив действие каспазы-2, ученые убедились, что без этого белка внутриклеточные пузырьки сильно увеличивались в размере. Такая особенность везикул уже была ранее известна как проявление синдрома Чедиака-Хигаши, при котором у человека возникает светобоязнь, нервный тик и нарушения работы иммунной системы. Поэтому только дальнейшие исследования покажут, можно ли бороться с метастазами через подавление связывания каспазы-2 с FAN без вреда для других функций обоих белков.

Structural Protein Function | Protocol (Translated to Russian)

4.16: Структурная функция белка

Структурные белки — это категория белков, отвечающих за различные функции, от формы и движения клеток до обеспечения поддержки основных структур, таких как кости, хрящи, волосы и мышцы. В эту группу входят такие белки, как коллаген, актин, миозин и кератин.

Коллаген, самый обильный белок у млекопитающих, встречается по всему телу. В соединительной ткани, такой как кожа, связки и сухожилия, он обеспечивает прочность на растяжение и эластичность.  В костях и зубах он минерализируется, образуя твердые ткани, и вносит вклад в их несущую способность. Помимо структурной поддержки, коллаген также может взаимодействовать с рецепторами на поверхности клетки и другими промежуточными молекулами для регулирования клеточных процессов, таких как рост и миграция, что включает изменения формы клеток и тканей.

Структурные белки составляют основу цитоскелета клетки.  Цитоскелет состоит из трех типов филаментов: микрофиламентов, промежуточных филаментов и микротрубочек, каждый из которых состоит из различных структурных белков. Микрофиламент образуется, когда актин самополимеризуется в длинные повторяющиеся структуры. Эти актиновые филаменты вносят вклад в форму и организацию клеток. Кроме того, микрофиламенты также могут способствовать перемещению и делению клеток, когда они действуют вместе с миозином. Состав промежуточных филаментов варьируется в зависимости от типа клеток. Существует около 70 различных генов, которые кодируют разные промежуточные филаменты. Промежуточные филаменты в эпителиальных клетках содержат кератин, в периферических нейронах содержат периферин, а в саркомере в мышечных клетках содержит десмин. Основная структурная функция этих филаментов — укреплять клетки и организовывать их в ткани. Микротрубочки состоят из структурных белков, называемых тубулинами. Тубулины самоорганизуются, образуя микротрубочки, которые способствуют организации цитоплазмы, включая и расположение органелл.  Микротрубочки также необходимы для митоза и деления клеток.

Поскольку структурные белки широко распространены, мутация в гене, кодирующем любой из этих белков, может иметь серьезные пагубные последствия. Например, мутация в гене, кодирующем коллаген, может привести к состоянию, известному как несовершенный остеогенез, которое характеризуется слабостью костей и деформациями соединительных тканей. Различные мутации в гене коллагена могут привести к синдрому Альпорта, который характеризуется проблемами в таких органах, как почки, глаза и уши.


Литература для дополнительного чтения

  1. Lodish, H., Berk, A., Zipursky, S. L., Matsudaira, P., Baltimore, D., & Darnell, J. (2000). Molecular cell biology 4th edition. National Center for Biotechnology Information, Bookshelf.
  2. Ricard-Blum, S. (2011). The collagen family. Cold Spring Harbor perspectives in biology, 3(1), a004978.
  3. Dominguez, R., & Holmes, K. C. (2011). Actin structure and function. Annual review of biophysics, 40, 169-186.
  4. Downing, K. H., & Nogales, E. (1998). Tubulin and microtubule structure. Current opinion in cell biology, 10(1), 16-22.
  5. Geisler, F., & Leube, R. E. (2016). Epithelial Intermediate Filaments: Guardians against Microbial Infection?. Cells, 5(3), 29. doi:10.3390/cells5030029

Публикации в СМИ

Очищенный белок BRCA2 поможет ученым разгадать, как мутации в кодирующем его гене приводят к возникновению рака.

После полутора десятилетий усилий биохимики наконец получили чистый раствор белка-супрессора опухолей BRCA2. Задача, выполненная одновременно в трех лабораториях, расширяет представления о том, как белок влияет на опухоль. Кроме того, полученный учеными белок приближает раскрытие того, как мутации в гене, кодирующем белок BRCA2, приводят к возникновению рака. Это позволит найти химические соединения, которые смогут заблокировать разрушительный процесс. Результаты исследований были опубликованы в журналах Nature [1] и Nature Structural & Molecular Biology [2,3].

BRCA2 – белок, связанный с развитием рака груди 2 типа – имеет весьма сомнительную славу: некоторые мутации в кодирующем его гене значительно повышают риск развития рака груди, яичников и многих других типов злокачественных опухолей. При этом в норме BRCA2 является белком-супрессором опухолевого роста, т.е. предотвращает возникновение злокачественных клеток.

Ген, кодирующий белок BRCA2, был обнаружен в 1994 г. Совместно с другими белками-супрессорами опухолевого роста, включая связанный с ним белок BRCA1, белок BRCA2 восстанавливает ДНК после повреждений, возникающих при делении клеток. Без белка BRCA2 фрагменты ДНК могут разрушаться, приводя к ошибкам при чтении генов и синтезе белка. Ученые получили чистые фракции белков, взаимодействующих с BRCA2, но до настоящего момента им не удавалось получить сам белок BRCA2, несмотря на то, что его функции были известны благодаря изучению аналогичного белка у червей, бактерий, а также при исследовании фрагментов белка BRCA2 человека.

«Самым серьезным препятствием работе был размер белка: BRCA2 состоит из 3 418 аминокислот, т.е. это белок огромных размеров. Я не знаю ни одного белка такого размера, который был бы очищен до такой же степени гомогенности», — рассказывает один из авторов статьи, биохимик из Калифорнийского Университета в Дэвисе (University of California, Davis) Вольф-Дитрих Хейер (Wolf-Dietrich Heyer) [2].

«Белок BRCA2 очень нестабилен, и для стабилизации он обычно образует комплексы с другими белками. До этого момента ученым удавалось получить лишь его фрагменты, загрязненные фрагментами других белков. BRCA2 было необходимо очень быстро очистить, и это было другим препятствием его выделению», — рассказывает автор другой статьи Стефан Ковальциковски (Stephen Kowalczykowski) [1].

Группе ученых под руководством Ковальциковски удалось «пришить» генетическую последовательность мальтоза-связывающего белка (maltose-binding protein) к гену белка BRCA2, что способствовало повышению растворимости синтезируемого белка и сделало его более стабильным. Выполненные манипуляции позволили ученым получить чистый белок BRCA2 из культуры эпителиальных клеток почек человека. Райен Энсен (Ryan Jensen), работающий над докторской диссертацией в лаборатории Ковальциковски и являющийся одним из авторов статьи, потратил четыре года на оптимизацию процесса очищения белка.

Группа ученых под руководством профессора Хейера применила немного другой способ выделения белка, получая его в культуре генетически модифицированных дрожжей [2]. В третьем исследовании [3], выполненном под руководством генетика Стефана Веста (Stephen West), ученые с помощью бактериальной плазмиды внедрили ген BRCA2 в культуру эпителиальных раковых клеток человека.

«Наконец-то получив белок, ученые могут провести различные эксперименты, которые до этого момента были невозможны. Результаты исследования имеют огромное значение не только для понимания механизма функционирования белка BRCA2, но также для работы с другими белками, которые с ним взаимодействуют», — говорит биохимик из Йельского Университета в Нью Хэвен (Yale University, New Haven) Патрик Сунг (Patrick Sung).

В трех исследованиях изучалось взаимодействие полноценного белка BRCA2 с другими белками, главным образом, с белком RAD51, который восстанавливает ДНК в местах ее разрывов. Изучив взаимодействия между BRCA2 и RAD51, три группы ученых независимо друг от друга пришли к заключению, что белок BRCA2 помогает белку RAD51 инициировать «монтаж» разрушенной области ДНК.

Большая часть исследований была посвящена изучению функций белка BRCA2. «Мы также раскрыли некоторые функции белка, которые могли стать известными только после проведения его биохимического анализа», — рассказывает Ковальциковски.

Например, ранее предполагалось, что белок BRCA2 участвует в устранении лишь одной из форм повреждения ДНК, однако изучение его взаимодействий с белками и ДНК позволило группе ученых во главе с Ковальциковски сделать вывод о том, что функции белка BRCA2 гораздо шире, чем считалось. «Свойства белка BRCA2 указывают на то, что он является основным медиатором восстановления ДНК после различных поломок», — говорит Ковальциковски. «Я не думаю, что при оценке результатов исследования мы сделали какие-либо неожиданные выводы. Прорыв был сделан потому, что ученые много работали в этом направлении», — добавляет Сунг.

Возможность очистить белок BRCA2 позволит биологам разрешить вопросы, связанные с его структурой, и получить дополнительную информацию о его функциях. «Результаты исследований позволят составить представление о «системе контроля за мутациями гена, кодирующего белок BRCA2, приводящими к развитию опухолей», ведь ученые могут ввести мутации в ген [i]BRCA2, а затем очистить полученный белок и понять воздействие мутаций на его функции»[/i], — говорит Сунг.

«То, что мы получили этот важнейший белок и знаем, как он себя ведет, означает, что мы можем использовать методы биохимического скрининга для получения новых лекарственных препаратов, которые остановят разрушение клеток мутантными формами белка», — заключает Ковальциковски.

Литература:

1. Jensen, R. B., Carreira, A. & Kowalczykowski, S. C. Nature advance online publication doi:10.1038/nature09399 (2010).
2. Liu, J., Doty, T., Gibson, B. & Heyer, W.-D. Nature Struct. Molec. Biol. advance online publication doi:10.1038/nsmb.1904 (2010).
3. Thorslund, T. et al. Nature Struct. Molec. Biol. advance online publication doi:10.1038/nsmb.1905 (2010).

По материалам: NatureNews

Функцией белков можно управлять с помощью света

Российские биохимики научились управлять функцией белков с помощью света. Такое «программирование» действия ферментов открывает возможности для регулирования самого широкого круга клеточных процессов в живом организме.

Контроль активности белков в организме – одна из важных задач биоорганической химии. Так, например, управление транскрипционными факторами – белками, отвечающими за перенос информации с молекулы ДНК на м-РНК, — позволит влиять на контролируемую ими морфологию клеток. Через белки можно управлять ответом организма на внеклеточные сигналы и изменение окружающей среды, а также процессами деления клеток и клеточными процессами старения. Однако исследования осложнены тем, что к ин-виво-контролю функции белков предъявляются очевидные дополнительные требования: воздействующие агенты должны быть безопасны для живого организма в целом. По этой причине относительно простые химические реакции, хорошо осуществляемые с белками in vitro, не подходят для перспективного медицинского применения: «малые» молекулы, используемые в них, например формальдегид, являются ядовитыми.

Из-за этого активация-деактивация ферментов с помощью света является предпочтительной, «бережной» методикой управления функцией белков. Исследование механизма модуляции активности рестрикционных ферментов с помощью ультрафиолетового или синего света публикует Proceedings of the National Academy of Sciences.

Рестриктазы — ферменты класса гидролаз, которые катализируют разрушение фосфодиэфирных связей (эти связи играют ключевую роль во всех биологических системах, образуя остов нуклеиновых кислот ДНК и РНК) чужеродных ДНК в большинстве прокариотических организмов — одноклеточных, не обладающих оформленным клеточным ядром, как, например, бактерии. Таким образом, рестриктазы выполняют своего рода «иммунную» функцию. Распознавание чужеродной ДНК осуществляется в специфических нуклеотидных последовательностях (сайтах), которые в собственной ДНК клетки «отмечены» определенными ферментами.

О результатах работы рассказала корреспонденту «Газеты. Ru» один из ее руководителей, заведующий отделом химии нуклеиновых кислот Института физико-химической биологии им. А. Н. Белозерского (НИИ ФХБ МГУ), доктор химический наук, профессор Татьяна Орецкая: «Один из возможных способов регулирования активности белков основан на введении в структуру последних «фотопереключателя», который позволяет изменить активность белка под действием света с определенной длиной волны. Это позволяет изменять активность белка в клетке без добавления химических реагентов, которые, кроме того, могут негативно влиять на клеточные процессы. Пока рано говорить о внедрении в практику предложенных нами подходов регулирования активности ферментов рестрикции при использовании в качестве «фотопереключателей» производных азобензола.

Однако в перспективе создание реагентов, которые способны модулировать активность клеточных белков, может привести к разработке биомедицинских препаратов нового поколения».

С помощью перекрестного сшивания остатков цистеина (аминокислоты, играющей важную роль в дезинтоксикационных процессах) в ферменте бифункциональным производным азобензола, которое может иметь как цис-, так и транс-конфигурацию в зависимости от длины волны света, которым его облучают (УФ или синего), активность фермента можно обратимо контролировать. При облучении синим светом азобензол находится в транс-конфигурации (фенильные заместители располагаются по разные стороны от двойной связи азот—азот), а в УФ-свете – в цис-конфигурации (заместители находятся по одну сторону от связи). Это позволяет изменить мотив упаковки конформационно подвижных цепей. Расстояние между SH-фрагментами цистеина значимо меняется (см. рисунок), что и позволяет модулировать функцию фермента.

Таким образом, функция сшитых остатков цистеина варьируется при смене освещения с УФ на синее, проявляя так называемый «эффект фотопереключателя».

Чтобы выяснить, какие именно остатки наиболее значимо реагируют на изменение света, было синтезировано более 30 вариантов одноцепной рестрикционной эндонуклеазы PvuII. Затем их модифицировали азобензолом и протестировали их способность расщеплять ДНК.

Обычно одиночные перекрестные сшивки в ферменте вызывают лишь небольшие изменения его действия, а значимые эффекты наблюдаются лишь при большом количестве перекрестных сшивок. Некоторые модифицированные ферменты несут сшитый фрагмент в непосредственной близости от активного центра. Именно их лучше всего получается «переключать» с помощью света – интенсивность расщепления ДНК менялась в 16 раз, при этом оставаясь обратимой. При этом изменение активности фермента происходит за считанные секунды.

«Наша работа проводилась в рамках международного проекта International Research Training Group «Enzymes and Multienzyme Complexes acting on Nucleic Acids» («Ферменты и мультиферментные комплексы, взаимодействующие с нуклеиновыми кислотами»). Наш коллектив первый, работающий в рамках этой программы в России и в Германии. С немецкой стороны в нем участвуют два университета – Университет Юстуса Либиха (г. Гиссен) и Университет Филиппа (г. Марбург). С российской стороны наш коллектив состоит из семи команд: пять из МГУ имени М. В. Ломоносова (химический факультет и НИИ ФХБ имени А. Н. Белозерского) и две из Института биологии гена РАН. В программе участвуют 20 аспирантов и молодых кандидатов наук из России. В таком большом коллективе мы работаем третий год, и результатом одного из научных контактов стала эта публикация. Что касается самой программы, с немецкой стороны она финансируется DFG (Deutsche Forschungsgemeinschaft, Немецкое исследовательское общество), а с российской – РФФИ (Российским фондом фундаментальных исследований)», — объяснила профессор Орецкая.

Белок р53 что это такое, в чем содержится больше всего


Белок Р53 — что это?


Одно из наиболее универсальных изменений в клетках опухолей, как доброкачественных, так и злокачественных, – это дисфункция белка р53.


Аномалия белка широко вовлечена в процесс развития новообразований и связана с предотвращением роста опухоли либо ее ингибированием. При этом измененная функция белка может стать и причиной активной опухолевой прогрессии. Все это делает невозможным применение белка как прогностического маркера и мишени воздействия терапевтического лечения.


Локализуется р53 в ядре, являясь продуктом гена ТР53, находящегося на 17 хромосоме. Белок признан антионкогеном, так как является препятствием для возникновения опухолей злокачественного характера. Как основной компонент системы охраны организма на внутриклеточном масштабе белок работает на недопущении размножения клеток, у которых структура ДНК повреждена.


Генетические мутации ТР53 считаются самыми распространенными для атипичных клеток. Статистика говорит о почти 80% крупных опухолей с поврежденными ДНК в гене ТР53.

Программируемая клеточная гибель и злокачественные новообразования


Образование раковой опухоли всегда идет бок о бок со сбоем механизма программируемой клеточной гибели, или иначе опоптоза, контролируемого белком. Функционируя в рамках нормы, он не дает атипичным клеткам бесконтрольно делиться. Если же молекула ДНК в клетке повреждена, р53 останавливает процесс ее деления до устранения повреждения, либо запускает программу, способствующую ее уничтожению.


Механизм, направленный на уничтожение клетки, срабатывает лишь в случае, если ген ТР53 не поврежден. Если же происходит процесс его изменения, клетка превращается в накопитель мутантного белка, привычные функции уже не выполняются.


Так нарушается механизм, отвечающий за включение программы по уничтожению атипичных клеток, а значит, опухоль развивается.

Диагностические методы


Для выявления мутаций в гене ТР53 используют несколько диагностических процедур:

  • Метод секвенирования. Обследование помогает расшифровать последовательность гена, это необходимо для нахождения всех изменений, произошедших в нем. Изменения эти обнаруживаются в нормальных клетках, в этом случае мутации увеличивают риск того, что нормальные клетки переродятся в патогенные. Обнаружение изменений в атипичных клетках обозначает дальнейшее развитие опухли. Секвенирование применимо, если возникает подозрение на синдромы, связанные с наследственностью.
  • Анализ иммуногистохимический. Это основной диагностический метод. С помощью него оценивают преобразования в ткани р53, а также нарушения функции гена и его активность. С помощью анализа различают аномалии формирования и развития новообразования злокачественного характера.
  • Метод полимеразной цепной реакции. Используется в настоящее время достаточно редко, так как считается устаревшим. Но для подтверждения наличия либо отсутствия мутации вполне применим.
  • Метод иммуногистохимический. С его помощью по концентрации р53 косвенно оценивают характеристики гена ТР53. Дело в том, что нормальная концентрация белка может существенно отличаться для разных тканей. Поэтому вначале выполняют биопсию, а затем исследуют биоптат в лаборатории, добавляя к изъятому в ходе биопсии материалу меченные красителем антитела.


Мутация в гене далеко не всегда приводит к возникновению опухоли, а лишь повышает вероятность этого события. Выявленное нарушение функций ТР53 необходимо интерпретировать, учитывая клиническую картину.


Клиника интегративной онкологии Onco.Rehab, один из признанных лидеров своего направления, комплексно применяет в лечении заболеваний самые современные методы и технологии.

ВИЧ

Ви́рус иммунодефици́та челове́ка — ретровирус из рода лентивирусов, вызывающий медленно прогрессирующее[3] заболевание — ВИЧ-инфекцию[4][5].

Вирус поражает клетки иммунной системы, имеющие на своей поверхности рецепторы CD4: Т-хелперы, моноциты, макрофаги, клетки Лангерганса[6], дендритные клетки, клетки микроглии[7]. В результате работа иммунной системы угнетается и развивается синдром приобретённого иммунного дефицита (СПИД), организм больного теряет возможность защищаться от инфекций и опухолей, возникают вторичные оппортунистические заболевания, которые не характерны для людей с нормальным иммунным статусом[8][9][10][11][12][13]. Без врачебного вмешательства оппортунистические заболевания вызывают смерть пациента в среднем через 9—11 лет после заражения (в зависимости от подтипа вируса)[10]. При проведении антиретровирусной терапии продолжительность жизни пациента может быть продлена до 70—80 лет[14][15][16].

Вакцина против ВИЧ неизвестна[17].

Открытие ВИЧ

Изображение, сделанное растровым электронным микроскопом. В центре кадра находится заражённый T-лимфоцит. Многочисленные светлые круглые выпуклости на его поверхности — места сборки и отпочковывания вирионов вируса иммунодефицита человека[18]

Изображение вирионов, полученное при помощи просвечивающего электронного микроскопа. Видно строение вирионов, внутри которых находится конусообразное ядро[19]

В 1981 году появились первые три научные статьи о необычных случаях развития пневмоцистной пневмонии и саркомы Капоши у гомосексуальных мужчин[20][21]. До этого оба заболевания встречались редко и были характерны для совершенно разных групп пациентов: саркомой Капоши в основном болели пожилые мужчины средиземноморского происхождения, а пневмоцистной пневмонией — пациенты с лейкозом после интенсивной химиотерапии. Появление этих заболеваний, свидетельствующих о тяжёлом иммунодефицитном состоянии, у молодых людей, не входящих в соответствующие группы риска, наблюдалось впервые[21]. Затем обнаружили такие же симптомы среди наркопотребителей, больных гемофилией A[22] и гаитян[23][24]. Наиболее значимым было обнаружение снижения соотношения CD4+/CD8+-клеток в результате относительного и/или абсолютного уменьшения количества CD4+-лимфоцитов в сочетании с увеличением количества CD8+-лимфоцитов[21][25][26].

В июле 1982 года для обозначения этого состояния был предложен термин синдром приобретённого иммунного дефицита (СПИД, AIDS)[27]. В сентябре 1982 года СПИДу было дано полноценное определение как нозологической форме на основании наблюдения ряда оппортунистических инфекций у четырёх групп пациентов, указанных выше[21][28].

В период с 1981 по 1984 год вышло несколько работ, связывающих вероятность развития СПИДа с анальным сексом или с влиянием наркотиков[29][30][31][32][33][34]. Параллельно велись работы над гипотезой о возможной инфекционной природе СПИДа.

Вирус иммунодефицита человека независимо открыли в 1983 году в двух лабораториях: Институте Пастера во Франции под руководством Люка Монтанье и Национальном институте рака в США под руководством Роберта Галло. Результаты исследований, в которых из тканей пациентов с симптомами СПИДа впервые удалось выделить новый ретровирус, были опубликованы 20 мая 1983 года в журнале Science[35][36]. В этих же работах выделенный из больных СПИДом вирус был впервые успешно размножен в культивируемых Т-лимфоцитах. Французская группа исследователей показала, что серологически этот вирус отличается от HTLV-I, и назвала его LAV («вирус, ассоциированный с лимфаденопатией»), а американская группа назвала его HTLV-III, ошибочно отнеся к группе HTLV-вирусов. Исследователи выдвинули предположение, что вирус может вызывать синдром приобретённого иммунного дефицита[21].

В 1986 году было обнаружено, что вирусы, открытые в 1983 французскими и американскими исследователями, генетически идентичны. Первоначальные названия вирусов были упразднены и предложено одно общее название — вирус иммунодефицита человека[37]. В 2008 году Люк Монтанье и Франсуаза Барр-Синусси были удостоены Нобелевской премии в области физиологии или медицины «за открытие вируса иммунодефицита человека»[38].

ВИЧ-инфекция

Инфицирование

Основная статья: Инфицирование вирусом иммунодефицита человека

Вирус может передаваться через прямой контакт повреждённой слизистой оболочки или повреждённой кожи здорового человека с биологическими жидкостями заражённого человека: кровью, предсеменной жидкостью (выделяющейся на протяжении всего полового акта), спермой, секретом влагалища и грудным молоком. Передача вируса может происходить при незащищённом анальном, вагинальном или оральном сексе[39][40].

Интактная, неповреждённая кожа — является эффективным барьером для инфекции, так как в коже отсутствуют клетки, которые могут быть заражены ВИЧ. Для успешной инфекции требуется прямой контакт с кровеносной системой или с мембранами клеток слизистых оболочек. Слизистые оболочки половых органов и прямой кишки часто получают незначительные повреждения при половом акте, через которые вирус может проникать в кровь. Такие повреждения чаще возникают при наличии заболеваний, передающихся половых путём, например, в случае герпеса. С другой стороны, заражение возможно и в случае неповреждённой слизистой оболочки, так как последние содержат значительное количество дендритных клеток (в том числе, клеток Лангерганса), которые могут играть роль «переносчиков» вирусных частиц в лимфатические узлы. Поэтому особенно опасной формой полового акта для принимающего партнёра является незащищённый анальный секс, так как при этой форме возникает наибольшее число мелких и крупных повреждений[41][42].

Передача вируса происходит с большей вероятностью при использовании заражённых игл и шприцев (особенно потребителями инъекционных наркотиков), а также при переливании крови (в случае нарушения медицинским персоналом установленных процедур проверки донорской крови)[43]. Также передача вируса может произойти между матерью и ребёнком во время беременности, родов (заражение через кровь матери)[44][45] и при грудном вскармливании (причём как от заражённой матери к здоровому ребёнку через грудное молоко, так и от заражённого ребёнка к здоровой матери через покусывание груди во время кормления)[46].

Вирус не передаётся воздушно-капельным путём, бытовым путём, при соприкосновении с неповреждённой кожей, через укусы насекомых[47], слёзы[48] и слюну (из-за того, что концентрация вирионов ВИЧ в этих жидкостях ниже инфицирующей дозы, а также из-за того, что слюна — агрессивная среда, разрушающая своими ферментами вирионы ВИЧ)[48].

Болезнь

Основная статья: ВИЧ-инфекция

Динамика количества CD4+-лимфоцитов и копий РНК вируса за период от момента инфицирования до терминальной стадии[49]                     количество CD4+лимфоцитов в 1 мкл крови
                     количество копий РНК вируса в 1 мл плазмы крови

В течении болезни выделяют три стадии: острую инфекцию, латентный период и терминальную стадию (СПИД) (см. иллюстрацию). В ходе развития ВИЧ-инфекции у одного и того же человека в результате мутаций возникают новые штаммы вируса, которые различаются по скорости воспроизведения и способности инфицировать[8][9]. Размножившись, вирусные частицы высвобождаются из поражённых клеток и внедряются в новые — цикл развития повторяется. Инфицированные вирусом Т-хелперы постепенно гибнут из-за разрушения вирусом, апоптоза или уничтожения Т-киллерами. В процессе развития ВИЧ-инфекции количество Т-хелперов (CD4+-клеток) снижается настолько, что организм уже не может противостоять возбудителям оппортунистических инфекций, которые неопасны или мало опасны для здоровых людей с нормально функционирующей иммунной системой. На терминальной стадии (СПИД), ослабленный организм поражают бактериальные, грибковые, вирусные и протозойные инфекции, а также опухоли[11][12][13]. В отсутствие антиретровирусной терапии смерть пациента наступает не в результате размножения вируса в CD4+-клетках, а по причине развития оппортунистических заболеваний (вторичных по отношению к ВИЧ-инфекции).

Эпидемиология

Основная статья: Эпидемиология ВИЧ-инфекции

По данным на 2011 год, в мире за всё время ВИЧ-инфекцией заболели 60 миллионов человек, из них: 25 миллионов умерли, а 35 миллионов живут с ВИЧ-инфекцией[50]. Более двух третей из них проживают в Африке к югу от пустыни Сахара[51]. Эпидемия началась здесь в конце 1970-х — начале 1980-х. Затем эпидемия перекинулась в США, Западную Европу и страны Южной Африки. Сегодня, за исключением стран Африки, быстрее всего вирус распространяется в Центральной Азии и Восточной Европе (в том числе в России). Эпидемическая ситуация в этих регионах сдерживалась до конца 1990-х, затем с 1999 по 2002 годы количество инфицированных почти утроилось — в основном за счёт инъекционных наркоманов. Значительно ниже среднего ВИЧ-инфекция распространена в Восточной Азии, Северной Африке и на Ближнем Востоке. В масштабе планеты эпидемическая ситуация стабилизировалась, количество новых случаев ВИЧ-инфекции снизилось с 3,5 миллионов в 1997 году до 2,7 миллионов в 2007 году[51]. По данным на конец 2015 года, в России 804 тысячи человек живут с ВИЧ-инфекцией, за период с 1986 по 2016 год умерло от разных причин 220 тысяч ВИЧ-инфицированных граждан России[52] (подробнее см. Статистика заболеваемости и смертности по России).

Диагностика

Основная статья: Тест на ВИЧ

Анализ крови позволяет обнаружить антитела к белкам вируса (ИФА), реакцию антител на белки вируса (вестерн-блот), РНК вируса (ОТ-ПЦР)[53]. Определение вирусной нагрузки (подсчёт количества копий РНК вируса в миллилитре плазмы крови) позволяет судить о стадии заболевания и эффективности лечения[54][55].

Обязательная проверка донорской крови в развитых странах в значительной степени сократила возможность передачи вируса при её использовании. Тестирование на ВИЧ беременных женщин позволяет своевременно начать приём лекарств и родить здорового ребёнка.

Существует мнение, что принудительное тестирование населения бесперспективно с точки зрения сдерживания эпидемии[56] и нарушает права человека[57]. В России проведение теста без согласия человека является незаконным[58], однако существуют ситуации, в которых предоставление результатов тестирования на ВИЧ является обязательным, но не насильственным (донорство, трудоустройство медицинских работников, для иностранных граждан, получающих разрешение на пребывание в РФ, в местах лишения свободы при наличии клинических показаний)[59].

Лечение

Основная статья: Высокоактивная антиретровирусная терапия

Из 35 миллионов человек, живущих с ВИЧ-инфекцией, часть остаётся в живых благодаря антиретровирусной терапии. В случае отсутствия антиретровирусной терапии ВИЧ-инфекции, смерть наступает в среднем через 9—11 лет после заражения[8][60]. При проведении антиретровирусной терапии продолжительность жизни пациента составляет 70—80 лет[14][15][16]. Антиретровирусные препараты мешают ВИЧ размножаться в клетках иммунной системы человека, блокируя внедрение вирионов в клетки и нарушая на разных этапах процесс сборки новых вирионов. Своевременно начатое лечение антиретровирусными препаратами в сотни раз снижает риск развития СПИДа и последующей смерти[61][62][63]. Антиретровирусные препараты у части пациентов вызывают побочные эффекты, в некоторых случаях даже требующие сменить схему лечения (набор принимаемых лекарств).

Терапию назначают при снижении иммунитета и/или высокой вирусной нагрузке. В случае, если число CD4+-лимфоцитов велико и вирусная нагрузка низкая, терапию не назначают. После назначения терапии лекарства нужно принимать ежедневно в одно и то же время и пожизненно, что создаёт неудобства для пациентов. Также следует учитывать высокую стоимость месячного курса лекарств. В 2014 году необходимые лекарства получали менее половины из 9,5 млн человек, нуждающихся в противовирусной терапии[64].

Также все беременные женщины с острой фазой ВИЧ-инфекции, должны начинать незамедлительную ВААРТ для предотвращения передачи ВИЧ плоду[65].

Согласно рекомендациям ВОЗ, ВААРТ следует незамедлительно начинать всем ВИЧ-инфицированным детям до полутора лет[66]. Начало терапии у детей, получивших ВИЧ от матери, в течение 3 месяцев после родов, снижает смертность на 75 %[67]. В отсутствие лечения, треть ВИЧ-инфицированных детей умирает в течение первого года жизни и 50 % в течение второго года. В случае, когда диагностика ВИЧ невозможна, лечение следует начинать в возрасте 9 месяцев, либо ранее, в случае появления симптомов[68].

По состоянию на февраль 2016 года было объявлено, что группе немецких учёных удалось полностью удалить тип ВИЧ-1 из живых клеток. Испытания проводились на клетках человека, вживлённых подопытным мышам. Испытания на людях должны проводиться в ближайшее время[69][70][71].

Классификация

Основная статья: Лентивирусы

Вирус иммунодефицита человека относят к семейству ретровирусов (Retroviridae), роду лентивирусов (Lentivirus). Название Lentivirus происходит от латинского слова lente — медленный. Такое название отражает одну из особенностей вирусов этой группы, а именно — медленную и неодинаковую скорость развития инфекционного процесса в макроорганизме. Для лентивирусов также характерен длительный инкубационный период[72].

Для вируса иммунодефицита человека характерна высокая частота генетических изменений, возникающих в процессе самовоспроизведения. Частота возникновения ошибок у ВИЧ составляет 10−3 — 10−4 ошибок на геном на цикл репликации, что на несколько порядков больше аналогичной величины у эукариот. Размер генома ВИЧ составляет примерно 104 нуклеотидов. Из этого следует, что практически каждый дочерний геном хотя бы на один нуклеотид отличается от своего предшественника. В современной классификации различают два основных вида ВИЧ — ВИЧ-1 и ВИЧ-2. Эти вирусы предположительно возникли в результате независимой передачи людям SIV (вируса иммунодефицита обезьян) шимпанзе и мангабеев соответственно[73].

И ВИЧ-1, и ВИЧ-2 способны вызывать серьёзный иммунодефицит, однако клиническое течение болезни несколько различается. Известно, что ВИЧ-2 менее патогенен и передаётся с меньшей вероятностью, чем ВИЧ-1. Вероятно, это связано с тем, что ВИЧ-2-инфекция характеризуется более низким числом вирусных частиц на миллилитр крови. Отмечено, что инфекция ВИЧ-2 обеспечивает носителю небольшую защиту от заражения ВИЧ-1. Однако описаны случаи двойной инфекции, причём заражение может происходить в любом порядке. Инфекция ВИЧ-2 реже заканчивается развитием СПИДа. Есть сведения о несколько большей частоте развития саркомы Капоши, кандидоза ротовой полости и хронической лихорадки при ВИЧ-1/СПИДе. При ВИЧ-2/СПИДе чаще развивается энцефалит, хроническая или бактериальная диарея, серьёзные цитомегаловирусные инфекции и холангит[73]. К роду Lentivirus также относят виды, вызывающие схожие заболевания у обезьян, кошек, лошадей, овец и т. д.[8][74][75].

ВИЧ-1

ВИЧ-1 описан в 1983 году и является наиболее распространённым и патогенным видом ВИЧ[76]. Глобальная эпидемия ВИЧ-инфекции главным образом обусловлена распространением ВИЧ-1. В подавляющем большинстве случаев, если не оговорено иначе, под ВИЧ подразумевают ВИЧ-1[77].

Вид ВИЧ-1 классифицируют на главную группу М и несколько побочных групп. Считается, что группы M, N, O, P образовались в результате независимых случаев передачи SIV от обезьяны к человеку, и последующей мутации вируса до ВИЧ[78].

  • Вирусы группы М (англ. Main — основная) являются причиной более 90 % случаев ВИЧ-инфекции. Группу М классифицируют на несколько клад, называемых подтипами, также обозначаемых буквами:
    • Подтип A широко распространён, например, в Западной Африке и России[79];
    • Подтип B доминирует в Европе, Северной Америке, Южной Америке, Японии, Таиланде, Австралии[80];
    • Подтип C преобладает в Южной и Восточной Африке, Индии, Непале, некоторых частях Китая[80];
    • Подтип D обнаружен только в Восточной и Центральной Африке[80];
    • Подтип E не был выявлен в нерекомбинантном виде, лишь совместно с подтипом А как CRF01_AE в Юго-Восточной Азии[80];
    • Подтип F выявлен в Центральной Африке, Южной Америке и Восточной Европе[81];
    • Подтип G и рекомбинантная форма CRF02_AG выявлены в Африке и Центральной Европе[81];
    • Подтип H обнаружен только в Центральной Африке[81];
    • Подтип I был предложен для описания штамма-продукта множественной рекомбинации CRF04_cpx нескольких подтипов[82];
    • Подтип J распространён в Северной, Центральной и Западной Африке и странах Карибского бассейна[83];
    • Подтип K обнаружен только в Конго и Камеруне[81].
  • Группа O (англ. Outlier — непохожий) обнаружена в Центральной Африке и Западной Африке. Наиболее распространена в Камеруне, где в 1997 году более 2 % пациентов были заражены вирусом группы О[84] (около 100 000 человек, по данным на 2013 год)[85]. Вирусы этой группы не определялись ранними версиями тест-систем на ВИЧ-1, современные тесты определяют вирусы и группы О, и группы N[86].
  • Группа N (англ. Non-M, non-O — ни M, ни O) обозначает штаммы не М и не О, описана в 1998 году и обнаружена только в Камеруне. С 2006 года выявлены лишь 10 заражений вирусами группы N[87].
  • Группа P — в 2009 году была определена нуклеотидная последовательность РНК ВИЧ, значительно сходная с вирусом иммунодефицита обезьян, описанным у горилл (SIVgor), но не с SIV, характерным для шимпанзе (SIVcpz). Вирус был выделен из образцов, полученных от женщины камерунского происхождения, проживающей во Франции[88][89][90].

ВИЧ-2

ВИЧ-2 идентифицирован в 1986 году[91], генетически очень близок к T-лимфотропному вирусу SIVsmm мангабеев, и в меньшей степени к вирусу ВИЧ-1. Геномы ВИЧ-1 и ВИЧ-2 имеют гомологию консервативных генов gag и pol около 60 %, и до 45 % генов белков оболочки[92]. По состоянию на 2010 год, описано 8 групп ВИЧ-2, лишь группы A и B являются эпидемическими. Вирусы группы А распространены в Западной Африке, Анголе, Мозамбик, Бразилии, Индии и мало распространены в США и Европе[93][94]. Вирусы группы В распространены в Западной Африке[95][96].

Строение вириона

Строение вируса иммунодефицита человека

Вирионы ВИЧ имеют вид сферических частиц, диаметр которых составляет около 100—120 нанометров[97]. Это приблизительно в 60 раз меньше диаметра эритроцита[98]. В состав зрелых вирионов входит несколько тысяч белковых молекул различных типов.

Капсид зрелого вириона, состоящий из примерно 2000 молекул белка р24, имеет форму усечённого конуса[99].

Внутри капсида находится белково-нуклеиновый комплекс: две нити вирусной РНК, прочно связанные с белком нуклеокапсида p7, ферменты (обратная транскриптаза, протеаза, интеграза)[99]. С капсидом также ассоциированы белки Nef и Vif (7—20 молекул Vif на вирион). Внутри вириона (и, вероятнее всего, за пределами капсида) обнаружен белок Vpr[39]:8-11. Кроме того, с капсидом ВИЧ-1 (но не ВИЧ-2) связаны около 200 копий клеточного фермента пептидилпролилизомеразы A[en] (циклофилин А), необходимого для сборки вириона[100].

Капсид окружён оболочкой, образованной примерно 2000 молекул матриксного белка p17[99]. Матриксная оболочка в свою очередь окружена двуслойной липидной мембраной, являющейся наружной оболочкой вируса. Она образована молекулами фосфолипидов, захваченными вирусом во время его отпочковывания от клетки, в которой он сформировался[101]. В липидную мембрану встроены 72 гликопротеиновых комплекса Env, каждый из которых образован тремя молекулами трансмембранного гликопротеина gp41 (TM), служащего «якорем» комплекса, и тремя молекулами поверхностного гликопротеина gp120 (SU)[100]. С помощью белка gp120 вирус присоединяется к рецептору CD4 и корецептору, находящимся на поверхности Т-лимфоцитов человека. Стехиометрическое соотношение p24:gp120 в вирионе составляет 60—100:1[39]:11. При формировании наружной оболочки вируса также происходит захват некоторого количества мембранных белков клетки, в том числе человеческих лейкоцитарных антигенов (HLA) классов I и II и молекул адгезии[99][102].

Белки вириона интенсивно изучаются, поскольку являются мишенями разрабатываемых лекарств и вакцины против ВИЧ.

Функции важных структурных белков ВИЧ-1[99][102]

Сокращение Описание Функции
gp41 (TM, transmembrane) Трансмембранный гликопротеин массой 41 кДа Располагается во внешнем слое липидной мембраны, играет роль «якоря», удерживающего молекулы белка gp120
gp120 (SU, surface) Гликопротеин массой 120 кДа Наружный белок вириона. Нековалентно связан с трансмембранным белком gp41. С одной молекулой gp41 связаны 3—5 молекул gp120. Способен связывать рецептор CD4. Играет важную роль в процессе проникновения вируса в клетку.
p24 (CA, capsid) Белок массой 24 кДа Образует капсид вируса
p17 (MA, matrix) Матриксный белок массой 17 кДа Около двух тысяч молекул этого белка образуют слой толщиной 5—7 нм, располагающийся между внешней оболочкой и капсидом вируса.
p7 (NC, nucleocapsid) Нуклеокапсидный белок массой 7 кДа Входит в состав капсида вируса. Образует комплекс с вирусной РНК.

Геном и кодируемые белки

Геном ВИЧ-1[99]

Генетический материал ВИЧ представлен двумя копиями положительно-смысловой (+)РНК[100]. Геном ВИЧ-1 имеет длину 9000 нуклеотидов. Концы генома представлены длинными концевыми повторами (англ. long terminal repeat, LTR), которые управляют продукцией новых вирусов и могут активироваться и белками вируса, и белками инфицированной клетки.

9 генов ВИЧ-1 кодируют, по крайней мере, 15 белков[103]. Ген pol кодирует ферменты: обратную транскриптазу (RT), интегразу (IN) и протеазу (PR). Ген gag кодирует полипротеин Gag/p55, расщепляемый вирусной протеазой до структурных белков p6, p7, p17, p24. Ген env кодирует белок gp160, расщепляемый клеточной эндопротеазой фурином на структурные белки gp41 и gp120[39]:8-12. Другие шесть генов — tat, rev, nef, vif, vpr, vpu (vpx у ВИЧ-2) — кодируют белки, отвечающие за способность ВИЧ-1 инфицировать клетки и производить новые копии вируса. Репликация ВИЧ-1 in vitro возможна без генов nef, vif, vpr, vpu, однако их продукты необходимы для полноценной инфекции in vivo[104][105][106].

Gag

Полипротеин-предшественник Gag/p55 синтезируется с полноразмерной геномной РНК (которая в данном случае служит в качестве мРНК) в процессе стандартной кэп-зависимой трансляции, но возможна и IRES-зависимая трансляция. Предшественники функциональных белков располагаются в составе полипротеина Gag/p55 в следующем порядке: p17…p24…p2…p7…p1…p6[39]:8 (р1 и р2 — соединительные пептиды; другие продукты расщепления Gag/p55 описаны выше). Нерасщеплённый протеазой Gag/p55 содержит три основных домена: домен мембранной локализации (М, membrane targeting), домен взаимодействия (I, interaction) и «поздний» домен (L, late). Домен М, расположенный внутри области p17/МА, миристилируется (присоединяются остатки миристиновой кислоты) и направляет Gag/p55 к плазматической мембране. Домен I, находящийся внутри области p7NC (NC, nucleocapsid), отвечает за межмолекулярные взаимодействия отдельных мономеров Gag/p55. Домен L, также локализованный в области p7NC, опосредует отпочковывание вирионов от плазматической мембраны; в этом процессе участвует также р6 область полипротеина Gag/p55[39]:8[107].

Vpu

Двумя важными функциями белка Vpu являются: 1) разрушение клеточного рецептора CD4 в эндоплазматическом ретикулуме путём привлечения убиквитинлигазных комплексов и 2) стимуляция выделения дочерних вирионов из клетки, путём инактивации интерферон-индуцируемого трансмембранного белка CD317/BST-2, получившего также название «tetherin» за его способность подавлять выделение вновь образовавшихся дочерних вирионов посредством их удержания на поверхности клетки[104][105][108][109][110][111].

Vpr

Белок Vpr необходим для репликации вируса в неделящихся клетках, в том числе макрофагах. Этот белок, наряду с другими клеточными и вирусными белками, активирует транскрипцию с использованием длинных концевых повторов генома ВИЧ в качестве промоторов. Белок Vpr играет важную роль в переносе вирусной ДНК в ядро и вызывает задержку деления клетки в периоде G2[112].

Vif

Белок Vif играет важную роль в поддержке репликации вируса. Vif индуцирует убиквитинилирование и деградацию клеточного антивирусного белка APOBEC3G, который вызывает деаминирование ДНК, приводящее к мутационным заменам G на A в вирусной ДНК, синтезируемой в ходе обратной транскрипции. Штаммы, лишённые Vif, не реплицируются в CD4+-лимфоцитах, некоторых линиях T-лимфоцитов и макрофагах. Эти штаммы способны проникать в клетки-мишени и начинать обратную транскрипцию, однако синтез вирусной ДНК остаётся незавершённым[112].

Nef

Белок Nef выполняет несколько функций. Он подавляет экспрессию молекул CD4 и HLA классов I и II на поверхности инфицированных клеток, и тем самым позволяет вирусу ускользать от атаки цитотоксических T-лимфоцитов и от распознавания CD4+-лимфоцитами. Белок Nef может также угнетать активацию T-лимфоцитов, связывая различные белки-компоненты систем внутриклеточной передачи сигнала[112].

У инфицированных вирусом иммунодефицита макак-резусов активная репликация вируса и прогрессирование болезни возможны только при интактном гене nef. Делеции гена nef были обнаружены в штаммах ВИЧ, выделенных у группы австралийцев с длительным непрогрессирующим течением инфекции[113]. Однако у части из них со временем появились признаки прогрессирования инфекции, в том числе снижение числа CD4+-лимфоцитов. Таким образом, хотя делеции гена nef и могут замедлять репликацию вируса, это не гарантирует полной невозможности прогрессирования заболевания[114].

Tat и Rev

Регуляторные белки Tat (транс-активатор) и Rev накапливаются в ядре клетки и связывают определённые участки вирусной РНК. Белок Tat имеет молекулярную массу около 14-15 кДа, связывает вторичную структуру геномной РНК вблизи 5′-нетранслируемой области[112][115]., активирует обратную транскрипцию геномной РНК ВИЧ, синтез вирусных мРНК, необходим для репликации вируса почти во всех культурах клеток, регулирует выход вирионов из заражённых клеток[112][115], нуждается в клеточном кофакторе — циклине T1. Белок Rev регулирует экспрессию белков вириона, связывает мРНК гена env в области RRE (англ. Rev response element) интрона, разделающего экзоны генов Tat и Rev[112][115]

Белки Tat и Rev стимулируют транскрипцию провирусной ДНК и транспорт РНК из ядра в цитоплазму, а также необходимы для трансляции. Белок Rev обеспечивает также транспорт компонентов вируса из ядра и переключение синтеза регуляторных белков вируса на синтез структурных[112].

Жизненный цикл

До проникновения в клетку-мишень

После попадания вирионов ВИЧ на поверхность и внутрь организма, вирусные частицы оказываются в различных по своей агрессивности биологических жидкостях. Слюна и желудочный сок содержат ферменты, которые в бо́льшей степени разрушают вирионы ВИЧ, чем другие биологические жидкости (это не относится к младенцам первых месяцев жизни, у которых ещё не вырабатываются соответствующие ферменты пищеварения, из-за чего младенцы могут быть заражены через грудное молоко). Вирионы ВИЧ проникают в кровеносную и лимфатическую систему организма и перемещаются по организму в потоке крови и лимфы. Оказавшись рядом с CD4-клеткой, вирионы ВИЧ связывают рецептор CD4 на её плазматической мембране[116].

Проникновение в клетку и обратная транскрипция

Механизм слияния вириона ВИЧ
и плазматической мембраны
Т-лимфоцита человека

1. Взаимодействие вирусного белка gp120 с клеточным рецептором CD4 (указано красной стрелкой)

2. Конформационные изменения вирусного белка gp120 обеспечивают связывание с клеточным рецептором CCR5 (указано красной стрелкой)

3. Концевые участки вирусного белка gp41 проникают в плазматическую мембрану клетки (указано красной стрелкой)

4. Вирусный белок gp41 подвергается значительным конформационным изменениям (указано красной стрелкой), что приводит к сближению и слиянию мембран вириона и клетки

Вирусный гликопротеин gp120 прочно связывает рецептор CD4. В результате такого взаимодействия gp120 претерпевает конформационные изменения, которые позволяют ему также связать молекулу корецептораCXCR4 или CCR5 (экспрессируемых на поверхности Т-лимфоцитов, макрофагов, дендритных клеток и микроглии)[117][118]. В зависимости от способности связывать эти корецепторы, ВИЧ классифицируют на R5-тропные (связывают только корецептор CCR5), X4-тропные (связывают только корецептор CXCR4) и R5X4-тропные (могут взаимодействовать с обоими корецепторами) варианты[117]. При заражении, в основном, передаются R5-тропные и R5X4-тропные варианты[119]. Препараты, блокирующие корецепторы, могут быть эффективны против ВИЧ[120].

После описанных событий вирусный белок gp41 проникает в мембрану клетки и подвергается значительным конформационным изменениям, вследствие которых мембрана клетки и мембрана вириона ВИЧ сближаются друг с другом и затем сливаются. Вирусный белок gp41 очень важен для слияния мембран, поэтому его рассматривают в качестве мишени для разработки противовирусных препаратов.

После слияния мембран содержимое вириона проникает внутрь клетки. Внутри клетки вирусная РНК высвобождается из капсида. Затем под действием обратной транскриптазы происходит обратная транскрипция — процесс синтеза ДНК на основании информации в одноцепочечной геномной РНК вируса[121]. Большая часть лекарственных препаратов, одобренных для применения при ВИЧ-инфекции, направлена на нарушение работы обратной транскриптазы[8].

Транспорт вирусной ДНК в ядро и интеграция в геном

После завершения обратной транскрипции в CD4+-лимфоците вирусный геном представлен невстроенной ДНК. Для встраивания вирусной ДНК в геном клетки-хозяина и для образования новых вирусов необходимаактивация T-лимфоцитов. Активация CD4+-лимфоцитов происходит при их контакте с антигенпредставляющими клетками в лимфоидной ткани. Наличие вирусов на поверхности фолликулярных дендритных клеток и присутствие провоспалительных цитокинов (ИЛ-1, ИЛ-6 и ФНОα) способствуют размножению ВИЧ в инфицированных клетках. Именно поэтому лимфоидная ткань служит самой благоприятной средой для репликации ВИЧ[122].

Синтезированная вирусная ДНК транспортируется внутрь ядра клетки в составе пре-интеграционного комплекса, в который также входят белки ВИЧ p17/MA, Nef и интеграза[123]. Далее вирусная ДНК встраивается в хромосому активированного T-лимфоцита под действием интегразы. Несколько препаратов, ингибирующих интегразу, широко используются в современной комплексной антиретровирусной терапии. Вирусная ДНК, встроившаяся в хромосому клетки, называется провирусом[8].

Транскрипция, сплайсинг, транспорт РНК из ядра в цитоплазму и трансляция

В ядре клеточная РНК-полимераза синтезирует предшественник вирусных информационных РНК (мРНК), длина которого равна длине геномной РНК ВИЧ-1. Этот предшественник мРНК подвергается 5′-концевому кэпированию и 3′-концевому полиаденилированию. Кроме того, предшественник мРНК подвергается сплайсингу, в результате которого образуются более 40 разных мРНК, которые можно разделить на 3 класса[124]:

  1. несплайсированная РНК длиной около 9.3 kb — далее используется в качестве мРНК для синтеза белков Gag и Gag-Pol, а также в качестве геномной РНК;
  2. неполностью сплайсированные РНК размером около 4 kb — используются как мРНК для синтеза белков Vif, Vpr, Tat, Vpu и Env;
  3. полностью сплайсированные РНК размером около 2 kb — используются как мРНК для синтеза белков Vpr, Tat, Rev и Nef.

На ранней стадии экспрессии генов, в отсутствие белка Rev, несплайсированная и неполностью сплайсированные РНК ВИЧ-1 нестабильны и быстро разрушаются в ядре. В то же время, полностью сплайсированные мРНК ВИЧ-1 являются стабильными и транспортируются из ядра в цитоплазму[124]. В цитоплазме с помощью рибосом происходит процесс трансляции — биосинтез белка из аминокислот по заданной матрице на основе генетической информации, содержащейся в мРНК. Синтезированный в цитоплазме белок Rev транспортируется в ядро, где связывается с областью RRE несплайсированной и неполностью сплайсированных РНК, что стабилизирует эти РНК. Кроме того, Rev взаимодействует с клеточным белком CRM1 (экспортин 1), и это взаимодействие стимулирует транспорт несплайсированной и неполностью сплайсированных РНК из ядра в цитоплазму, где происходит синтез закодированных в них белков[124].

Сборка и отпочковывание вирионов

Геномная РНК вируса, а также вирусные белки транспортируются к местам сборки вирионов — к мембране. Вирионы первоначально формируются из полипротеинов-предшественников структурных белков и ферментов и на этой стадии не являются инфекционными. В ходе созревания вирусной частицы вирусная протеаза расщепляет белки-предшественники до функциональных компонентов[8]. Несколько одобренных противовирусных препаратов ингибируют работу протеазы и препятствуют формированию зрелых вирионов[8].

Новые вирусные частицы отпочковываются от поверхности клетки, захватывая часть её мембраны, и выходят в кровяное русло, а клетка хозяина, несущая рецептор CD4, погибает[125][126]. Недавние исследования показали, что процесс отпочковывания вирионов может быть более сложным, чем считалось ранее. Так было обнаружено, что благодаря взаимодействию белка Gag с компонентами клетки вирионы накапливаются в особых внутриклеточных мультивезикулярных тельцах, которые обычно служат для экспорта белков. Таким образом вирусные частицы высвобождаются из клетки, эксплуатируя её собственную систему транспорта макромолекул[8].

Распространение по организму

Только что выделившийся из зараженного лимфоцита вирион ВИЧ в плазме крови живёт в среднем около 8 часов[116]. Продолжительность полужизни (время, за которое погибает 50 % вирионов ВИЧ) в плазме крови составляет примерно 6 часов[116]. В остальных средах продолжительность полужизни вирионов ВИЧ на порядки меньше[127].

В период острой фазы ВИЧ-инфекции отсутствие специфического иммунного ответа позволяет вирусу активно реплицироваться и достигать высоких концентраций в крови. Вирус заселяет органы лимфатической системы, CD4+-лимфоциты, макрофаги, а также другие клетки: альвеолярные макрофаги лёгких, клетки Лангерганса, фолликулярные дендритные клетки лимфатических узлов, клетки олигодендроглии и астроциты мозга и эпителиальные клетки кишки[128][129]. В лимфоидной ткани ВИЧ размножается на протяжении всего заболевания, поражая макрофаги, активированные и покоящиеся CD4+-лимфоциты и фолликулярные дендритные клетки[130][131]. Количество клеток, содержащих провирусную ДНК, в лимфоидной ткани в 5—10 раз выше, чем среди клеток крови, а репликация ВИЧ в лимфоидной ткани на 1—2 порядка выше, чем в крови. Основным клеточным резервуаром ВИЧ являются CD4+-Т-лимфоциты иммунологической памяти[132].

Для активации CD8+-лимфоцитов и образования антиген-специфических цитотоксических T-лимфоцитов необходима презентация пептидного антигена в комплексе с человеческим лейкоцитарным антигеном класса I. Дендритные клетки, необходимые для начала первичных антиген-специфичных реакций, захватывают антигены, перерабатывают и переносят их на свою поверхность, где эти антигены в комплексе с дополнительными стимулирующими молекулами активируют T-лимфоциты. Заражённые клетки часто не выделяют дополнительных стимулирующих молекул и поэтому не способны вызвать активацию достаточного числа B- и T-лимфоцитов, функция которых зависит от дендритных клеток[122].

На 2015 год ВИЧ-инфекция остаётся неизлечимым заболеванием, так как геном вируса интегрируется в хромосомы клеток и может реактивироваться даже после курса антиретровирусной терапии. В настоящее время идёт поиск безопасных способов редактирования генома человека и исключения из него провирусной ДНК[133][134]. В 2014 году был предложен метод удаления генома ВИЧ-1 из заражённых клеток при помощи системы CRISPR/Cas9. С помощью этого метода исследователям удалось вырезать фрагмент провирусной ДНК, заключённый между 5′- и 3′-концевыми LTR-областями из хромосом заражённых клеток в культуре. Кроме того, этот метод оказался также эффективным для профилактики заражения неинфицированных клеток. Описанный подход может привести к разработке способа полного избавления от ВИЧ-инфекции[135][136].

Происхождение

Филогенетическое дерево вирусов:
HIV — вирус иммунодефицита человека
SIV — вирус иммунодефицита обезьян

Методом молекулярной филогении показано, что вирус иммунодефицита человека образовался в конце XIX или в начале XX века[137][138][139][140][141], скорее всего в 1920-х гг[142].

Оба типа вируса иммунодефицита человека ВИЧ-1 и ВИЧ-2 возникли в Западной и Центральной Африке южнее Сахары и передались от обезьян к людям в результате зоонозиса. ВИЧ-1 возник на юге Камеруна в результате эволюции эндемичного вируса иммунодефицита обезьян SIV-cpz, который заражает черномордых шимпанзе (Pan troglodytes troglodytes)[143][144]. ВИЧ-1, как полагают, перешёл видовой барьер по крайней мере трижды и породил три группы вирусов: M, N и О[145].

ВИЧ-2 возник на территории Западной Африки (от южного Сенегала до запада Берега Слоновой Кости) в результате эволюции вируса иммунодефицита обезьян SIV-smm, который заражает тёмно-коричневых мангабеев (Cercocebus atys) и узконосых обезьян[146].

Существует доказательство того, что охотники на диких животных (обезьян) или поставщики мяса в Западной и Центральной Африке подвергаются заражению вирусом иммунодефицита обезьян, причём вероятность заражения коррелирует с частотой взаимодействия с обезьянами и их мясом[147]. Однако вирус иммунодефицита обезьян — слабый вирус, и, как правило, подавляется иммунной системой человека в течение недели после заражения. Считается, что необходимо несколько передач вируса от человека к человеку в быстрой последовательности, чтобы вирусу хватило времени мутировать в ВИЧ[148]. Хотя передача вируса иммунодефицита обезьян от человека к человеку происходит редко, определённые социальные факторы могут существенно влиять на частоту заражений. Предполагают, что условия для распространения вируса были неблагоприятны в Африке до XX века. Сопоставление периодов ускоренной эволюции ВИЧ с социо-экономическими изменениями позволяет делать предположения о природе факторов, ускоривших распространение ВИО и ВИЧ.

Генетические исследования показывают, что последний общий предок ВИЧ-1 группы М существовал около 1910 года[149]. Сторонники этой даты связывают распространение ВИЧ с развитием колониализма в Африке и ростом больших городов. Эти факторы привели к таким социальным изменениям в обществе, как увеличение частоты беспорядочных половых связей, распространение проституции и заболеваний, передающихся половым путём (ЗППП)[150]. ЗППП, такие как сифилис, могут сопровождаться генитальными язвами. Исследования показывают, что вероятность передачи ВИЧ во время вагинального полового акта, достаточно низкая при обычных условиях, может быть увеличена в десятки, если не в сотни раз, если один из партнёров страдает от генитальных язв. О степени распространённости ЗППП в колониальных городах в начале 1900-х можно судить по следующим цифрам: в 1928 году по меньшей мере 45 % жительниц восточного Леопольдвиля (ныне — Киншаса, ранний центр распространения ВИЧ группы М) были проститутками, а в 1933 году около 15 % всех жителей этого же города были заражены одной из форм сифилиса. Ретроспективный анализ показал, что начало эпидемии ВИЧ-инфекции в Киншасе совпало с пиком эпидемии генитальных язв в середине 1930-х годов[150].

Альтернативная точка зрения гласит, что основным фактором, способствовавшим адаптации ВИЧ к людям и его распространению, была небезопасная медицинская практика в Африке в годы после Второй мировой войны, такая как использование нестерильных многоразовых шприцов при массовых вакцинациях, инъекциях антибиотиков и противомалярийных средств[96][151][152].

В результате ретроанализа образцов крови взятых после Второй мировой войны зафиксирован самый ранний документальный случай наличия ВИЧ в организме человека, кровь у которого взяли в 1959 году[153]. Вирус, возможно, присутствовал в Соединённых Штатах уже в 1966 году[154], но подавляющее большинство случаев заражения ВИЧ, идентифицированных за пределами тропической Африки, можно проследить до одного неустановленного человека, который заразился ВИЧ на Гаити, а затем перенёс инфекцию в США около 1969 года[155].

Естественная устойчивость к ВИЧ

См. также: CCR5 § Мутация CCR5-Δ32

Описаны случаи устойчивости людей к ВИЧ. Проникновение вируса в клетку иммунной системы связано с его взаимодействием с поверхностным рецептором, белком CCR5. Делеция (утеря участка гена) CCR5-дельта32 приводит к невосприимчивости её носителя к ВИЧ. Предполагается, что эта мутация возникла примерно две с половиной тысячи лет назад и со временем распространилась в Европе. Сейчас к ВИЧ фактически устойчив в среднем 1 % жителей Европы, 10—15 % европейцев имеют частичную сопротивляемость к ВИЧ[156]. Учёные Ливерпульского университета объясняют распространение мутации гена CCR5 тем, что она усиливает сопротивляемость к бубонной чуме. Эпидемия «чёрной смерти» 1347 года (а в Скандинавии ещё и 1711 года) способствовала увеличению частоты этого генотипа в Европе.

См. также: Нонпрогрессор

Мутация в гене CCR2 также уменьшает шанс проникновения ВИЧ в клетку и приводит к задержке развития СПИДа. Существует небольшой процент ВИЧ-положительных людей (около 10 %), у которых СПИД не развивается в течение долгого времени. Их называют нонпрогрессорами[157][158].

Важный клеточный компонент защиты против ВИЧ — антивирусный белок APOBEC3G, который вызывает деаминирование ДНК, приводящее к мутационным заменам G на A в вирусной ДНК, синтезируемой в ходе обратной транскрипции. APOBEC3G инактивируется белком Vif ВИЧ-1, который вызывает его убиквитинилирование и деградацию[159].

Обнаружено, что одним из главных элементов антивирусной защиты человека и других приматов является белок TRIM5a, способный распознавать капсид вирусных частиц и препятствовать размножению вируса в клетке. TRIM5a человека и шимпанзе несколько отличаются друг от друга и эффективны против разных вирусов: этот белок защищает шимпанзе от ВИЧ и родственных ему вирусов, а человека — от вируса PtERV1[160]. Обезьяны Нового Света, за исключением мирикины, которая имеет химерный ген TRIM5-CypA, устойчивостью к ВИЧ не обладают[161].

Другой важный элемент антивирусной защиты — интерферон-индуцируемый трансмембранный белок CD317/BST-2 (англ. bone marrow stromal antigen 2)[108][109][162]. CD317 — трансмембранный белок 2го типа с необычной топологией: он имеет трансмембранный домен рядом с N-концом и гликозилфосфатидилинозитол (GPI) на С-конце, между которыми расположен внеклеточный домен[163]. Показано, что CD317 непосредственно взаимодействует со зрелыми дочерними вирионами, «привязывая» их к поверхности клетки[164]. Для объяснения механизма такого «привязывания» предложено несколько альтернативных моделей, которые, тем не менее, сходятся в следующем. Молекулы CD317 формируют параллельный гомодимер; один или два гомодимера связываются одновременно с одним вирионом и клеточной мембраной. При этом с мембраной вириона взаимодействуют либо оба мембранных «якоря» (трансмембранный домен и GPI) одной из молекул CD317, либо один из них[164]. Спектр активности CD317 включает, по крайней мере, четыре семейства вирусов: ретровирусы, филовирусы, аренавирусы и герпесвирусы[162]. Активность данного клеточного фактора ингибируется белками Vpu ВИЧ-1, Env ВИЧ-2 и SIV, Nef SIV, гликопротеином оболочки вируса Эбола и белком К5 герпесвируса саркомы Капоши[104][105][110][111][162][165][166]. Обнаружен кофактор белка CD317 — клеточный белок ВСА2 (Breast cancer-associated gene 2; Rabring7, ZNF364, RNF115) — Е3-убиквитинлигаза класса RING. BCA2 усиливает интернализацию вирионов ВИЧ-1, «привязанных» белком CD317 к поверхности клетки, в CD63+ внутриклеточные везикулы с их последующим разрушением в лизосомах[167].

Материал из Википедии — свободной энциклопедии

Страница статьи : Вопросы вирусологии

Жирнов О.П., Букринская А.Г. Белки вируса гриппа. Включение вновь синтезированных вирусных белков в вирионы. Вопросы вирусологии. 1982; (5): 549-56.

Жирнов О.П., Маныкин А.А. рН-зависимые перестройки в структуре вируса гриппа А. Вопросы вирусологии. 2014; 59 (3): 41-6.

Жирнов О.П. Белки вируса гриппа: солюбилизация in vitro матриксного белка М1 вириона зависит от протеолитического нарезания гемагглютинина и от рН. В кн.: Каверин Н.В., ред. Молекулярная биология и генетическая инженерия вирусов. М.; 1989: 50-7.

Kilbourne E.D., Murphy J.S. Genetic studies of influenza viruses. I. Viral morphology and growth capacity as exchangeable genetic traits. Rapid in ovo adaptation of early passage Asian strain isolates by combination with PR8. J. Exp. Med. 1960; 111: 387-406.

Roberts P.C., Lamb R.A., Compans R.W. The M1 and M2 proteins of influenza A virus are important determinants in filamentous particle formation. Virology. 1998; 240 (1): 127-37.

McCown M.F., Pekosz A. The influenza A virus M2 cytoplasmic tail is required for infectious virus production and efficient genome packaging. J. Virol. 2005; 79 (6): 3595-605.

Iwatsuki-Horimoto K., Horimoto T., Noda T., Kiso M., Maeda J., Watanabe S. et al. The cytoplasmic tail of the influenza A virus M2 protein plays a role in viral assembly. J. Virol. 2006; 80 (11): 5233-40.

Elleman C.J., Barclay W.S. The M1 matrix protein controls the filamentous phenotype of influenza A virus. Virology. 2004; 321 (1): 144-53.

Roberts K.L., Leser G.P., Ma C., Lamb R.A. The amphipathic helix of influenza a virus M2 protein is required for filamentous bud formation and scission of filamentous and spherical particles. J. Virol. 2013; 87 (18): 9973-82.

Bruce E.A., Digard P., Stuart A.D. The Rab11 pathway is required for influenza A virus budding and filament formation. J. Virol. 2010; 84 (12): 5848-59.

Choppin P.W., Murphy J.S., Tamm I. Studies of two kinds of virus particles which comprise influenza A2 virus strains. III. Morphological characteristics: independence to morphological and functional traits. J. Exp. Med. 1960; 112: 945-52.

McHardy A.C., Adams B. The role of genomics in tracking the evolution of influenza A virus. PLoS Pathog. 2009; 5 (10): e1000566.

Eisfeld A.J., Neumann G., Kawaoka Y. At the centre: influenza A virus ribonucleoproteins. Nat. Rev. Microbiol. 2015; 13 (1): 28-41.

Zhirnov O.P., Klenk H.D., Wright P.F. Aprotinin and similar protease inhibitors as drugs against influenza. Antiviral. Res. 2011; 92 (1): 27-36.

Zhirnov O.P., Manykin A.A. Abnormal morphological vesicles in influenza a virus exposed to acid pH. Bull. Exp. Biol .Med. 2015; 158 (6): 776-80.

Pinto L.H., Lamb R.A. The M2 proton channels of influenza A and B viruses. J. Biol. Chem. 2006; 281 (14): 8997-9000.

границ | SDN2GO: интегрированная модель глубокого обучения для прогнозирования функции белков

1. Введение

Как важная структурная молекула, белок является жизненно важным компонентом всех биологических тканей и клеток, а также основным носителем жизнедеятельности (Weaver, 2011). Понимание функции белков важно как для биологии, так и для медицины и фармацевтики. Например, выяснение функции белка может обеспечить цель для генетических манипуляций и обеспечить надежную основу для создания нового белка или трансформации существующего белка и т. Д.Таким образом, точное описание функций белков является важной и важной задачей. Традиционные экспериментальные методы требуют много ресурсов и времени для определения функции белка, несмотря на их высокую точность и надежность. С постоянным развитием технологии высокопроизводительного секвенирования и геномики последовательность белков резко выросла, но лишь небольшой процент от общего числа известных и предсказанных последовательностей белков был подробно аннотирован относительно их функций.В настоящее время экспериментально аннотировано только <0,1% из более чем 179 миллионов белков в UniProtKB (Consortium, 2019). Однако непросто расширить экспериментальный метод для размещения такого большого количества данных о последовательностях белков, что срочно требует разработки вычислительных методов, помогающих аннотировать функции белков (Radivojac et al., 2013).

Gene Ontology, запущенная в 1998 году, широко используется в области биоинформатики, и первоначальная цель GO состояла в том, чтобы предоставить репрезентативную платформу для описания терминологии или интерпретации слов генов и характеристик генных продуктов.Это позволяет исследователям биоинформатики обобщать, обрабатывать, интерпретировать и делиться данными о генах и генных продуктах (Ashburner et al., 2000). Генная онтология — это онтология типа направленного ациклического графа (DAG). В настоящее время GO содержит более 45 000 биологических концепций, включая функции и расположение клеток, и делится на три категории, охватывающие три аспекта биологии: биологический процесс, молекулярную функцию и клеточный компонент. Белок обычно имеет несколько аннотаций GO; следовательно, предсказание функции белков — это очень крупномасштабная проблема классификации с несколькими метками (Zhang and Zhou, 2013), и точное определение GO-терминов для белков является сложной задачей.

В последние годы некоторые организации и группы разработали алгоритмы, инструменты и системы для прогнозирования функции белков с использованием передовых компьютерных технологий, таких как машинное обучение и глубокие нейронные сети (Kulmanov et al., 2018; You et al., 2018, 2019 ; Hakala et al., 2019; Lv et al., 2019b; Piovesan, Tosatto, 2019; Rifaioglu et al., 2019; Kulmanov, Hoehndorf, 2020). Исследователи предсказывают функции белков по одному или нескольким из следующего: последовательности белков (Кулманов и др., 2018; You et al., 2018, 2019; Hakala et al., 2019; Пиовезан и Тосатто, 2019 г .; Kulmanov, Hoehndorf, 2020), белковые структуры (Yang et al., 2015; Zhang et al., 2018), сеть белок-белковых взаимодействий (PPI) (Kulmanov et al., 2018; Zhang et al., 2018; You et al. ., 2019) и др. (Kahanda, Ben-Hur, 2017; Hakala et al., 2019; Piovesan, Tosatto, 2019; Rifaioglu et al., 2019). Например, в частности, GOLabeler (You et al., 2018) интегрировал пять различных типов информации, основанной на последовательностях, и изучил идею ранжирования веб-страниц, чтобы обучить модель регрессии LTR (обучение ранжированию) для получения этих пяти типов информации для добиться точной аннотации терминов GO.В результате эта модель получила лучшую общую производительность среди всех представленных 3-й критической оценки функциональной аннотации (CAFA3). NetGO (You et al., 2019), предложенный командой GOLabeler, основан на GOLabeler и включает огромное количество сетевой информации белок-белкового взаимодействия (PPI) в структуру LTR. По сравнению с GOLabler, он достиг значительного улучшения характеристик прогнозирования функции белка. Hakala et al. (2019) разработали интегрированную систему, которая получает функции из нескольких различных инструментов или методов: BLASTP, InterproScan, NCBI Taxonomy, NucPred, NetAcet, PredGPI и Amino Acid Index (Kawashima and Kanehisa, 2000; Heddad et al., 2004; Kiemer et al., 2005; Pierleoni et al., 2008; Камачо и др., 2009; Федерхен, 2012; Jones et al., 2014), а затем соответственно передать все характеристики двум классификаторам на основе нейронной сети и случайного леса и, наконец, объединить классификатор NN и классификатор RF для достижения наилучшей производительности прогнозирования. DeepGO (Кулманов и др., 2018) кодирует аминокислотную последовательность белка с помощью триграмм и сопоставляет триграммы с вектором с помощью однократного кодирования и плотного встраивания, а затем передает его в сверточную нейронную сеть (CNN) для извлечения признака. карта.Затем комбинированный вектор признаков, состоящий из функций CNN и функций встраивания сети PPI, вводится в иерархически структурированные уровни классификации для классификации терминов GO. INGA2.0 (Piovesan and Tosatto, 2019) использует четыре компонента: гомологию, выведенную из сходства последовательностей, архитектуру домена, сети белок-белкового взаимодействия и интегрированную информацию из «темного протеома», который включает неупорядоченные и трансмембранные области, для прогнозирования функции белка. . Этот метод имеет лучшие возможности для предсказания некоторых чрезвычайно редких терминов GO по сравнению с другими.В целом, эти высококонкурентные модели и системы доказали свою выдающуюся эффективность в прогнозировании функции белков и постоянно оптимизируются.

Аминокислотная последовательность имеет решающее значение для понимания и анализа белков различных видов. Некоторые исследования показали, что методы BLAST, основанные на гомологии последовательностей, очень конкурентоспособны в прогнозировании функции белков (Altshul, 1997; Gillis and Pavlidis, 2013; Hamp et al., 2013). Кроме того, существует несколько физиологических функций высокого уровня, таких как апоптоз или регуляция ритма, которые часто являются результатом взаимодействия нескольких белков (Кулманов и др., 2018), и согласно так называемому принципу «вины по ассоциации», взаимодействующие белки должны иметь некоторые сходные функции (Oliver, 2000; Schwikowski et al., 2000). Это показывает, что информация о последовательности белка и информация о сети PPI важны для прогнозирования функции белка. Мы также заметили критическое положение белкового домена в функциях, связанных с белком. Домен представляет собой структурный мотив, который существует независимо в различных комбинациях и порядках в белке (Forslund and Sonnhammer, 2008) и представляет собой белковый компонент более высокого уровня, чем аминокислотная последовательность (Richardson, 1981).Следовательно, имеет смысл проанализировать и изучить влияние содержания домена на функцию белка и попытаться использовать его для прогнозирования функции белка. Кроме того, машинное обучение (ML) в настоящее время популярно и эффективно для задач биоинформатики (You et al., 2018, 2019; Lai et al., 2019; Tan et al., 2019; Wang et al., 2019a; Zhu et al. , 2019; Dao et al., 2020), особенно благодаря своей сильной способности соответствовать многомерным, разреженным и сильно коллинеарным сложным данным, технология глубокого обучения широко используется в областях биоинформатики, таких как структура и функция белков ( Sønderby and Winther, 2014; Spencer et al., 2014; Wei et al., 2018; Kulmanov and Hoehndorf, 2020), регуляция экспрессии генов (Chen et al., 2016; Lanchantin et al., 2016), классификация белков (Asgari, Mofrad, 2015; Sønderby et al., 2015), а также структура и функции нуклеиновой кислоты. (Zhang et al., 2016; Lv et al., 2019a; Wang et al., 2019a, b). Исходя из этих соображений, здесь мы предложили интегрированную модель глубокого обучения, основанную на белковых последовательностях, содержании белковых доменов и известных сетях белок-белковых взаимодействий для прогнозирования функции белков.Сначала мы построили три разных модуля нейронных сетей для изучения функций из последовательностей белков, содержимого домена и PPI Net по отдельности, а затем объединили функции из этих трех разных источников и ввели их в классификатор нейронной сети, чтобы предсказать вероятность каждого члена GO. Результаты экспериментов показывают, что наш метод добавления содержимого домена для прогнозирования функции белка является успешным, а наша модель показала лучшую производительность, чем BLAST и два других недавних высокопроизводительных метода на независимом наборе данных, построенном с использованием правил временной задержки.

2. Материалы и методы

2.1. Источник данных

2.1.1. Данные обучения

• Данные последовательности

Для наших экспериментов мы загрузили информацию о последовательностях белков, необходимых для исследования, из базы данных UniProt в виде файлов в формате FASTA (http://www.uniprot.org/downloads) (Consortium, 2015). Затем инструмент CD-hit был использован для де-избыточности загруженных данных последовательности белка. Мы сгруппировали белки со сходством последовательностей> 60% в один кластер, и только один белок на кластер был сохранен.Наконец, мы получили эталонный тест для людей, содержащий 13 704 белка, а эталонный тест для дрожжей — 6 623 белка.

• Данные аннотации

Мы загрузили данные аннотации GO для белков из GOA (http://www.ebi.ac.uk/GOA) (Barrell et al., 2009), опубликованные в декабре 2013 года. Обратите внимание, что данные аннотации GO здесь предназначены только для обучения. , и все данные аннотированы за 2013 год или ранее. Наконец, аннотационные данные содержат 13 882 категории (9 221 для BP, 3 483 для MF и 1178 для CC) для человека и 4796 категорий (2439 для BP, 1733 для MF и 624 для CC) для дрожжей.

• Сетевые данные о взаимодействии белков и белков (PPI)

Мы добавили сетевые данные белок-белкового взаимодействия (PPI), которые получены из базы данных STRING v10 (https://string-db.org/) (Szklarczyk et al., 2015), чтобы улучшить производительность эксперимента. . Среди них данные PPI человека содержат 11 759 455 оцененных звеньев 19 257 белков, а данные Yeast PPI содержат 1845 966 ​​оцененных звеньев 6507 белков.

• Данные белкового домена

Мы загрузили данные белковой области из общедоступной базы данных interpro (Hunter et al., 2009) (http://www.ebi.ac.uk/interpro/download/), который содержит все белки UniProtKB, записи InterPro и индивидуальные сигнатуры, которым они соответствуют. Для конкретного белка мы можем получить типы, количество и расположение всех доменов, которые он содержит, а также указать начальное и конечное положения в последовательности белка домена. Мы провели поиск по UniProt ID белка, чтобы получить данные о доменах всех необходимых нам белков. Затем мы выполнили де-избыточность; для той же информации о домене, подтвержденной противоречивыми доказательствами, мы сохранили только одну из них.В итоге данные нашего домена содержат 113 972 единиц информации о 14 242 доменах для человека и 23 326 единиц информации о 6 707 доменах для дрожжей.

2.1.2. Данные независимого тестирования

Независимый набор тестовых данных используется для сравнения с конкурирующими методами. Сбор данных обычно осуществляется в соответствии с правилом отложенного запроса CAFA. Мы загрузили данные аннотаций GO для белков из GOA, опубликованные в январе 2016 г., а затем получили аннотации GO для белков, добавленные после 2013 г. (2014 и 2015 гг.).В частности, мы удалили данные аннотаций, опубликованные в декабре 2013 г., из данных аннотаций, опубликованных в январе 2016 г., и сохранили только недавно добавленные данные аннотаций белков. Затем мы построили независимый тестовый тест на основе недавно добавленных данных аннотации; обратите внимание, что все белки, содержащиеся в этом тесте, не имеют аннотаций GO до 2014 года. Точно так же мы отфильтровали те белки, которые были аннотированы только терминами GO, которые встречаются крайне редко. Отфильтрованный независимый тестовый набор содержит 68 белков для BP, 136 белков для MF и 106 белков для CC.

2.2. Представление данных

2.2.1. Данные о последовательности белков

Информация о последовательности белка является одним из входных параметров нашей модели. Последовательность каждого белка представляет собой строку, состоящую из 20 конкретных кодов аминокислот разной длины. В этом эксперименте мы отбирали только белки с длиной последовательности, не превышающей 1500. Если длина последовательности <1500, мы добавили ноль в конце последовательности, чтобы гарантировать, что длина каждой входной информации о последовательности белка является фиксированной.Чтобы полностью извлечь контекст и семантические сведения о последовательности, мы использовали ProtVec от BioVec (Asgari and Mofrad, 2015), который представляет собой биологическое представление последовательности и метод извлечения признаков, для отображения информации о последовательности. Этот метод заимствует идеи «встраивания слов» из Natural Language Processing (NLP) и получает векторные представления биологических последовательностей посредством обучения, а ProtVec используется для белковых последовательностей. Мы следовали ProtVec и использовали 3-граммовую кодировку для белковых последовательностей, то есть использовали окно длиной 3 с размером шага 1 для сдвига белковой последовательности, чтобы получить 3-граммовую последовательность длиной 1498 для каждого белка.

Для преобразования информации о 3-граммовых последовательностях в векторы, которые могут быть получены компьютерной моделью, мы использовали таблицу ProtVec-100d-3grams, выпущенную BioVec. Мы загрузили эти данные из Harvard Dataverse (http://dx.doi.org/10.7910/DVN/JMFHTN). В этой таблице белковый вектор представляет собой распределенное представление белков, а 100-D вектор представляет каждый 3-граммовый. Для нашего эксперимента, согласно ProtVec, каждый белок будет представлен в виде векторной матрицы 1,498 * 100, а затем использован в качестве входных данных для модели.В частности, в соответствии с тем, как мы обрабатываем белки длиной менее 1500, если 3-граммовое слово содержит один или несколько дополненных нами нулей, то 3-граммовое слово будет представлено как нулевой вектор 100D.

2.2.2. Данные белковой сети

Данные белковой сети, которые мы загрузили, представляют собой оцененные связи между белками. Чем выше оценка, тем больше вероятность взаимодействия между белками. Мы отфильтровали все ссылки с оценкой 400 баллов, оставив только ссылки с оценкой выше 400, а затем интегрировали данные отфильтрованной белковой сети в матрицу оценок PPI.Каждая строка этой матрицы представляет собой вектор, который представляет взаимодействие белка с другими белками. Если белок A взаимодействует с другим белком B в выбранных данных, мы устанавливаем значение в соответствующей позиции в векторе для доли этих двух белков; в противном случае мы устанавливаем его на 0.

2.2.3. Данные белкового домена

В белках типы и количество доменов и относительные положения различных доменов будут влиять на функции белка. Чтобы полностью обнаружить и извлечь исчерпывающую информацию о типе, количестве и положении доменов в белках, чтобы улучшить производительность модели, нам сначала нужно отсортировать домены, содержащиеся в каждом белке, в соответствии с информацией о положениях в данных домена, так что мы можем получить информацию о взаимном расположении различных доменов.Однако информация о положении, предоставленная базой данных, представляет собой только возможный диапазон доменов в последовательности белка. Например, если в базе данных указано положение домена D в последовательности белка P 60–200, это указывает только на то, что домен D существует в области 60–200 в белке P, но мы не можем получить фактическую длину и расположение этого домена D. Это результат технических ограничений, которые приводят к перекрытию существования разных доменов, даже если область полностью содержит другую область в белке, и затрудняет сортировку доменов.

В наших экспериментах мы предложили простой метод сортировки, основанный на точках регионального центра, чтобы решить эту проблему. В частности, в конкретном белке есть три возможности для географической взаимосвязи между любыми двумя разными доменами: отсоединенный, пересекающийся и содержащий. Если связь разорвана, мы можем быстро отсортировать два домена. Если это перекрестная связь или вмещающая связь, мы вычислили центральные точки двух областей отдельно, а затем поместили область с передней центральной точкой перед другой.После этого получают информацию о типе, количестве и относительном положении домена в белке. Затем мы извлекли уроки из идеи обработки естественного языка и рассматривали каждый домен как биологическое слово, поэтому информация о доменах, описывающих конкретный белок, представляет собой биологическое предложение, состоящее из некоторых слов домена в определенном порядке, в то время как функции белка что означает биологическое предложение. Цель модуля домена состоит в том, чтобы получить биологическое предложение белка, а затем абстрагироваться от функций, которые представляют значение предложения.Поскольку количество доменов, содержащихся в разных белках, несовместимо, здесь нам также необходимо решить проблему несовместимого размера входных данных модели. Мы получили максимальное количество доменов белков и использовали это максимальное количество (357 для человека и 41 для дрожжей) в качестве стандарта, а белки с меньшим количеством доменов, чем максимальное количество, были дополнены 0. Мы кодировали домены словом Embedding, чтобы ввести его в модель. В частности, мы использовали слой PyTorch Sparse, который может инициализировать простую таблицу поиска для сопоставления разреженных векторов с плотными векторами, чтобы сгенерировать фиксированную таблицу поиска для доменов.В этой таблице поиска каждый домен представлен 128-мерным вектором. В принципе, слой Sparse автоматически сопоставляет одномерные горячие векторы высокой размерности с плотными векторами низкой размерности и обеспечивает индекс плотных векторов. Размеры как горячих векторов, так и плотных векторов задаются пользователем вручную по мере необходимости, и мы могли бы получить требуемый плотный вектор, введя индекс. Следовательно, предложение доменов для Human представлено двумерной матрицей 357 * 128, а предложение доменов для Yeast представлено двумерной матрицей 41 * 128.Слой Sparse будет интегрирован в модель и обучен вместе, то есть по мере непрерывной оптимизации модели векторы представления доменов в таблице поиска будут становиться все более точными.

2.2.4. Protein GO Термины

Учитывая, что большое количество конкретных GO-терминов часто существует только в наборах аннотаций небольшого количества белков (You et al., 2018), и учитывая предел вычислений, мы ранжировали GO-термины в соответствии с количеством аннотаций в белков, а затем используйте набор пороговых значений (40 для BP, 20 для MF и 20 для CC) для выбора терминов GO, который содержит 491 термин BP, 321 термин MF и 240 терминов CC для человека и набор пороговые значения (10 для BP, 10 для MF и 10 для CC) для выбора терминов GO, которые содержат 373 термина BP, 171 член MF и 151 член CC для дрожжей.Мы создали три бинарных вектора для каждого белка, чтобы представить метки трех суб-онтологий GO: BP Ontology, MF Ontology и CC Ontology. Если белок аннотирован термином GO, значение в соответствующей позиции вектора метки устанавливается равным 1, а в противном случае устанавливается равным нулю. Обратите внимание, что в векторах меток выбраны все категории GO.

2.3. Глубокая модель

Мы обучили три модели для трех суб-онтологий GO. Мы случайным образом извлекли 80% обучающих данных для итеративного обучения модели, а оставшиеся 20% использовали для проверки производительности модели после каждой итерации и сохранили модель с наилучшей производительностью обобщения.Учитывая, что наша модель должна получать входные данные от трех аспектов последовательности, содержимого домена и сетевой информации PPI, как показано на рисунке 1, мы разделили модель на четыре компонента: подмодель последовательности, подмодель домена, подмодель PPI-Net. -модель и взвешенный классификатор.

Рисунок 1 . Интегрированная архитектура модели глубокого обучения. (1) Подмодель последовательности использует одномерные сверточные нейронные сети для извлечения признаков из входных данных последовательности, которые были закодированы как 3-граммы, а затем отображены в 3-граммовую векторную матрицу.(2) Подмодель PPI Net генерируется для уплотнения функций из PPI Network с использованием классических нейронных сетей. (3) Подмодель домена инициализирует разреженный слой, который интегрируется в подмодель для оптимизации, для создания таблицы поиска для доменов, а предложение отсортированных доменов, обработанное разреженным слоем, вводится в одномерную сверточную нейронную систему. сети для извлечения функций. (4) Все выходные характеристики трех подмоделей объединяются и вводятся во взвешенный классификатор, а выходной вектор представляет вероятность условий GO.

2.3.1. Подмодель последовательности

Входными данными этой подмодели является двумерная векторная матрица размером 3 грамма, которая представляет информацию о последовательности белков. Чтобы извлечь подробные многомерные характеристики биологических последовательностей белков, мы разрабатываем и реализуем модель, основанную на сверточных нейронных сетях (CNN). Нейронная сеть — это модель математического алгоритма, которая имитирует поведенческие характеристики биологических нейронных сетей для распределенной и параллельной обработки информации (Хайкин, 1994).В CNN есть структура глубины, и входные данные свертываются для получения выходных данных (LeCun et al., 1998), слой свертки содержит несколько ядер свертки, которые могут заставить модель извлекать больше функций в различных аспектах. В нашем эксперименте мы использовали одномерную сверточную нейронную сеть, которая использует одномерное ядро ​​свертки для выполнения операций свертки над входными данными. После того, как входная последовательность преобразована для извлечения объектов, выходная карта объектов передается на слой объединения для выбора объектов и фильтрации информации; это потому, что карта функций все еще содержит избыточность.Здесь мы используем слой max-pooling для обработки карты объектов. После обработки выбранная карта объектов будет передана следующему слою в качестве входных данных. В частности, для подмодели последовательности были установлены три сверточных слоя, которые были соединены встык. Карта характеристик, полученная после операции свертки каждого сверточного слоя, использует максимальный слой объединения для фильтрации информации для удаления избыточности. Внутренние каналы первого сверточного слоя имеют ту же ширину, что и информационная матрица входной последовательности, и установлены на 100.Входящие каналы двух других сверточных слоев такие же, как выходные каналы предыдущего уровня, а выходные каналы трех сверточных слоев установлены как 64, 32 и 16 соответственно. Для каждого слоя свертки ядро ​​свертки размером 16 используется для операции свертки с размером шага 1. Чтобы полностью извлечь входные характеристики, на входе выполнялось заполнение 0 перед каждой сверткой. Каждый максимальный уровень объединения фильтруется с использованием ядра размера 2 с размером шага 2.Выходная карта объектов последнего слоя объединения будет разбита на одно измерение и введена в полностью связанные (FC) слои для уменьшения размерности. Наконец, был получен вектор признаков, представляющий информацию о последовательности белка. Количество узлов в выходном слое полносвязного слоя устанавливается в соответствии с количеством трех субонтологий GO. В частности, для человека он был установлен как 491 для BP, 321 для MF и 240 для CC, а для дрожжей он был установлен как 373 для BP, 171 для MF и 151 для CC.

2.3.2. Подмодель PPI-Net

В матрице с оценкой PPI векторы признаков, которые характеризуют взаимодействие между белками и другими белками, имеют большие размеры, которые составляют 18 901 для человека и 6054 для дрожжей, соответственно, поэтому мы построили модуль трехслойной трапециевидной нейронной сети для плотного определения PPI. Особенности. В этом модуле количество узлов во входном слое такое же, как размер входного вектора признаков, который составляет 18 901 для человека и 6 054 для дрожжей.Для количества узлов в скрытом слое установлено промежуточное значение в соответствии с количеством узлов на входном и выходном уровнях, которые составляют 4096 для человека и 2048 для дрожжей. А размер выходного слоя зависит от различных видов и суб-онтологии GO и совпадает с размером выходного слоя субмодели Sequence.

2.3.3. Подмодель домена

На вход подмодели домена поступает отсортированная информация о содержании белкового домена. Согласно входным данным, первая структура модуля представляет собой интегрированный разреженный слой, количество внедрений составляет 14 243 для человека и 6 708 для дрожжей, а размер встраивания установлен на 128.Для конкретного белка выходом разреженного слоя входного предложения домена является двумерная матрица. Поэтому, аналогично подмодели последовательности, мы построили модуль сверточных нейронных сетей, содержащий два одномерных сверточных слоя и два слоя с максимальным объединением. Входящие каналы первого сверточного слоя установлены на 357 для человека и 41 для дрожжей, входящие каналы второго сверточного слоя согласуются с исходящими каналами предыдущего слоя, а выходные каналы двух сверточные слои установлены на 128 и 64.Кроме того, каждый сверточный слой использовал ядро ​​свертки размера 2 для выполнения операции свертки с размером шага 2. Чтобы полностью извлечь входные функции, мы дополняли вход 0 перед каждой сверткой. Настройка двух максимальных уровней объединения такая же, как настройка максимального уровня объединения в подмодели Sequence. Выходная карта объектов последним объединяющим слоем разбивается на одно измерение, а затем вводится в полностью связанные слои, чтобы уменьшить размер и выходной слой полностью подключенного слоя.Размер выходного слоя зависит от различных видов и субонтологии GO и совпадает с размером выходного слоя субмодели Sequence.

2.3.4. Взвешенный классификатор

Взвешенный классификатор принимает выходные векторы из трех подмоделей: подмодели последовательности, подмодели домена, подмодели PPI-Net. В процессе обучения каждый классификатор GO изучает и оптимизирует веса, которые получают характеристики из трех подмоделей, для достижения наилучшего эффекта от классификации с несколькими метками. Обратите внимание, что выходные векторы трех модулей имеют одинаковые размеры.В целом наш весовой классификатор представляет собой трехуровневую несвязную сетевую модель. Количество узлов во входном слое является суммой количества выходных узлов трех подмоделей, и как узлы скрытого слоя, так и узлы внешнего слоя такие же, как узлы выходного слоя трех подмоделей. -модели, которые устанавливаются в соответствии с различными видами и субонтологией GO. С точки зрения единственного классификатора GO структура показана на рисунке 2. Для конкретного классификатора GO скрытый узел принимает только три функции, которые находятся в соответствующей позиции выходного вектора трех подмоделей, соответственно, соответствующих в категорию GO, и для выделения соответствующей области мы использовали матрицу двоичных масок для реализации этого управления подключением.Узел вывода классификатора также принимает только вывод соответствующего скрытого узла, и мы также использовали матрицу двоичных масок для реализации управления подключением. В общем, пусть снова весь весовой классификатор в целом, каждый узел в скрытом слое подключен только к трем соответствующим узлам в выходном слое, а каждый узел в выходном слое подключен только к одному соответствующему узлу скрытого слоя. Следовательно, веса между узлами скрытого слоя и узлами входного слоя представляют предпочтение Классификатора для объектов из трех подмоделей, а веса между узлами выходного слоя и узлами скрытого слоя глобально балансируют выходные значения Классификатора с тот же уровень.

Рисунок 2 . Архитектура единого классификатора GO во взвешенном классификаторе.

Для всех компонентов модели мы использовали Rectified-linear-unit (ReLU) (Glorot et al., 2011), который может улучшить вычислительную эффективность и сохранить градиент (Nair and Hinton, 2010) в качестве функции активации. Кроме того, запуская специальные алгоритмы оптимизации для минимизации функции потерь, модель DNN можно итеративно оптимизировать, обновляя веса и смещения.В частности, модель обучается с использованием адаптивного оптимизатора Адама (Kingma and Ba, 2014).

2,4. Методы оценки

Мы оцениваем производительность модели с помощью трех показателей: F-max, AUPR (площадь под кривой точности-отзыва) и AUC (площадь под кривой характеристик оператора приемника), где F-max и AUC используются в проблема CAFA (Radivojac et al., 2013). Мы используем стандарт CAFA для расчета F-max и следующие формулы:

Fmax = maxt {2 · pr (t) · rc (t) pr (t) + rc (t)} (1)

, где pr ( t ) и rc ( t ), соответственно, представляют точность и отзыв порога t ∈ [0, 1] и могут быть вычислены по следующим формулам:

pr (t) = 1m (t) · ∑i = 1m (t) pri (t) (2)

и

rc (t) = 1n · ∑i = 1nrci (t) (3)

, где m ( t ) — это количество белков, аннотированных по крайней мере одним GO-членом с использованием порога t , n — общее количество белков в целевом наборе данных. pr i ( t ) и rc i ( t ) представляют точность и отзыв определенного белка i с использованием порогового значения t и рассчитываются следующим образом: следующие формулы:

pri (t) = ∑fI (f∈Pi (t) ∧f∈Ti) ∑fI (f∈Pi (t)) (4)

и

rci (t) = ∑fI (f∈Pi (t) ∧f∈Ti) ∑fI (f∈Ti) (5)

, где f — это функциональный термин в онтологии, функция I (·) — это стандартная индикаторная функция. T i — это набор истинных меток для белка i , а P i ( t ) — набор предсказанных меток для белка i с использованием порога t. . Как только точность и напоминание, рассчитанные по различным значениям t для конкретного функционального члена, были определены для всех белков, мы могли затем рассчитать AUPR, используя правило трапеций. По сравнению с AUC, AUPR имеет больший штраф за ложные срабатывания [6].

Мы также вычисляем значение AUC для каждой модели субонтологии GO, формулы расчета следующие:

AUC = ∫-∞∞TPR (t) (- FPR (t)) dt, (6)

TPR (t) = TP (t) TP (t) + FN (t) (7)

и

FPR (t) = FP (t) FP (t) + TN (t) (8)

, где TP — количество истинных срабатываний, FP — количество ложных срабатываний, а TN — количество истинно отрицательных результатов, FN — количество ложных отрицательных результатов.

2,5. Реализация модели и вычислительная среда

Для реализации нашей модели мы использовали PyTorch, фреймворк глубокого обучения на основе Python.Для ускорения процесса обучения мы использовали сервер RHEL с четырьмя установленными видеокартами NVIDIACorporationGM 107 GL и общим объемом видеопамяти 32 ГБ. При заданном наборе параметров все время обучения для наиболее ресурсоемкой модели АД составляет <10 часов. С точки зрения прогнозирования, в случае, когда входная информация о последовательности, домене и PPI прогнозируемого белка была обработана заранее, использование оптимизированной модели для прогнозирования 1000 белков занимает около 6 минут.

3. Результаты

3.1. Эксперимент

Из-за сложности композиции нашей модели и необходимости определения большого количества гиперпараметров мы сначала предварительно обучили трехкомпонентные подмодели: последовательность, домен и сеть PPI. Мы использовали аннотации белков GO в качестве метки и вычислили бинарную кросс-энтропию между предсказанными значениями и фактическими значениями и использовали это как потерю для обратного распространения для обновления весов и смещений между узлами, подключенными в модели.Мы вручную скорректировали гиперпараметры, такие как скорость обучения и размер пакета каждого модуля, и выбрали оптимальную модель на основе значения потерь при проверке с использованием обучающего набора. После настройки параметров трех подмодулей мы использовали выходные данные этих трех точно настроенных моделей в качестве входных данных для ручной корректировки гиперпараметров взвешенного классификатора, а также выбора оптимальной модели на основе значения потерь при проверке с использованием обучающего набора. . Таблицы S1 – S4 показывают детали обучения различных гиперпараметров.

Мы использовали 5-кратную перекрестную проверку на обучающем наборе, чтобы проверить производительность модели, и результаты показаны в таблице 1. Ясно, что модель достигла благоприятного значения F-max для каждой суб-онтологии GO, что указывает на то, что наш метод является эффективным методом прогнозирования функции белка.

Таблица 1 . Результаты 5-кратной перекрестной проверки данных обучения.

3.2. Оценка эффективности использования содержимого домена

Использование исчерпывающей информации о типах, количествах и положениях содержания белковых доменов для прогнозирования функции белков является важнейшим компонентом и акцентом этого исследования.Чтобы исследовать и объяснить критическую роль всеобъемлющей информации о предметной области в прогнозировании функции белков, были построены глубокие модели без модуля предметной области для трех суб-онтологий GO, и каждая модель содержала только подмодель последовательности, подмодель PPI-Net. -модель и взвешенный классификатор, и мы назвали его SN2GO. Для SN2GO, поскольку подмодель Sequence и подмодель PPI-Net в модели SDN2GO предварительно обучаются отдельно, структура и настройки гиперпараметров подмодели Sequence и подмодели PPI-Net такие же, как и у SN2GO. соответствующих модулей в модели SDN2GO, а взвешенный классификатор удаляет соответствующую часть домена из входного слоя, настройки скрытого слоя и выходного слоя остаются такими же, как и у взвешенного классификатора SDN2GO.Чтобы обеспечить справедливость сравнения, мы также вручную скорректировали скорость обучения и гиперпараметры размера пакета и выбрали оптимальную модель взвешенного классификатора для SN2GO.

Мы наблюдали производительность SN2GO на обучающей выборке и сравнивали ее с SDN2GO. Точно так же мы использовали SN2GO для проведения эксперимента с 5-кратной перекрестной проверкой на обучающей выборке. В таблице 1 показаны результаты перекрестной проверки SN2GO. Мы обнаружили, что по сравнению с SN2GO, производительность SDN2GO, использующего информацию домена, была значительно улучшена во всех суб-онтологиях GO, особенно в MF Ontology людей, значение F-меры SDN2GO было увеличено почти на 20 % (0.65 против 0,55) по сравнению с SN2GO. Как показано на рисунке 3, кривые PR SDN2GO и SN2GO на данных проверки людей, ясно, что красная кривая PR окружает другую в каждой суб-онтологии. Этот результат показывает, что информация о домене играет важную роль в прогнозировании функции белка, и доказывает, что наши методы кодирования и обработки информации о домене белка и модели подглубокого обучения для доменов полезны и значимы.

Рисунок 3 . Кривые прецизионного отзыва (P-R) SDN2GO и SN2GO.Эффективность двух методов оценивалась на основе данных проверки человека в каждой субонтологии GO (генная онтология).

3.3. Сравнение с конкурирующими методами

Чтобы дополнительно проверить производительность SDN2GO, мы сравнили два новых метода, NetGO и DeepGO, на независимом тестовом наборе. Оба этих метода являются конкурентоспособными и превосходными в прогнозировании функции белков и достигли выдающихся результатов на некоторых наборах данных. NetGO представляет собой современный метод машинного обучения для прогнозирования функции белков и предлагает конструктивные идеи о том, как интегрировать функции, основанные на различных источниках.В то же время DeepGO вполне демонстрирует использование технологии глубокого обучения для прогнозирования функции белков. В частности, NetGO объединяет пять различных типов доказательств на основе последовательностей и массивную сетевую информацию в структуру обучения ранжированию (LTR) для прогнозирования функции белков. Мы загрузили последовательность белков независимого тестового набора в формате Fasta на веб-сервер AFP (автоматическое прогнозирование функций) (http://issubmission.sjtu.edu.cn/netgo/), выпущенный NetGO, а затем загрузили результат прогнозирования NetGO в txt через некоторое время.DeepGO использует сверточные нейронные сети для извлечения функций последовательности белков и объединяет известную сетевую информацию PPI в качестве комбинированных функций для прогнозирования функций белков. Мы загрузили весь исходный код DeepGO с GitHub и загрузили необходимые данные, а также точные модели нейронных сетей, сохраненные в формате PKL с предоставленного веб-сервера (http://deepgo.bio2vec.net/data/deepgo/), а затем вошли тестовая последовательность белка в формате Fasta для этого инструмента с открытым исходным кодом и получила результаты прогнозирования DeepGO.Кроме того, BLAST также использовался в сравнительных экспериментах.

Результаты сравнения показаны в таблице 2. Мы заметили, что BLAST хорошо работает с каждой субонтологией GO, что еще раз показывает, что метод BLAST, основанный на гомологии последовательностей, по-прежнему весьма конкурентоспособен. NetGO и DeepGO хорошо справились с MFO и BPO соответственно, но не достигли заявленных эффектов для других суб-онтологий. Мы дополнительно проанализировали результаты прогнозирования этих двух методов и обнаружили, что ложноположительные результаты обоих из них относительно высоки, что приводит к их неспособности получить значения высокой точности.Рисунок 4, на котором показаны кривые PR MFO на независимых тестовых наборах для различных методов, демонстрирует результаты нашего анализа с одного аспекта. Кривые PR BPO и CCO и другие конкретные детали можно увидеть на рисунках S1, S2. Очевидно, что SDN2GO превзошел другие методы по всем суб-онтологиям, особенно по MFO. Это показывает, что наша модель обладает отличными характеристиками обобщения и в настоящее время является конкурентоспособным методом прогнозирования функции белков. В частности, мы обратили внимание на производительность SN2GO, в тестовом наборе которой отсутствует подмодель домена.Результаты показывают, что его производительность в отношении BPO и MFO намного хуже, чем у SDN2GO, и доказывают, что извлечение признаков из белковых доменов для прогнозирования функции белка возможно и повысит точность маркировки GO-терминов для белков, особенно для BPO и MFO. .

Таблица 2 . Результаты сравнения конкурирующего метода на независимой тестовой выборке.

Рисунок 4 . Кривые прецизионного отзыва (P-R) для BLAST, DeepGO, NetGO, SN2GO и SDN2GO.Эффективность пяти методов оценивалась на независимом тестовом наборе в MFO (онтология молекулярных функций).

4. Обсуждение

SDN2GO, интегрированная весовая модель, основанная на глубоком обучении, которую мы предложили, объединяет три аспекта информации: последовательность белка, содержание белкового домена и известные сети белок-белкового взаимодействия. Мы построили три подмодели для этих трех аспектов информации, а затем изучили и извлекли три компонента функций посредством предварительного обучения подмоделей.Каждый член GO белка был окончательно оценен и аннотирован с помощью интегрированного классификатора веса с глубоким обучением. Результаты 5-кратной перекрестной проверки показывают, что SDN2GO является стабильным и надежным методом прогнозирования функции белков. Для дальнейшей проверки обобщающих характеристик и конкурентоспособности SDN2GO мы построили независимый набор тестов, основанный на принципе временной задержки, для сравнения с новым методом и классическим методом BLAST. Результаты сравнения показывают, что наш метод достиг максимального значения F-max для каждой суб-онтологии GO.

Многие исследования показали, что последовательность белка и сеть PPI действительны для функции белка (Kirac and Ozsoyoglu, 2008; Jiang and McQuay, 2011; Nguyen et al., 2011; Baryshnikova, 2016; Kulmanov et al., 2018). Кроме того, некоторые исследователи использовали информацию о белковом домене для прогнозирования функции белка (Altshul, 1997; Forslund and Sonnhammer, 2008), но они сосредоточились только на одном аспекте типа или структуры домена и не смогли полностью изучить общие характеристики различных аспекты домена.Мы учли это и усвоили уроки из принципа НЛП для кодирования доменов для интеграции информации о типе, количестве и положении белковых доменов, и использовали сверточную нейронную сеть для извлечения общих характеристик доменов, что является преимуществом нашей системы. модель. Мы построили сравнительную модель SN2GO на основе SDN2GO без подмодели предметной области и провели сравнительные эксперименты как с обучающими данными, так и с независимым тестовым набором. Результаты показывают, что информация о предметной области значительно улучшила эффект прогнозирования модели, особенно в BPO On MFO; это может быть связано с тем, что информация о домене как характеристика белка более высокого уровня, чем последовательность, более интуитивно понятна в экспрессии и ближе к функциям белка.И в определенной степени результаты сравнения продемонстрировали правильность и обобщаемость наших методов обработки информации о домене белка и выделения признаков.

В будущем мы продолжим улучшать нашу модель, например добавляя больше категорий аннотаций GO, чтобы расширить масштаб классификации с несколькими метками. Кроме того, мы также попытаемся интегрировать больше аспектов связанных с белками функций, таких как информация о структуре белка и информация о совместной экспрессии, в нашу модель, чтобы исследовать роль различной информации в прогнозировании функции белка.

Заявление о доступности данных

В данном исследовании были проанализированы общедоступные наборы данных. Эти данные можно найти здесь: https://github.com/Charrick/SDN2GO/tree/master/data.

Авторские взносы

YC и LD разработали эту работу и разработали эксперименты. YC и JW создали экспериментальную среду. YC проводил эксперименты. YC, LD и JW собрали данные и проанализировали результаты. YC и LD написали, отредактировали и одобрили рукопись.

Финансирование

Это исследование финансировалось Национальным фондом естественных наук Китая в рамках гранта №№.61972422 и 61672541.

Конфликт интересов

Авторы заявляют, что исследование проводилось при отсутствии каких-либо коммерческих или финансовых отношений, которые могут быть истолкованы как потенциальный конфликт интересов.

Благодарности

Мы хотели бы поблагодарить Экспериментальный центр школы компьютерных наук Центрального Южного университета за предоставление вычислительных ресурсов.

Дополнительные материалы

Дополнительные материалы к этой статье можно найти в Интернете по адресу: https: // www.frontiersin.org/articles/10.3389/fbioe.2020.00391/full#supplementary-material

Список литературы

Альтшул, С. Ф. (1997). Gapped blast и psi-blast: новое поколение программ поиска по базам данных белков. Нуклеиновые Кислоты Res . 25, 3389–3402. DOI: 10.1093 / nar / 25.17.3389

CrossRef Полный текст | Google Scholar

Э. Асгари и М. Р. Мофрад (2015). Непрерывное распределенное представление биологических последовательностей для глубокой протеомики и геномики. PLoS ONE 10: e0141287.DOI: 10.1371 / journal.pone.0141287

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Эшбернер М., Болл К. А., Блейк Дж. А., Ботштейн Д., Батлер Х., Черри Дж. М. и др. (2000). Генная онтология: инструмент для объединения биологии. Nat. Genet . 25, 25–29. DOI: 10.1038 / 75556

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Баррелл Д., Диммер Э., Хантли Р. П., Биннс Д., О’Донован К. и Апвейлер Р. (2009).База данных гоа в 2009 году — интегрированный ресурс аннотации онтологии генов. Нуклеиновые Кислоты Res . 37, D396 – D403. DOI: 10.1093 / nar / gkn803

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Камачо, К., Кулурис, Г., Авагян, В., Ма, Н., Пападопулос, Дж., Билер, К. и др. (2009). Blast +: архитектура и приложения. BMC Bioinformatics 10: 421. DOI: 10.1186 / 1471-2105-10-421

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Чен, Ю., Ли, Ю., Нараян, Р., Субраманян, А., Се, X. (2016). Вывод экспрессии генов с помощью глубокого обучения. Биоинформатика 32, 1832–1839. DOI: 10.1093 / биоинформатика / btw074

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Consortium, U. (2019). Uniprot: всемирный центр знаний о белках. Нуклеиновые Кислоты Res . 47, D506 – D515. DOI: 10.1093 / nar / gky1049

CrossRef Полный текст | Google Scholar

Дао, Ф.-Й., Львов, Х., Зульфикар, Х., Ян, Х., Су, В., Гао, Х. и др. (2020). Вычислительная платформа для определения происхождения сайтов репликации у эукариот. Краткое. Биоинформ. [Препринт] bbaa017. DOI: 10.1093 / bib / bbaa017

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Гиллис, Дж., И Павлидис, П. (2013). Характеристика современного состояния вычислительного назначения функции гена: уроки первой критической оценки функциональной аннотации (cafa). BMC Bioinformatics 14: S15.DOI: 10.1186 / 1471-2105-14-S3-S15

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Глорот X., Бордес А. и Бенжио Ю. (2011). «Глубокие нейронные сети с разреженным выпрямителем», в Труды четырнадцатой Международной конференции по искусственному интеллекту и статистике (Форт-Лодердейл, Флорида), 315–323.

Google Scholar

Hakala, K., Kaewphan, S., Björne, J., Mehryary, F., Moen, H., Tolvanen, M., et al. (2019). Нейронные сети и модели случайного леса в прогнозировании функции белков. BioRxiv 6

. DOI: 10.1101 / 6

CrossRef Полный текст | Google Scholar

Hamp, T., Kassner, R., Seemayer, S., Vicedo, E., Schaefer, C., Achten, D., et al. (2013). Вывод на основе гомологии устанавливает высокую планку для предсказания функции белков. BMC Bioinformatics 14: S7. DOI: 10.1186 / 1471-2105-14-S3-S7

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Хайкин, С. (1994). Нейронные сети: всеобъемлющий фундамент .Река Аппер Сэдл, Нью-Джерси: Prentice Hall PTR.

Google Scholar

Хеддад А., Брамейер М. и МакКаллум Р. М. (2004). «Развитие классификаторов последовательностей на основе регулярных выражений для ядерной локализации белка», в Workshops on Applications of Evolutionary Computing (Berlin; Heidelberg: Springer), 31-40. DOI: 10.1007 / 978-3-540-24653-4_4

CrossRef Полный текст | Google Scholar

Хантер, С., Апвейлер, Р., Этвуд, Т. К., Байрох, А., Бейтман, А., Binns, D., et al. (2009). Interpro: интегрированная база данных сигнатур белков. Нуклеиновые Кислоты Res . 37, D211 – D215. DOI: 10.1093 / nar / gkn785

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Цзян, Дж. К., и МакКуэй, Л. Дж. (2011). Прогнозирование функции белков с помощью коррелированного обучения с несколькими метками. IEEE / ACM Trans. Comput. Биол. Биоинформ . 9, 1059–1069. DOI: 10.1109 / TCBB.2011.156

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Джонс, П., Binns, D., Chang, H.-Y., Fraser, M., Li, W., McAnulla, C., et al. (2014). Интерпроскан 5: классификация функций белков в масштабе генома. Биоинформатика 30, 1236–1240. DOI: 10.1093 / биоинформатика / btu031

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Каханда, И., и Бен-Гур, А. (2017). «Gostruct 2.0: Автоматизированное предсказание функции белков для аннотированных белков», Труды 8-й Международной конференции ACM по биоинформатике, вычислительной биологии и медицинской информатике (Нью-Йорк, Нью-Йорк), 60–66.DOI: 10.1145 / 3107411.3107417

CrossRef Полный текст | Google Scholar

Кингма Д. П. и Ба Дж. (2014). Адам: Метод стохастической оптимизации. arXiv [препринт] arxiv : 1412.6980.

Google Scholar

Кирак, М., Озойоглу, Г. (2008). «Прогнозирование функции белков на основе паттернов в биологических сетях», Ежегодная международная конференция по исследованиям в области вычислительной молекулярной биологии (Берлин: Гейдельберг: Springer), 197–213.DOI: 10.1007 / 978-3-540-78839-3_18

CrossRef Полный текст | Google Scholar

Кулманов, М., Хан, М.А., Хендорф, Р. (2018). Deepgo: прогнозирование функций белка на основе последовательности и взаимодействий с использованием классификатора с глубокими онтологиями. Биоинформатика 34, 660–668. DOI: 10.1093 / биоинформатика / btx624

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Lai, H.-Y., Zhang, Z.-Y., Su, Z.-D., Su, W., Ding, H., Chen, W., et al. (2019).iproep: вычислительный предсказатель для предсказания промотора. Мол. Ther. Нуклеиновые кислоты 17, 337–346. DOI: 10.1016 / j.omtn.2019.05.028

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Ланчантин, Дж., Сингх, Р., Лин, З., и Ци, Ю. (2016). Глубокий мотив: визуализация классификации геномных последовательностей. arXiv [препринт] arxiv : 1605.01133.

Google Scholar

ЛеКун, Ю., Ботту, Л., Бенжио, Ю., и Хаффнер, П. (1998). Применение градиентного обучения для распознавания документов. Proc. IEEE 86, 2278–2324. DOI: 10.1109 / 5.726791

CrossRef Полный текст | Google Scholar

Lv, H., Zhang, Z.-M., Li, S.-H., Tan, J.-X., Chen, W., and Lin, H. (2019a). Оценка различных вычислительных методов идентификации сайтов 5-метилцитозина. Краткое. Биоинформ . DOI: 10.1093 / bib / bbz048

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Наир В., Хинтон Г. Э. (2010). «Выпрямленные линейные блоки улучшают ограниченные машины Больцмана», в Труды 27-й Международной конференции по машинному обучению (ICML-10), (Хайфа), 807–814.

Google Scholar

Нгуен, К. Д., Гардинер, К. Дж., И Чиос, К. Дж. (2011). Аннотации белков из сетей взаимодействия белков и генной онтологии. J. Biomed. Сообщите . 44, 824–829. DOI: 10.1016 / j.jbi.2011.04.010

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Radivojac, P., Clark, W. T., Oron, T. R., Schnoes, A. M., Wittkop, T., Sokolov, A., et al. (2013). Масштабная оценка предсказания вычислительной функции белка. Nat. Методы 10, 221–227. DOI: 10.1038 / Nmeth.2340

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Рифайоглу, А.С., Доган, Т., Мартин, М.Дж., Цетин-Аталай, Р., Аталай, В. (2019). Deepred: автоматическое предсказание функции белков с помощью многозадачных глубоких нейронных сетей с прямой связью. Sci. Репутация . 9, 1–16. DOI: 10.1038 / s41598-019-43708-3

CrossRef Полный текст | Google Scholar

Сёндерби, С. К., Сёндерби, К. К., Нильсен, Х., и Винтер, О. (2015). «Сверточные сети LSTM для субклеточной локализации белков», в Международной конференции по алгоритмам вычислительной биологии (Springer), 68–80. DOI: 10.1007 / 978-3-319-21233-3_6

CrossRef Полный текст | Google Scholar

Сёндерби, С. К., Винтер, О. (2014). Прогнозирование вторичной структуры белков с помощью сетей долгосрочной краткосрочной памяти. arXiv [препринт] arxiv : 1412.7828.

Google Scholar

Спенсер, М., Эйкхольт Дж. И Ченг Дж. (2014). Сетевой подход глубокого обучения к ab initio предсказанию вторичной структуры белка. IEEE / ACM Trans. Comput. Биол. Биоинформ . 12, 103–112. DOI: 10.1109 / TCBB.2014.2343960

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Шкларчик Д., Франческини А., Вайдер С., Форслунд К., Хеллер Д., Уэрта-Сепас Дж. И др. (2015). Строка v10: сети белок-белкового взаимодействия, интегрированные в древо жизни. Нуклеиновые Кислоты Res .43, D447 – D452. DOI: 10.1093 / nar / gku1003

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Tan, J.-X., Li, S.-H., Zhang, Z.-M., Chen, C.-X., Chen, W., Tang, H., et al. (2019). Идентификация гормонально-связывающих белков на основе методов машинного обучения. Math. Biosci. Eng . 16, 2466–2480. DOI: 10.3934 / mbe.2019123

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Ван Дж., Чжан Дж., Цай Ю. и Дэн Л. (2019a). Deepmir2go: определение функций микрорн человека с использованием модели глубокой классификации с несколькими метками. Внутр. J. Mol. Sci . 20: 6046. DOI: 10.3390 / ijms20236046

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Wang, L., Liu, Y., Zhong, X., Liu, H., Lu, C., Li, C., et al. (2019b). Dmfold: новый метод прогнозирования вторичной структуры РНК с помощью псевдоузлов, основанный на глубоком обучении и улучшенном принципе максимизации пары оснований. Фронт. Genet . 10: 143. DOI: 10.3389 / fgene.2019.00143

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Уивер Р.(2011). Молекулярная биология (WCB Cell и Молекулярная биология) . Нью-Йорк, Нью-Йорк: Образование Макгроу-Хилл.

Google Scholar

Вэй, Л., Дин, Ю., Су, Р., Тан, Дж., И Цзоу, К. (2018). Прогнозирование субклеточной локализации белков человека с помощью глубокого обучения. J. Parallel Distrib. Вычислить . 117, 212–217. DOI: 10.1016 / j.jpdc.2017.08.009

CrossRef Полный текст | Google Scholar

Янг, Дж., Ян, Р., Рой, А., Сюй, Д., Пуассон, Дж., и Чжан Ю. (2015). Пакет i-tasser: прогнозирование структуры и функции белков. Nat. Методы 12: 7. DOI: 10.1038 / nmeth.3213

PubMed Аннотация | CrossRef Полный текст | Google Scholar

You, R., Yao, S., Xiong, Y., Huang, X., Sun, F., Mamitsuka, H., et al. (2019). Netgo: улучшение крупномасштабного прогнозирования функции белков с помощью массивной сетевой информации. Нуклеиновые Кислоты Res . 47, W379 – W387. DOI: 10.1093 / nar / gkz388

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Ю, Р., Zhang, Z., Xiong, Y., Sun, F., Mamitsuka, H., and Zhu, S. (2018). Голабелер: улучшение предсказания крупномасштабной функции белка на основе последовательностей путем обучения ранжированию. Биоинформатика 34, 2465–2473. DOI: 10.1093 / биоинформатика / bty130

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Чжан К., Чжэн В., Фреддолино П. Л. и Чжан Ю. (2018). Метаго: Прогнозирование генной онтологии негомологичных белков с помощью предсказания структуры белка с низким разрешением и картирования белок-белковой сети. J. Mol. Биол . 430, 2256–2265. DOI: 10.1016 / j.jmb.2018.03.004

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Zhang, M.-L., and Zhou, Z.-H. (2013). Обзор алгоритмов многокомпонентного обучения. IEEE Trans. Знай. Data Eng . 26, 1819–1837. DOI: 10.1109 / TKDE.2013.39

CrossRef Полный текст | Google Scholar

Zhang, S., Zhou, J., Hu, H., Gong, H., Chen, L., Cheng, C., et al. (2016). Платформа глубокого обучения для моделирования структурных особенностей РНК-связывающих белков-мишеней. Нуклеиновые Кислоты Res . 44: e32. DOI: 10.1093 / nar / gkv1025

PubMed Аннотация | CrossRef Полный текст | Google Scholar

Zhu, X.-J., Feng, C.-Q., Lai, H.-Y., Chen, W., and Hao, L. (2019). Прогнозирование структурных классов белков для последовательностей с низким сходством путем оценки различных характеристик. Зн. На основе Syst . 163, 787–793. DOI: 10.1016 / j.knosys.2018.10.007

CrossRef Полный текст | Google Scholar

Ученые обнаружили эволюционную связь между структурой и функцией белка

  • Новое исследование Университета Иллинойса демонстрирует эволюцию структуры и функции белка в течение трех лет.8 миллиардов лет.
  • Фрагменты генетического кода, согласованные для разных организмов и времени, направляют белки к созданию «петель» или активных сайтов, которые наделяют белки их функциями.
  • Связь между структурой и функцией белков можно рассматривать как тип сети.
  • Демонстрация эволюции этой небольшой сети может помочь другим понять, как разные типы сетей, такие как Интернет или социальные сети, меняются с течением времени.

УРБАНА, штат Иллинойс. — Белки — это больше, чем просто диетическая потребность. Этот разнообразный набор молекул обеспечивает почти все клеточные операции в живом организме. Ученые могут знать структуру белка или его функцию, но не всегда могут связать их между собой.

«Большой проблемой в биологии является вопрос о том, как белок делает то, что он делает. Мы думаем, что ответ кроется в эволюции белка », — говорит профессор Иллинойского университета и специалист по биоинформатике Густаво Каэтано-Аноллес.

Геологи обнаружили остатки жизни, сохранившиеся в горных породах возрастом в миллиарды лет. В некоторых случаях сохранность микробов и тканей была настолько хорошей, что можно было обнаружить микроскопические клеточные структуры, которые когда-то были связаны со специфическими белками. Эта геологическая летопись дает ученым скрытую связь с эволюционной историей белковых структур на протяжении невероятно долгих периодов времени. Но до сих пор не всегда было возможно связать функцию с этими структурами, чтобы узнать, как белки вели себя в клетках миллиарды лет назад по сравнению с сегодняшним днем.

«Впервые мы проследили эволюцию в биологической сети», — отмечает Каэтано-Аноллес.

Каэтано-Аноллес и аспиранты Файез Азиз и Келси Каэтано-Аноллес использовали сети для исследования связи между структурой белка и молекулярной функцией. Они построили временную шкалу белковых структур, охватывающую 3,8 миллиарда лет в геологической летописи, но нуждались в способе связать структуры с их функциями. Для этого они изучили генетический состав сотен организмов.

«Оказывается, в наших генах есть небольшие фрагменты, которые невероятно сохраняются с течением времени», — говорит Каэтано-Аноллес. «И не только в геномах человека. Когда мы смотрим на высшие организмы, такие как растения, грибы и животные, а также на бактерии, археи и вирусы, всегда присутствуют одни и те же фрагменты. Мы видим их снова и снова ».

Исследовательская группа обнаружила, что эти крошечные генные сегменты сообщают белкам о создании «петель», которые представляют собой мельчайшие структурные единицы в белке.Когда петли собираются вместе, они создают активные центры или молекулярные карманы, которые обеспечивают белкам их функции. Например, гемоглобин, белок, переносящий кислород в крови, имеет две петли, которые создают активный центр, связывающий кислород. Петли объединяются, чтобы создать более крупные белковые структуры, называемые доменами.

Примечательно, что новое исследование показывает, что петли неоднократно использовались для выполнения новых функций и что этот процесс был активным и продолжался с самого начала жизни.

«Этот набор важен для понимания биологического разнообразия», — говорит Каэтано-Аноллес.

Один из важных аспектов исследования касается фактической связи между доменной структурой и функциональными петлями. Исследователи обнаружили, что эта связь характеризуется неожиданным свойством, которое раскрывается во времени, «возникающим» свойством, известным как иерархическая модульность.

«Петли — это связные модули, как и домены, белки, клетки, органы и тела.- объясняет Каэтано-Аноллес. «Мы все состоим из связанных модулей, в том числе наши человеческие тела. Это иерархическая модульность: объединение небольших связанных частей в более крупные и все более сложные целые ».

Иерархическая модульность также существует в искусственных сетях, таких как Интернет. Например, каждый маршрутизатор представляет собой «узел», который передает информацию на разные компьютеры. Когда миллионы компьютеров взаимодействуют друг с другом в сети, возникают более крупные и сложные объекты. Каэтано-Аноллес предполагает, что эволюцию искусственно созданных сетей можно нанести на карту таким же образом, как и эволюцию биологических сетей.

«С точки зрения информатики, мало кто изучает, как отслеживать сети во времени. Представьте, что вы изучаете, как Интернет растет и изменяется, когда добавляются новые маршрутизаторы, отключаются или соединяются друг с другом в сети. Это непростая задача, потому что нужно отслеживать миллионы маршрутизаторов, а интернет-коммуникация может быть очень динамичной. В нашем исследовании мы демонстрируем, как это можно сделать с помощью очень маленькой сети », — объясняет Каэтано-Аноллес.

Методы, разработанные Каэтано-Аноллесом и его командой, теперь могут объяснить, как изменения способны структурировать такие разнообразные системы, как Интернет, социальные сети или совокупность всех белков в организме.

Статья «Ранняя история и появление молекулярных функций и поведения модульной безмасштабной сети» опубликована в журнале Scientific Reports . Соавторами отчета выступили М. Файез Азиз и Келси Каэтано-Аноллес, также из Университета Иллинойса. Полный текст статьи можно найти по адресу: http://www.nature.com/articles/srep25058.

Структура и функции: Whitford, David: 9780471498940: Amazon.com: Books

«… Бесценный ресурс… студенты факультетов биохимии, химии, генетики, структурной биологии, а также студенты-медики и стоматологи получат большую пользу от чтения этого текста…» ( Annals of Biomedical Engineering , декабрь 2005 г.)

«… стоящие инвестиции для начинающих студентов или для продвинутых ученых, которые хотят лучше понять химию белков… »( Clinical Chemistry , ноябрь 2005 г.)

« Замечательный ресурс для вводных курсов по химии белков и надежный справочник для тех, кто интересуется белками.»( CHOIC E, ноябрь 2005 г.)

«… квинтэссенция лет чтения лекций и отзывов студентов. «( Journal of Biological Education, Spring 2006: Vol.40; 2)

Структура и функция белка — это всестороннее введение в изучение белков и их важность для современной биохимии. Каждая глава посвящена структуре и функциям белков с определенной темой, призванной улучшить понимание учащимися. Открываясь кратким историческим обзором предмета, книга переходит к обсуждению «строительных блоков» белков и их соответствующих химических и физических свойств.В последующих главах исследуются экспериментальные и вычислительные методы сравнения белков, методы очистки белков, а также фолдинг и стабильность белков.

Включены последние разработки в этой области, а ключевые концепции представлены в удобном для пользователя виде, чтобы студенты могли усвоить основы, прежде чем переходить к более углубленному изучению и анализу белков.

Бесценный ресурс для студентов факультетов биохимии, молекулярной биологии, медицины и химии, обеспечивающий современный подход к предмету «Белки».

  • Доступное введение в принципы структуры и функции белков.
  • Красиво иллюстрировано в полном цвете.
  • Включает проблемы в конце главы, ссылки на дополнительную литературу и полный глоссарий терминов.
  • Связанный веб-сайт, включающий веб-руководства, проблемы и дополнительный контент.

С задней обложки

Структура и функция белка — это всестороннее введение в изучение белков и их важность для современной биохимии.Каждая глава посвящена структуре и функциям белков с определенной темой, призванной улучшить понимание учащимися. Открываясь кратким историческим обзором предмета, книга переходит к обсуждению «строительных блоков» белков и их соответствующих химических и физических свойств. В последующих главах исследуются экспериментальные и вычислительные методы сравнения белков, методы очистки белков, а также фолдинг и стабильность белков.

Включены последние разработки в этой области, а ключевые концепции представлены в удобном для пользователя виде, чтобы студенты могли усвоить основы, прежде чем переходить к более углубленному изучению и анализу белков.

Бесценный ресурс для студентов факультетов биохимии, молекулярной биологии, медицины и химии, обеспечивающий современный подход к предмету «Белки».

  • Доступное введение в принципы структуры и функции белков.
  • Красиво иллюстрировано в полном цвете.
  • Включает проблемы в конце главы, ссылки на дополнительную литературу и полный глоссарий терминов.
  • Связанный веб-сайт, включающий веб-руководства, проблемы и дополнительный контент.

Об авторе

Дэвид Уитфорд , Queen Mary & Westfield College, Лондон, Великобритания.

Какие примеры функции белков?

Сводка таблицы:

1) Ферменты. Каждый процесс, происходящий в организме, в какой-то момент или полностью включает химическую реакцию. Химические реакции протекают в соответствии с физическим законом, известным как свободная энергия Гиббса. Этот закон гласит, что для протекания химической реакции в систему должна быть вложена энергия.Количество энергии, необходимое для начала реакции, называется «энергией активации». Эта энергия активации не всегда доступна; этот тип реакции не является спонтанным. Вот почему существует ферментов . Ферменты катализируют реакцию, что означает, что они ускоряют ее и позволяют ей протекать быстрее, чем это могло бы произойти спонтанно.

а. Фермент — это специализированный белок, который снижает энергию активации . Он не добавляет энергии системе, он уменьшает количество энергии, необходимое для начала реакции.Особое внимание следует уделить тому факту, что требования снижены, поскольку именно здесь студенты часто ошибаются. (Ферменты не добавляют энергии реакции ).

Ферменты понижающие энергию активации:

Ферменты снижают энергию активации, необходимую для реакции, связываясь со своим «субстратом» (молекулой, с помощью которой ферменты участвуют в реакции). Субстраты обычно подходят для определенных ферментов, что делает ферменты очень точными инструментами.

Примечание: фермент может иметь более одного субстрата.

В химических реакциях ничего не может произойти, пока молекулы не окажутся в непосредственной близости друг от друга. Следовательно, ферменты снижают энергию активации, связываясь с двумя соединениями, которые необходимы для химической реакции, — объединяя их. Это значительно увеличивает продуктивность клетки, так как избавляет от необходимости ждать, пока молекулы «столкнутся» друг с другом.

Примечание: если бы все реакции, необходимые для жизни, протекали без ферментов, даже самые простые бактерии не смогли бы выжить! Ферменты абсолютно необходимы.

Есть и другие способы, которыми фермент может способствовать реакции. Один из таких механизмов заключается в связывании с субстратом и последующем вскрытии субстрата, чтобы обнажить его функциональные группы. Это позволяет протекать реакции, которая обычно вообще не протекает (из-за закупоренного участка реакции).

2) Структурные белки. Ферменты включают большую часть функциональных белков, но белки также могут быть использованы во многих других областях. Например, клетки и ткани не могут поддерживать свою структуру без структурных белков .Коллаген — хорошо известный структурный белок. Этот белок часто находится во внеклеточном матриксе (пространстве за пределами клетки), удерживающем вместе такие вещи, как сухожилия и связки.

Другой структурный белок, обнаруженный в организме человека, называется актин. Это жизненно важная часть цитоскелета наших клеток, поэтому она очень важна для их формы и конформации.

3) Транспортные белки. Кислород, гормоны и многие другие вещества не могут перемещаться по телу без посторонней помощи.Для этого очень пригодятся транспортные белки. Думайте о них как о такси. Иногда человек оказывается в незнакомом месте и не может добраться до желаемого. Итак, он вызывает такси. Транспортные белки — это кабины. Кислород не может свободно плавать в крови человека по разным причинам, поэтому белок, называемый гемоглобином, связывается с ним и доставляет его к месту назначения.

4) Моторные белки. Мышцы важны, потому что они работают вместе, чтобы производить сложные движения.Эти движения были бы невозможны без существования моторных белков . Белки, такие как миозин, способны изменять свою конформацию в ответ на химический стимул, позволяя клеткам, обладающим ими, изменять свою форму. Так они ускоряют свое положение в трехмерном пространстве.

5) Белки хранения. Некоторые вещества, от которых зависит выживание нашего организма, опасны для окружающих тканей, если их беспрепятственно дрейфовать.Для этого существует запасных белков . Например, железо хранится в печени с помощью белка, известного как ферритин.

6) Сигнальные белки. Гормональная система организма функционирует как очень сложная почтовая система. Сигнальные белки , часто гормоны, представляют собой специализированные соединения, синтезированные для отправки сообщения в определенное или обширное место. Некоторые сигнальные белки посылают сообщение каждой клетке тела, а некоторые настолько специфичны, что их может распознать только один тип клеток.Эти белки несут команды, такие как фактор роста нервов ( NGF ), эпидермальный фактор роста ( EGF ) и многие другие.

7) Рецепторных белков. Если есть сигнальные белки, должен быть кто-то, кто их получит. Хорошо известным примером является рецептор ацетилхолина , обнаруженный в мышечных клетках в нервно-мышечных соединениях. Они содержат определенные конформации, способные распознавать определенные сигнальные белки.

8) Генные регуляторные белки. Экспрессия гена очень сложна; он регулируется белками, редактируется, иногда повреждается, повторно редактируется и иногда заглушается. Чтобы ген мог правильно транскрибироваться РНК-полимеразой, необходимо определенное направление. Если бы все гены экспрессировались одновременно, биологические организмы действительно были бы скоплением белков!

Чтобы исправить это, клетка использует белки, называемые регуляторными белками . Они связываются с молекулой ДНК и делают одно из двух: активируют экспрессию генов или подавляют ее.Бактерии содержат репрессор лактозы, который предотвращает экспрессию фермента, необходимого для катаболизма лактозы, когда такой сахар недоступен. Точно так же существуют белки, которые связываются с цепью ДНК, когда необходимо экспрессировать определенный ген — обычно это выполняется белком, участвующим в пути передачи сигнала.

Регуляторный белок, ингибирующий или отключающий ген:

9) Разное. Как было сказано выше, клетки обладают гораздо большим количеством белков, чем просто восемь категорий.Однако, помимо восьми широких категорий, белки, которые не входят в границы, обычно создаются специально для клетки / организма, которые их содержат. У некоторых медуз, например, есть белок, называемый , зеленый флуоресцентный белок ( GFP ), который придает им мистические, зеленые, светящиеся в темноте свойства.

Этот список ссылается на учебник под названием Essential Cell Biology, Fourth Edition во всем своем составе. Основная часть материала была найдена на странице 122.Среди авторов этой книги: Брюс Альбертс, Деннис Брей, Карен Хопкин, Александр Джонсон, Джулиан Льюис, Мартин Рафф, Кейт Робертс и Питер Уолтер. Для дальнейшего чтения этот учебник можно приобрести в Google Книгах [здесь]
(https://play.google.com/store/books/details/Bruce_Alberts_Essential_Cell_Biology_Fourth_Editio?id=Cg4WAgAAQBAJ).

Центр структуры и функций белков

Центр структуры и функций белков был основан в 2000 году на сумму 9,6 долларов США.
млн. грант COBRE от Национального исследовательского центра Национальных институтов здравоохранения
Ресурсы.Поддержка Центра была продолжена в 2005 году в виде гранта в размере 10,2 млн долларов США от
NIH NCRR, а также многочисленные другие гранты преподавателям Центра.

Центр изучения структуры и функции белка IDeA COBRE Университета Арканзаса NIH IDeA COBRE
была создана на период с 01.09.2000 по 31.08.2010 с COBRE Phase I / II NIH NCRR
Грант 1 P20 15 569 рупий на сумму 19,8 млн долларов США, срок действия — 01.09.2010 — 31.05.2015 с
NIH COBRE Phase III предоставляет 1P30RR031154 и 8P30GM103450 за 5 долларов.4 миллиона.

Белки выполняют почти всю работу в клетках нашего тела, начиная от функции мозга.
и нервная передача для выработки метаболической энергии и мышечного сокращения. Кроме того,
большинство заболеваний связано с нарушением функции белков. Будущие достижения в
понимание, диагностика и лечение болезней человека будут зависеть от лучшего
понимание структур, функций и взаимодействий тысяч белков
которые закодированы в геномах человека и патогенов человека.Такое понимание
появятся в результате подробных исследований молекулярной структуры и функции
белки, которые играют важную роль в заболеваниях человека.

Члены Центра COBRE Университета Арканзаса по структуре и функциям белков
стремятся внести значительный вклад в это фундаментальное понимание через междисциплинарные
исследовательские проекты с использованием новейших методов и оборудования.Центр
добилась отличных успехов с момента своего основания в октябре 2000 года, в результате чего
более 80 миллионов долларов США — это внешняя грантовая поддержка, включая 37 грантов NIH и 28 NSF,
Гранты DOE и EPA. Были наняты пятнадцать выдающихся новых преподавателей, и основные
оборудование в спектроскопии ЯМР, рентгеновской кристаллографии, масс-спектрометрии, крупномасштабных
налажено производство белка и химический синтез.

Центр COBRE проводит многочисленные биомедицинские исследовательские проекты, важные для
здоровье человека, в том числе разработка новых методов лечения остеопороза, гепатита
C, вирус гриппа, рак и болезни сердца. Например, цель одного проекта
заключается в разработке и тестировании слитого паратироидного гормона и белка связывающего коллаген домена
для лечения остеопороза.

Центр поддерживает междисциплинарные исследовательские проекты с участием более 30 преподавателей.
членов и 50 аспирантов на трех разных факультетах.

Фрэнк Миллетт, директор CPSF
Департамент химии и биохимии
Арканзасский университет
Фейетвилл, Арканзас 72701

Электронная почта: millett @ uark.edu
Телефон: 479-575-4999

страница не найдена — Williams College

’62 Центр театра и танца, ’62 Центр
Касса 597-2425
Магазин костюмов 597-3373
Менеджер мероприятий / Помощник менеджера 597-4808 597-4815 факс
Производство 597-4474 факс
Магазин сцен 597-2439
’68 Центр карьерного роста, Мирс 597-2311 597-4078 факс
Academic Resources, Парески 597-4672 597-4959 факс
Служба поддержки инвалидов, Парески 597-4672
Прием, Вестон Холл 597-2211 597-4052 факс
Программа позитивных действий, Хопкинс-холл, 597-4376
Africana Studies, Hollander 597-2242 597-4222 факс
Американские исследования, Шапиро 597-2074 597-4620 факс
Антропология и социология, Холландер 597-2076 597-4305 факс
Архивы и специальные коллекции, Sawyer 597-4200 597-2929 факс
Читальный зал 597-4200
Искусство (История, Студия), Spencer Studio Art / Lawrence 597-3578 597-3693 факс
Архитектурная студия, Spencer Studio Art 597-3134
Фотография Студия, Spencer Studio Art 597-2030
Printmaking Studio, Spencer Studio Art 597-2496
Скульптурная студия, Spencer Studio Art 597-3101
Senior Studio, Spencer Studio Art 597-3224
Видео / Фотостудия, Spencer Studio Art 597-3193
Asian Studies, Hollander 597-2391 597-3028 факс
Астрономия / Астрофизика, Thompson Physics 597-2482 597-3200 факс
Департамент легкой атлетики, физическое воспитание, отдых, Ласелл 597-2366 597-4272 факс
Спортивный директор 597-3511
Boat House, Озеро Онота 443-9851
Автобусы 597-2366
Фитнес-центр 597-3182
Hockey Rink Ice Line, Lansing Chapman 597-2433
Intramurals, Атлетический центр Чандлера 597-3321
Физическая культура 597-2141
Pool Wet Line, Атлетический центр Чандлера 597-2419
Sports Information, Hopkins Hall 597-4982 597-4158 факс
Спортивная медицина 597-2493 597-3052 факс
Площадки для игры в сквош 597-2485
Поле для гольфа Taconic 458-3997
Биохимия и молекулярная биология, Thompson Biology 597-2126
Биоинформатика, геномика и протеомика, Bronfman 597-2124
Биология, Thompson Biology 597-2126 597-3495 факс
Охрана и безопасность кампуса, Хопкинс-холл 597-4444 597-3512 факс
Карты доступа / системы сигнализации 597-4970 / 4033
Escort Service, Hopkins Hall 597-4400
Офицеры и диспетчеры 597-4444
Секретарь, удостоверения личности 597-4343
Коммутатор 597-3131
Центр развития творческого сообщества, 66 Stetson Court 884-0093
Центр экономики развития, 1065 Main St 597-2148 597-4076 факс
Компьютерный зал 597-2522
Вестибюль 597-4383
Центр экологических исследований, класс 1966 г. Экологический центр 597-2346 597-3489 факс
Лаборатория наук об окружающей среде, Морли 597-2380
Экологические исследования 597-2346
Лаборатория ГИС 597-3183
Центр иностранных языков, литератур и культур, Холландер 597-2391 597-3028 факс
Арабоведение, Холландер 597-2391 597-3028 факс
Сравнительная литература, Холландер 597-2391
Критические языки, Hollander 597-2391 597-3028 факс
лингафонный кабинет 597-3260
Россия, Холландер 597-2391
Центр обучения в действии, Brooks House 597-4588 597-3090 факс
Библиотека редких книг Чапина, Сойер 597-2462 597-2929 факс
Читальный зал 597-4200
Офис капелланов, Парески 597-2483 597-3955 факс
Еврейский религиозный центр, Стетсон-Корт 24, 597-2483
Мусульманская молитвенная комната, часовня Томпсона (нижний уровень) 597-2483
Католическая часовня Ньюмана, часовня Томпсона (нижний уровень) 597-2483
Chemistry, Thompson Chemistry 597-2323 597-4150 факс
Классика (греческий и латинский), Hollander 597-2242 597-4222 факс
Когнитивная наука, Бронфман 597-4594
College Marshal, Thompson Physics 597-2008
Отношения с колледжем 597-4057
Программа 25-го воссоединения, Фогт 597-4208 597-4039 факс
Программа 50-го воссоединения, Фогт 597-4284 597-4039 факс
Advancement Operations, Мирс-Вест 597-4154 597-4333 факс
Мероприятия для выпускников, Vogt 597-4146 597-4548 факс
Фонд выпускников 597-4153 597-4036 факс
Связи с выпускниками, Мирс Вест 597-4151 597-4178 факс
Alumni / Development Mail Services, Мирс-Уэст 597-4369
Разработка, Vogt 597-4256
Отношения с донорами, Vogt 597-3234 597-4039 факс
Офис по планированию подарков, Vogt 597-3538 597-4039 факс
Grants Office, Mears West 597-4025 597-4333 факс
Программа крупных подарков, Vogt 597-4256 597-4548 факс
Parents Fund, Vogt 597-4357 597-4036 факс
Prospect Management & Research, Мирс 597-4119 597-4178 факс
Начало занятий и академические мероприятия, Jesup 597-2347 597-4435 факс
Communications, Hopkins Hall 597-4277 597-4158 факс
Sports Information, Hopkins Hall 597-4982 597-4158 факс
Web Team, Southworth Schoolhouse
Williams Magazines (ранее Alumni Review), Hopkins Hall 597-4278
Компьютерные науки, Thompson Chemistry 597-3218 597-4250 факс
Conferences & Events, Парески 597-2591 597-4748 факс
Запросы Elm Tree House, Mt.Ферма Надежды, 597-2591
Офис контролера, Хопкинс Холл 597-4412 597-4404 факс
Accounts Payable & Data Entry, Hopkins Hall 597-4453
Bursar & Cash Receipts, Hopkins Hall 597-4396
Financial Information Systems, Hopkins Hall 597-4023
Purchasing Cards, Hopkins Hall 597-4413
Студенческие ссуды, Хопкинс Холл 597-4683
Dance, 62 Центр 597-2410
Davis Center (ранее Multicultural Center), Jenness 597-3340 597-3456 факс
Харди Хаус 597-2129
Jenness House 597-3344
Rice House 597-2453
Декан колледжа, Hopkins Hall 597-4171 597-3507 факс
Декан факультета Хопкинс Холл 597-4351 597-3553 факс
Столовая, капельницы 597-2121 597-4618 факс
’82 Гриль, Парески 597-4585
Кондитерская, Парески 597-4511
Общественное питание, Дом факультета 597-2452
Driscoll Dining Hall, Дрисколл 597-2238
Eco Café, Научный центр 597-2383
Grab ‘n Go, Парески 597-4398
Lee Snack Bar, Парески 597-3487
Обеденный зал Mission Park, Mission Park 597-2281
Whitmans ‘, Paresky 597-2889
Economics, Schapiro 597-2476 597-4045 факс
Английский, Холландер 597-2114 597-4032 факс
Сооружения, служебное здание 597-2301
College Car Request 597-2302
Скорая помощь вечером / в выходные дни 597-4444
Запросы на работу производственных помещений 597-4141 факс
Особые мероприятия 597-4020
Кладовая 597-2143 597-4013 факс
Клуб преподавателей, Дом факультетов / Центр выпускников 597-2451 597-4722 факс
Бронирование 597-3089
Fellowships Office, Hopkins Hall 597-3044 597-3507 факс
Financial Aid, Weston Hall 597-4181 597-2999 факс
Geosciences, Clark Hall 597-2221 597-4116 факс
Немецко-русский, Hollander 597-2391 597-3028 факс
Global Studies, Hollander 597-2247
Программа магистратуры по истории искусств, Кларк 458-2317 факс
Службы здравоохранения и хорошего самочувствия, Thompson Ctr Health 597-2206 597-2982 факс
Медицинское просвещение 597-3013
Услуги интегративного благополучия (консультирование) 597-2353
Чрезвычайные ситуации с опасностью для жизни Позвоните 911
Медицинские услуги 597-2206
История, Холландер 597-2394 597-3673 факс
История науки, Бронфман 597-4116 факс
Хопкинс Форест 597-4353
Розенбург Центр 458-3080
Отдел кадров, B&L Building 597-2681 597-3516 факс
Услуги няни, корпус B&L 597-4587
Льготы 597-4355
Программа помощи сотрудникам 800-828-6025
Занятость 597-2681
Заработная плата 597-4162
Ресурсы для супруга / партнера 597-4587
Занятость студентов 597-4568
Погодная линия (ICEY) 597-4239
Humanities, Schapiro 597-2076
Информационные технологии, Jesup 597-2094 597-4103 факс
Пакеты для чтения курса, Drop Box для офисных услуг 597-4090
Центр кредитования оборудования, приложение Додда 597-4091
Служба поддержки преподавателей / сотрудников, [электронная почта] 597-4090
Медиауслуги и справочная информация в классе 597-2112
Служба поддержки студентов, [электронная почта] 597-3088
Телекоммуникации / Телефоны 597-4090
Междисциплинарные исследования, Hollander 597-2552
Международное образование и учеба, Хопкинс Холл 597-4262 597-3507 факс
Инвестиционный офис, Хопкинс Холл 597-4447
Бостонский офис 617-502-2400 617-426-5784 факс
Еврейские исследования, Мазер 597-3539
Правосудие и закон, Холландер 597-2102
Latina / o Studies, Hollander 597-2242 597-4222 факс
Исследования лидерства, Шапиро 597-2074 597-4620 факс
Морские исследования, Бронфман 597-2297
Математика и статистика, Bascom 597-2438 597-4061 факс
Музыка, Бернхард 597-2127 597-3100 факс
Concertline (записанная информация) 597-3146
Неврология, Thompson Biology 597-4107 597-2085 факс
Окли Центр, Окли 597-2177 597-4126 факс
Управление институционального разнообразия и справедливости, Hopkins Hall 597-4376 597-4015 факс
Управление счетов студентов, Хопкинс-холл 597-4396 597-4404 факс
Performance Studies, ’62 Center 597-4366
Философия, Шапиро 597-2074 597-4620 факс
Физика, Thompson Physics 597-2482 597-4116 факс
Планетарий / Обсерватория Хопкинса 597-3030
Old Hopkins Observatory Theater 597-4828
Бронирование 597-2188
Политическая экономия, Шапиро 597-2327
Политология, Шапиро 597-2168 597-4194 факс
Офис президента, Хопкинс Холл 597-4233 597-4015 факс
Дом Президента 597-2388 597-4848 факс
Услуги печати и почты для преподавателей / сотрудников, ’37 House 597-2022
Программа обучения, Бронфман 597-4522 597-2085 факс
Офис Провоста, Хопкинс Холл 597-4352 597-3553 факс
Психология, психологические кабинеты и лаборатории 597-2441 597-2085 факс
Недвижимость, B&L Building 597-2195 / 4238 597-5031 факс
Ипотека для преподавателей / сотрудников 597-4238
Аренда жилья для преподавателей / сотрудников 597-2195
Офис регистратора, Хопкинс Холл 597-4286 597-4010 факс
Религия, Холландер 597-2076 597-4222 факс
Romance Languages, Hollander 597-2391 597-3028 факс
Планировщик помещений 597-2555
Соответствие требованиям безопасности и охраны окружающей среды, класс ’37, дом 597-3003
Библиотека Сойера, Сойер 597-2501 597-4106 факс
Службы доступа 597-2501
Приобретения / Серийные номера 597-2506
Каталогизация / Службы метаданных 597-2507
Межбиблиотечный абонемент 597-2005 597-2478 факс
Исследовательские и справочные службы 597-2515
Стеллаж 597-4955 597-4948 факс
Системы 597-2084
Научная библиотека Шоу, Научный центр 597-4500 597-4600 факс
Исследования в области науки и технологий, Бронфман 597-2239
Научный центр, Бронфман 597-4116 факс
Магазин электроники 597-2205
Станочно-модельный цех 597-2230
Безопасность 597-4444
Специальные академические программы, Харди 597-3747 597-4530 факс
Sports Information, Hopkins Hall 597-4982 597-4158 факс
Студенческая жизнь, Парески 597-4747
Планировщик помещений 597-2555
Управление студенческими центрами 597-4191
Организация студенческих мероприятий 597-2546
Студенческий дом, Парески 597-2555
Вовлеченность студентов 597-4749
Программы проживания для старших классов 597-4625
Студенческая почта, Парески, 597-2150
Устойчивое развитие / Центр Зилха, Харпер 597-4462
Коммутатор, Хопкинс Холл 597-3131
Книжный магазин Уильямса 458-8071 458-0249 факс
Театр, 62 Центр 597-2342 597-4170 факс
Trust & Estate Administration, Sears House 597-4259
Учебники 597-2580
VP for Campus Life, Hopkins Hall 597-2044 597-3996 факс
Вице-президент по связям с колледжем, Мирс 597-4057 597-4178 факс
Вице-президент по финансам и администрированию, Hopkins Hall 597-4421 597-4192 факс
Центр визуальных ресурсов, Лоуренс 597-2015 597-3498 факс
Детский центр Williams College, Детский центр Williams 597-4008 597-4889 факс
Музей искусств колледжа Уильямс (WCMA), Лоуренс 597-2429 597-5000 факс
Подготовка музея 597-2426
Служба безопасности музея 597-2376
Музейный магазин 597-3233
Уильямс Интернэшнл 597-2161
Williams Outing Club, Парески 597-2317
Оборудование / стол для студентов 597-4784
Williams Project on Economics of Higher Education, Mears West 597-2192
Williams Record, Парески 597-2400 597-2450 факс
Программа Уильямса-Эксетера в Оксфорде, Оксфордский университет 011-44-1865-512345
Программа Williams-Mystic, Mystic Seaport Museum 860-572-5359 860-572-5329 факс
Исследования женщин, гендера и сексуальности, Schapiro 597-3143 597-4620 факс
Написание программ, Hopkins Hall 597-4615
Центр экологических инициатив «Зилха», Харпер 597-4462

Шаг 3c: Функция белка

Как хвост светлячка светит (необязательно)

Это видео дает краткий обзор синтеза белка, от гена до функционального белка, на примере люциферазы светлячка.

Если ваши ученики не знакомы со светлячками, сначала покажите им видео «Фейерверк природы» (найдите поле «Что такое светлячки?» На веб-странице, ссылка на которую приведена ниже).

Спроектируйте видео для всего класса.

  • Через белки информация в генах формирует характеристики на клеточном, тканевом и организменном уровнях.
  • Клетки производят определенные белки, считывая генетический код определенных генов.

Структура и функции

Учащиеся видят реальный пример, демонстрирующий взаимосвязь между геном, белком, который он кодирует, и его функцией в организме.

5 минут

Как хвост светлячка делает свет (видео)

Что такое белки?

Это видео знакомит со структурой и разнообразием белков.

Спроектируйте видео для всего класса.

  • Белки состоят из аминокислот.
  • Различные комбинации аминокислот образуют разные белки.

5-10 минут

Проверка активности белка

В этом интерактивном интерактивном режиме учащиеся перетаскивают мышью, чтобы узнать, как форма белка может повлиять на его функцию в клетке.

Предложите учащимся изучить индивидуально или в парах.

  • Для выполнения своей работы белки физически взаимодействуют друг с другом и с другими молекулами.
  • Форма белка влияет на его функцию.

Структура и функции

Учащиеся видят реальный пример белка, узнают о его работе в клетке и видят, как различия в структуре белка влияют на его функцию.

20-30 минут

Компьютеры с доступом в Интернет

Проверить активность белка

Классический vs.Молекулярная генетика

Этот интерактивный онлайн-курс объединяет классические и молекулярные аспекты генетики. Изучая знакомые термины и примеры, он описывает, чем эти два представления различаются, а также как они связаны.

Предложите учащимся изучить индивидуально или в парах.

Молекулярная генетика предлагает подробное объяснение тех же явлений, которые наблюдали классические генетики.

20 минут

Компьютеры с доступом в Интернет

Classical vs.Молекулярная генетика (интерактивная)

Доминантная / рецессивная проблема

С точки зрения молекулярной генетики оба аллеля гена вносят вклад в фенотип, что делает термины «доминантный» и «рецессивный» проблематичными. Более полное понимание закономерностей наследования может прийти через понимание того, что происходит на уровне белка. Узнайте больше в этом коротком видео.

Спроектируйте видео для всего класса.

  • Все аллели гена вносят вклад в фенотип.

10-20 минут

Доминантная / рецессивная проблема

Результат мутации

Как различие в последовательности ДНК гена приводит к различию наблюдаемых признаков? В этой статье исследуются 8 реальных примеров изменений в структуре и / или функции белка, которые приводят к совершенно разным характеристикам.

Проект на весь класс. Пройдите и обсудите несколько примеров.

  • Вариации в последовательностях ДНК приводят к вариациям белков, которые приводят к вариациям признаков.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *