Протеомика и фосфопротеомика в медицине - блог доктора Минутко

     Термин "точная медицина" относится к использованию диагностических, терапевтических и мониторинговых стратегий для отдельных пациентов на основе их молекулярных профилей. В медицине (на практике)  фокус исследований  сосредоточен главным образом на стратификации болезней на подтипы, основанные на молекулярных биомаркерах или сигнатур, т.е. в молекулярной таксономии болезни. Цель современного врача состоит в том, чтобы использовать эти сигнатуры для назначения правильного лечения пациентам, распределения их  в определенные подгруппы заболеваний и назначения наиболее эффективной терапии для каждого пациента. Обширная молекулярная характеристика признаков экспрессии генов при раке молочной железы позволила разработать мультигенные анализы, которые в настоящее время проходят клинические испытания для рутинного использования в клинике с целью руководства лечением пациентов и мониторинга.

     В большинстве работ по молекулярной характеристике заболеваний используются геномные методологии для идентификации генетических вариантов, в том числе вариаций числа копий и дифференциальной экспрессии генов, связанных с конкретными подтипами заболевания.  В одном из последних метаанализов  исследования первой фазы для лечения рефрактерных злокачественных новообразований исследователи  обнаружили, что, хотя частота ответов с использованием «прецизионного» биомаркера была значительно выше, чем при его отсутствии, медианный показатель ответа все еще составлял только ∼30%. Системная биология показала, что фокусирование только на геномном и транскриптомном уровнях регуляции клеточных функций делает нас слепыми к другим важным регуляторам клеточных фенотипов и результатов. Например, данные метаболомики предоставляют информацию, касающуюся метаболизма и регуляции энергетического баланса клетки, а эпигеномика может отражать регуляцию экспрессии гена и влияние факторов окружающей среды на клетку.

         Хорошо известно, что изменения в экспрессии генов не всегда отражают изменения в содержании белка. Белки являются основными факторами, влияющими на функции клеток, благодаря изменениям их посттрансляционных модификаций и их распространенности, что отражается также на изменениях их интерактома с влиянием на фенотипы клеток. Поэтому очень важно также учитывать протеомику, фосфопротеомику и другие наборы данных PTM-'omics 'в исследованиях для того , чтобы понять развитие и подтипы заболевания, поскольку они могут лучше отражать функциональное состояние и динамические свойства клетки.

     Последние достижения в области протеомики позволяют точно измерять содержание тысяч белков и фосфопротеинов из нескольких образцов параллельно. Таким образом, впервые у нас появилась  возможность систематически измерять протеомные профили тысяч образцов пациентов или клеточных линий модели заболевания, выявлять точный лежащий в их основе молекулярный механизм,  открывать персонализированные биомаркеры, сети и методы лечения. В этой заметкерассматриваются примеры успешного использования наборов данных протеомики и фосфопротеомики, а также их интеграции с другими наборами данных различных омик для точной медицины. Здесь также обусждаются  проблемы биоинформатики, анализ и интеграция таких больших наборов данных и потенциальные причины, по которым профилирование протеомики и биомаркеры в настоящее время широко не используются в клинических условиях. Однако эти наборы данных не были использованы в области точной медицины из-за времени, необходимого для отбора, сложности и динамического диапазона образцов протеомики, отсутствия воспроизводимости среди лабораторий, различий между методами количественного определения и другими смешанными факторами. 

      В последнее время технологические разработки в области приборостроения, подготовки проб и анализа данных и инициативы по разработке стандартов для сбора и оценки этих данных привели к появлению высококачественной, воспроизводимой и всеобъемлющей протеомики  и созданию протоколов для генерации таких данных. Исследователи смогли обнаружить 50 000 фосфопептидов в одной линии раковых клеток человека, и теперь ученые могут регулярно и точно измерять тысячи пептидов в короткие сроки. Hebert et al. ( 2014) смогли измерить весь протеом дрожжей, содержащий пептиды из белков 803980, всего за 1 час.  Сотни целевых и глобальных наборов данных протеомики также собираются CPTAC (Консорциум клинического анализа протеомных опухолей) для того , чтобы внести свой вклад в изучение рака. Таким образом, сообщество биоинформатиков должно в настоящее время решить проблему использования этого нового слоя информации( протеомики )  и интеграции его с другими ценными слоями омики для изучения механизма развития заболеваний человека.

       Целевые методы протеомики, такие как SRM / MRM (мониторинг выбранных / множественных реакций) и независимые от данных методы сбора , такие как SWATH-MS (последовательное оконное получение всех теоретических фрагментов масс-спектров ионов), также позволяют значительно понизить уровень  изменчивости во время сбора данных и улучшить качество набора данных.

        Основное применение протеомики - идентификация биомаркеров заболевания. В идеале биомаркер должен однозначно распознавать заболевание и должен обнаруживаться в доступной жидкости организма, такой как плазма, кровь, сыворотка мочи, слюна или спинномозговая жидкость. Например, простат-специфический антиген (ПСА, PSA) является одним из самых известных неинвазивных скрининговых биомаркеров и используется для выявления рака предстательной железы. Однако,  высокая концентрация ПСА в крови также связана с доброкачественной гиперплазией предстательной железы и простатитом. Таким образом, даже несмотря на то, что PSA  обеспечивает достаточную чувствительность, он не способен различать рак простаты и другие патологии простаты из-за его низкой специфичности. В последние годы, чтобы улучшить чувствительность и специфичность биомаркеров, исследователи обратились к комбинации биомаркеров, то есть сигнатуры заболевания, вместо того, чтобы искать идеальный биомаркер.

        Используя протеомическую характеристику образцов из разных стадий прогрессирования рака молочной железы люминального типа, исследователи выявили различия в компонентах белкового гомеостаза и метаболической регуляции, которые способны  отличать здоровые, от первичных или метастазирующих в лимфатических узлах опухолевых тканей, а также от лимфатических узлов и рака молочной железы. Основанное на протеомике субтипирование пациентов с раком толстой кишки и прямой кишки с помощью CPTAC также оказалось более подробном , чем на основе данных транскриптомики, что привело к лучшему прогнозированию течения онкологического заболевания. Комбинация белка с измерениями содержания фосфопротеинов с использованием белковых массивов с обращенной фазой также использовалась, например, для прогнозирования рецидива рака яичников.  Многочисленные исследования показали ценность данных фосфопротеомики для  информации, лежащей в основе механизма болезни. Например, данные фосфопротеомики были использованы для выявления механизма устойчивости клеток меланомы к ингибиторам BRAF и глиобластомы к ингибиторам mTOR ( мишень рапамицина), что привело к открытию новой комбинированной терапии. Клеточно-специфическая фосфопротеомика также была использована для изучения двунаправленной передачи сигналов между эндотелиальными клетками и опухолевыми клетками, чтобы понять метастатические механизмы опухолевых клеток. Поэтому ясно, что протеомный и фосфопротеомический слой информации о омиках может дать ценную информацию в нашем стремлении к точной медицине. 

      Один из подходов к выявлению биомаркеров заключается в использовании тех белков, которые по-разному экспрессируются между нормальным и болезненным состоянием. Также используются более сложные методы, такие как машинное обучение и сетевые подходы. Методы машинного обучения, такие как метод  опорных векторов , нейронные сети , "дерево решений" , "случайный лес" и генетические алгоритмыбыли успешно применены к данным протеомики для идентификации биомаркеров нескольких типов рака, сердечной недостаточности и других патологических состояний. Кроме того , исследователи сконструировали 29-плексную матричную платформу, включающую 29 потенциальных биомаркеров, связанных с аденокарциномой желудка.

       Наборы протеомных данных с высокой пропускной способностью характеризуются большим количеством переменных / характеристик по сравнению с общим количеством доступных образцов. Следовательно, входное пространство включает в себя множество не относящихся к делу или шумных элементов, которые в сочетании с широкой неоднородностью, обычно встречающейся в биологических образцах, затрудняют идентификацию действительно важных биомаркеров. Для решения этой проблемы использовались методы уменьшения размерности , такие как PAM (анализ прогнозирования для микрочипов), SVM-RFE (устранение машинно-рекурсивных характеристик опорных векторов) , SAM (анализ значимости микрочипов) , которые используются в сочетании с методами машинного обучения для уменьшения шума в наборах данных. Это достигается за счет отказа от несущественных признаков и повышения эффективности обобщения и прогнозирования. 

        Отсутствие воспроизводимости в различных наборах данных, технические проблемы, такие как проблема переоснащения в подходах машинного обучения и внутренняя сложность заболеваний человека, часто не позволяют перспективным биомаркерам достичь клинического применения.

         Раскрытие индивидуальных механизмов развития и прогрессирования заболевания у разных пациентов может стать  ключом к разработке точных стратегий терапии.    В качестве первого шага в этом направлении подходы омического анализа данных (например, гены, белки или фосфопептиды) обычно пытаются идентифицировать затронутые биологические процессы и функции , используя генную онтологию или анализ обогащения пути (или других признаков) на дифференциально регулируемых объектах каждого из них.  Эти дифференциально регулируемые объекты также могут быть отображены на существующие сети взаимодействия или карты маршрутов, чтобы обеспечить лучшее представление о процессах происходящих в клетках.  Например, в исследовании двунаправленной передачи сигналов опухоли эндотелия, авторы нанесли  пораженные фосфопептиды на карты путей KEGG , чтобы понять пути, вовлеченные в трансэндотелиальный метастаз опухолей.

           Совсем недавно была собрана  коллекция методов, в основном разработанных и применяемых к наборам данных геномики и транскриптомики, которые учитывают также сеть взаимодействия белков и структуру биохимических путей для выявления специфических для пациента звеньев патогенеза болзени. Алгоритм SPIA (Анализ воздействия сигнального пути) объединяет информацию о дифференциальной экспрессии генов с их влиянием в этом пути на основе их размещения в его топологии. HotNet2 и связанная диффузия через взаимодействующие события (TieDIE)  помогла использовать слегка измененные диффузионные подходы, которые включают в себя форму случайного блуждания и взвешивания в соответствии с силой соединения и топологией сети для распространения эффекта возмущения в данной сети. 

             Несмотря на обширную информацию, которую могут предоставить данные протеомики и фосфопротеомики, она все еще представляет собой только один слой функций и регуляции клеток. Таким образом, чтобы действительно глубоко понять функцию клетки, важно рассмотреть как можно больше уровней регуляции функции клетки. Это особенно верно в контексте точной медицины, где разные уровни клеточной регуляции могут быть важны для каждого пациента. В настоящее время и следует это признать не существует стандартного или оптимального подхода к интеграции данных. В зависимости от наборов данных, которые они интегрируют, методы можно разделить на однородные, где наборы данных содержат данные одного типа, но из разных источников, и разнородные, где интегрированы несколько наборов данных с различными типами данных.  Эти методы могут интегрировать слои информации поэтапно или шаг за шагом для создания интегрированной модели исследуемой системы. Например, Drake et al. (2014)  использовали пошаговый подход для интеграции геномных, транскриптомных и фосфопротеомических данных для того , чтобы идентифицировать специфические для пациента сети, которые поражены раком предстательной железы, и предложить потенциально точный метод  лечения для этих пациентов.  В частности, они сначала использовали наборы данных, чтобы идентифицировать пути, факторы транскрипции и киназы, которые, вероятно, активны в своих образцах, а затем применили их алгоритм на основе диффузии, TieDie , чтобы определить различные функциональные модули и пути, которые затрагиваются у разных пациентов. В этом исследовании они также показали, что интеграция фосфопротеомики была в состоянии обнаружить пути, которые в противном случае были бы упущены, подчеркивая важность включения этого уровня информации в подходы точной медицины. Применяя этот конвейер на трех различных клеточных линиях простаты в качестве валидации, они смогли подтвердить свои результаты либо путем оценки их прогнозируемой чувствительности к лекарственным средствам, либо с помощью исследований сущности генов.

 

Категория сообщения в блог: 

Добавить отзыв