Wu Enhui, Qiao Liang*
Kemian laitos, Fudanin yliopisto, Shanghai 200433, Kiina
Mikro-organismit liittyvät läheisesti ihmisten sairauksiin ja terveyteen. Mikrobiyhteisöjen koostumuksen ja niiden toimintojen ymmärtäminen on tärkeä kysymys, jota on tutkittava pikaisesti. Viime vuosina metaproteomiikasta on tullut tärkeä tekninen keino tutkia mikro-organismien koostumusta ja toimintaa. Mikrobiyhteisönäytteiden monimutkaisuuden ja suuren heterogeenisyyden vuoksi näytteenkäsittelystä, massaspektrometrian tiedonkeruusta ja data-analyysistä on kuitenkin tullut metaproteomiikan kolme suurinta haastetta tällä hetkellä. Metaproteomiikka-analyysissä on usein tarpeen optimoida erityyppisten näytteiden esikäsittely ja ottaa käyttöön erilaisia mikrobierottelu-, rikastus-, uutto- ja lyysimenetelmiä. Yhden lajin proteomin tapaan massaspektrometrian tiedonkeruumoodit metaproteomiikassa sisältävät datasta riippuvan tiedonkeruun (DDA) ja datasta riippumattoman hankinnan (DIA). DIA-tiedonkeruutila voi kerätä täydellisesti näytteen peptiditiedot ja sillä on suuri kehityspotentiaali. Metaproteominäytteiden monimutkaisuuden vuoksi sen DIA-tietoanalyysistä on kuitenkin tullut suuri ongelma, joka estää metaproteomiikan syvällisen kattavuuden. Tietojen analysoinnin kannalta tärkein vaihe on proteiinisekvenssitietokannan rakentaminen. Tietokannan koolla ja täydellisyydellä ei ole suuri vaikutus ainoastaan tunnistusten määrään, vaan ne vaikuttavat myös analyysiin laji- ja toimintatasolla. Tällä hetkellä kultastandardi metaproteomitietokannan rakentamisessa on metagenomiin perustuva proteiinisekvenssitietokanta. Samalla julkisen tietokannan iteratiiviseen hakuun perustuvalla suodatusmenetelmällä on myös todistettu olevan vahva käytännön arvo. Erityisten data-analyysistrategioiden näkökulmasta peptidikeskeiset DIA-dataanalyysimenetelmät ovat valloittaneet ehdottoman valtavirran. Syvän oppimisen ja tekoälyn kehittymisen myötä se edistää suuresti makroproteomisen data-analyysin tarkkuutta, kattavuutta ja analysointinopeutta. Alavirran bioinformatiikan analyysin osalta on viime vuosina kehitetty sarja annotaatiotyökaluja, joilla voidaan suorittaa lajien annotaatioita proteiini-, peptiditasolla ja geenitasolla mikrobiyhteisöjen koostumuksen saamiseksi. Muihin omiikan menetelmiin verrattuna mikrobiyhteisöjen toiminnallinen analyysi on makroproteomiikan ainutlaatuinen piirre. Makroproteomiikasta on tullut tärkeä osa mikrobiyhteisöjen multiomiikka-analyysiä, ja sillä on edelleen suuri kehityspotentiaali kattavuuden syvyyden, havaitsemisherkkyyden ja data-analyysin täydellisyyden suhteen.
01 Näytteen esikäsittely
Tällä hetkellä metaproteomiikkateknologiaa on käytetty laajasti ihmisen mikrobiomin, maaperän, ruoan, valtamerten, aktiivisen lietteen ja muiden alojen tutkimuksessa. Verrattuna yksittäisen lajin proteomianalyysiin, monimutkaisten näytteiden metaproteomin näytteen esikäsittelyssä on enemmän haasteita. Varsinaisten näytteiden mikrobikoostumus on monimutkainen, runsauden dynaaminen alue on suuri, erityyppisten mikro-organismien soluseinämärakenne on hyvin erilainen ja näytteet sisältävät usein suuren määrän isäntäproteiineja ja muita epäpuhtauksia. Siksi metaproteomin analysoinnissa on usein tarpeen optimoida erityyppiset näytteet ja ottaa käyttöön erilaisia mikrobierottelu-, rikastus-, uutto- ja lyysimenetelmiä.
Mikrobien metaproteomien uuttamisella eri näytteistä on tiettyjä yhtäläisyyksiä sekä joitakin eroja, mutta tällä hetkellä erityyppisille metaproteominäytteille puuttuu yhtenäinen esikäsittelyprosessi.
02Massaspektrometrian tiedonkeruu
Haulikkoproteomianalyysissä peptidiseos esikäsittelyn jälkeen erotetaan ensin kromatografiapylväässä ja syötetään sitten massaspektrometriin tietojen keräämistä varten ionisaation jälkeen. Kuten yksittäisten lajien proteomianalyysissä, makroproteomianalyysin massaspektrometrian tiedonkeruutavat sisältävät DDA-tilan ja DIA-tilan.
Massaspektrometrialaitteiden jatkuvan iteroinnin ja päivityksen myötä metaproteomiin sovelletaan korkeamman herkkyyden ja resoluution massaspektrometrialaitteita, ja myös metaproteomianalyysin peittosyvyyttä parannetaan jatkuvasti. Pitkän aikaa Orbitrapin johtamia korkearesoluutioisia massaspektrometrialaitteita on käytetty laajalti metaproteomissa.
Alkuperäisen tekstin taulukko 1 esittää joitakin edustavia tutkimuksia metaproteomiikasta vuodesta 2011 tähän päivään näytteen tyypin, analyysistrategian, massaspektrometrian instrumentin, hankintamenetelmän, analyysiohjelmiston ja tunnistusten määrän osalta.
03Massaspektrometriatietojen analyysi
3.1 DDA-tietojen analysointistrategia
3.1.1 Tietokantahaku
3.1.2de novosekvensointistrategia
3.2 DIA-tietojen analysointistrategia
04Lajiluokitus ja toiminnallinen huomautus
Mikrobiyhteisöjen koostumus eri taksonomisilla tasoilla on yksi mikrobiomitutkimuksen keskeisistä tutkimusalueista. Viime vuosina on kehitetty sarja merkintätyökaluja lajien merkitsemiseksi proteiinitasolla, peptiditasolla ja geenitasolla mikrobiyhteisöjen koostumuksen saamiseksi.
Toiminnallisen annotaation ydin on vertailla kohdeproteiinisekvenssiä funktionaalisen proteiinisekvenssin tietokantaan. Käyttämällä geenitoimintotietokantoja, kuten GO, COG, KEGG, eggNOG jne., erilaisia toiminnallisia annotaatioanalyysejä voidaan suorittaa makroproteomien tunnistamille proteiineille. Merkintätyökaluja ovat Blast2GO, DAVID, KOBAS jne.
05 Yhteenveto ja Outlook
Mikro-organismeilla on tärkeä rooli ihmisten terveydessä ja sairauksissa. Viime vuosina metaproteomiikasta on tullut tärkeä tekninen keino tutkia mikrobiyhteisöjen toimintaa. Metaproteomiikan analyyttinen prosessi on samanlainen kuin yksittäisen lajin proteomiikan, mutta metaproteomiikan tutkimusobjektin monimutkaisuuden vuoksi jokaisessa analyysivaiheessa on otettava käyttöön erityisiä tutkimusstrategioita näytteen esikäsittelystä, tiedonkeruusta data-analyysiin. Tällä hetkellä esikäsittelymenetelmien parantamisen, massaspektrometriateknologian jatkuvan innovaation ja bioinformatiikan nopean kehityksen ansiosta metaproteomiikka on edistynyt merkittävästi tunnistussyvyydessä ja sovellusalueella.
Makroproteominäytteiden esikäsittelyssä on ensin otettava huomioon näytteen luonne. Mikro-organismien erottaminen ympäristön soluista ja proteiineista on yksi makroproteomien keskeisistä haasteista, ja erottelutehokkuuden ja mikrobihäviön välinen tasapaino on kiireellinen ongelma, joka on ratkaistava. Toiseksi mikro-organismien proteiiniuutossa on otettava huomioon eri bakteerien rakenteellisen heterogeenisyyden aiheuttamat erot. Jäljitysalueen makroproteominäytteet vaativat myös erityisiä esikäsittelymenetelmiä.
Massaspektrometrialaitteiden osalta valtavirran massaspektrometrialaitteet ovat käyneet läpi siirtymisen Orbitrap-massaanalysaattoreihin, kuten LTQ-Orbitrap ja Q Exactive, perustuvista massaspektrometreistä massaspektrometreihin, jotka perustuvat ionien liikkuvuuteen kytkettyihin lentoaikamassaanalysaattoreihin, kuten timsTOF Pro. . timsTOF-sarjan instrumenteilla, joissa on ionien liikkuvuuden ulottuvuustietoja, on korkea tunnistustarkkuus, alhainen tunnistusraja ja hyvä toistettavuus. Niistä on vähitellen tullut tärkeitä instrumentteja useilla tutkimusaloilla, jotka vaativat massaspektrometriaa, kuten yhden lajin proteomit, metaproteomi ja metabolomi. On syytä huomata, että massaspektrometrialaitteiden dynaaminen alue on pitkään rajoittanut metaproteomitutkimuksen proteiinipeittosyvyyttä. Tulevaisuudessa massaspektrometrialaitteet, joilla on suurempi dynaaminen alue, voivat parantaa proteiinien tunnistamisen herkkyyttä ja tarkkuutta metaproteomeissa.
Vaikka DIA-tiedonkeruutila on laajalti otettu käyttöön yhden lajin proteomissa massaspektrometrian tiedonkeruussa, useimmat nykyiset makroproteomianalyysit käyttävät edelleen DDA-tiedonkeruutilaa. DIA-tiedonkeruumoodi voi saada täydellisesti näytteen fragmentti-ioni-informaation, ja DDA-tiedonkeruumoodiin verrattuna sillä on potentiaalia saada täydellisesti makroproteominäytteen peptidiinformaatio. DIA-tietojen suuren monimutkaisuuden vuoksi DIA-makroproteomidatan analysoinnissa on kuitenkin edelleen suuria vaikeuksia. Tekoälyn ja syväoppimisen kehityksen odotetaan parantavan DIA-data-analyysin tarkkuutta ja täydellisyyttä.
Metaproteomiikan data-analyysissä yksi avainvaiheista on proteiinisekvenssitietokannan rakentaminen. Suosituilla tutkimusalueilla, kuten suolistoflooralla, voidaan käyttää suoliston mikrobitietokantoja, kuten IGC ja HMP, ja hyviä tunnistustuloksia on saavutettu. Useimmille muille metaproteomiikka-analyyseille tehokkain tietokannan rakennusstrategia on silti perustaa näytekohtainen proteiinisekvenssitietokanta metagenomisen sekvensointitietojen perusteella. Mikrobiyhteisönäytteille, joilla on suuri monimutkaisuus ja laaja dynaaminen alue, on tarpeen lisätä sekvensointisyvyyttä, jotta voidaan lisätä vähän runsautta esiintyvien lajien tunnistamista, mikä parantaa proteiinisekvenssitietokannan kattavuutta. Kun sekvensointidataa puuttuu, voidaan käyttää iteratiivista hakumenetelmää julkisen tietokannan optimointiin. Iteratiivinen haku voi kuitenkin vaikuttaa FDR-laadun valvontaan, joten hakutulokset on tarkistettava huolellisesti. Lisäksi perinteisten FDR-laadunvalvontamallien soveltuvuus metaproteomiikka-analyysiin on edelleen tutkimisen arvoinen. Hakustrategian kannalta hybridispektrikirjastostrategia voi parantaa DIA-metaproteomiikan peittoaluetta. Viime vuosina syvään oppimiseen perustuva ennustettu spektrikirjasto on osoittanut ylivoimaista suorituskykyä DIA-proteomiikassa. Metaproteomitietokannat sisältävät kuitenkin usein miljoonia proteiinimerkintöjä, mikä johtaa suureen mittakaavaan ennustettuja spektrikirjastoja, kuluttaa paljon laskentaresursseja ja johtaa suureen hakutilaan. Lisäksi metaproteomien proteiinisekvenssien samankaltaisuus vaihtelee suuresti, mikä tekee spektrikirjaston ennustemallin tarkkuuden varmistamisesta vaikeaa, joten ennustettuja spektrikirjastoja ei ole käytetty laajasti metaproteomiikassa. Lisäksi on kehitettävä uusia proteiinien päättely- ja luokitteluannotaatiostrategioita, joita voidaan soveltaa sekvenssiltaan erittäin samankaltaisten proteiinien metaproteomiikkaanalyysiin.
Yhteenvetona voidaan todeta, että metaproteomiikkateknologia on nousevana mikrobiomitutkimusteknologiana saavuttanut merkittäviä tutkimustuloksia ja sillä on myös valtava kehityspotentiaali.
Postitusaika: 30.8.2024