Site Overlay

Strukturell analyse av heme proteiner: implikasjoner for design og prediksjon

Ikke-redundant dataset av heme bindende proteiner

Det er 1998 og 113 PDB oppføringer inneholder ligand HEM (heme type-b) og HEKTIS (heme type-c) henholdsvis med en oppløsning på 3Å eller bedre i November 24, 2009 . Blant disse oppføringene, 10 (1BE3, 1BGY, 1FGJ, 1GWS, 1PP9, 1PPJ, 1S56, 1S61, 2A06, og 3H1J) inneholder både heme type b og c., I toto 4272 protein kjeder ble identifisert som heme i samspill protein kjeder, som beskrevet i Metoder. En ikke-redundant dataset av 125 protein kjeder (114 heme-b og 11 heme-c, Ekstra fil 1, Tabell S1) ble generert ved hjelp av FISKENE med en sekvens identitet grensen på 25%. Åttito prosent av disse protein kjeder bare inneholde ett heme molekyl, mens antallet av heme molekyler i de resterende protein kjeder varierer fra 2 til 8 (Ekstra fil 1, Tabell S1)., To eksempler på multi-heme protein kjeder, 1FS7A med 5 type b og 3F29A med 8 type c heme molekyler, er vist i (Figur 2A & 2B).

Figur 2

Eksempler på tre-dimensjonale strukturen av multi-heme proteiner og identifisering av heme-bindende miljø., (En) Cytokrom c nitritt reduktase av Wolinella succinogenes (PDB-chain: 1FS7A) med 5 heme b molekyler; (B) Thioalkalivibrio nitratireducens cytokrom c nitritt reduktase (PDB-chain: 3F29A) med 8 heme c molekyler; (C) globin-domenet av globin-kombinert sensor i Geobacter sulfurreducens (PDB-chain: 2W31A). Den røde pinner er aksial ligander av heme jern og den blå pinner representerer andre heme i samspill rester. For bedre visualisering, er det nærliggende heme rester i A og B er farget gul og grønn henholdsvis. Den heme-molekyler er vist som spacefill., Bildene ble generert ved hjelp av Pymol http://www.pymol.org.

The dataset av heme bindende proteiner inneholder et bredt utvalg av protein folder. Av en total av 86 protein kjeder (~69% av datasettet) har SCOP kommentarer (basert på utslipp 1.75 og Pre-SCOP), og tilhører 31 forskjellige strukturelle folder i alle de fire store klasser (Tabell 1) . Datasettet er dominert av proteiner i alt-α klasse, og lage opptil 64% (55 av 86) av totalen. Topp 4 folder, Globin-som (en.1), Cytokrom P450 (en.104), Cytokrom c (en.3), og Multi-heme cytochromes (en.,138) representerer den kjente heme bindende proteiner som har blitt undersøkt grundig (Tabell 1).

Tabell 1 SCOP brett klasser av 125 heme bindende protein kjeder i non-redundant dataset

Strukturelle miljø av heme bindende lommer

for Å undersøke strukturelle miljø av heme bindende lommer, vi identifisert både rester som gjør koordinere obligasjoner med heme jern, og de som samhandler med heme porphyrin struktur (Figur 2C og Metoder)., Ut av 125 heme bindende protein kjeder, bare 2PBJA og 3HCNA ikke har rester identifisert som aksial ligander til heme jern selv om begge har omfattende samhandling med heme; i stedet andre små molekyler, slik som glutation (GSH) i 2PBJA (mikrosomale prostaglandin E syntase) og imidazole (IMD) i 3HCNA (human ferrochelatase) form koordinere obligasjoner med heme jern. Fem forskjellige aminosyrer (H, M, C, Y, K) er funnet å tjene som aksial ligander til heme jern med histidin som den dominerende rester (~80%) i begge heme b og heme c-typer (Figur 3)., Heme b bruker mer cystein rester mens heme c har litt mer metionin rester som aksial ligander. Det bør bemerkes at det er bare 41 rester som heme c ligander. Derfor er prosentandelen av ikke-histidin ligander kan ha en relativt stor endring med en svak økning eller reduksjon av ligand tall på grunn av de små datasett.

Figur 3

Fordelingen av den aksiale ligander for heme b (HEM) og heme c (HEKTIS).,

bevart interaksjoner mellom proteiner rester og heme var tidligere studert ved å beregne enten frekvenser av rester som er i van der Waals kontakt med heme for hver fold klasse b-typen heme proteiner eller ved å beregne gjennomsnittlig antall per bindende nettstedet . Smith et al også brukt normalisert aminosyre profiler for å vurdere sammensetning og bevaring av heme bindende områder ., Her har vi utforsket rester preferanser i heme bindende lommer gjennom å beregne de relative frekvensene av heme bindende rester i vår non-redundant dataset. Den relative frekvensen av hver aminosyre er normalisert til sin bakgrunn frekvens.

Vanligvis, bakgrunnen frekvenser som brukes til sammenligninger er beregnet ut fra en ikke-redundant protein dataset. Imidlertid, på grunn av den dominerende tilstedeværelse av alle-α folder, det er ikke klart om rester distribusjon i heme proteiner er forskjellig fra den andre proteiner., Derfor er vi første sammenlignet med den øvrige fordelingen mellom non-redundant heme proteiner og non-redundant alle proteiner. For å unngå problemer med manglende rester og kloning gjenstander (Hans-koder etc.) forbundet med PDB-sekvenser, vi brukte native full-lengde protein sekvenser for å beregne rester komposisjoner av kartlegging PDB-kjeder til Uniprot oppføringer med PDBSWS ., Den relative rester frekvenser mellom heme proteiner og alle proteiner viser at heme proteiner har en tendens til å inneholde mer alanin, fenylalanin, histidin, metionin og tryptofan rester og færre cystein, asparaginsyre, isoleucin, lysin, asparagine, og serin rester (Ekstra fil 2, Figur S1). Statistiske analyser (χ2) avdekket en betydelig forskjell mellom disse to frekvens profiler (data ikke vist)., For å ha en meningsfull beskrivelse av berikelse eller mangel av rester i heme i samspill miljø, har vi brukt bakgrunnen frekvenser fra ikke-redundant sett av heme proteiner som referanser.

topp fem rester med høye relative frekvenser er cystein (C), histidin (H), fenylalanin (F), metionin (M), og tyrosin (Y) (Figur 4A). Fordi fire av de fem øverste (C, H, M, Y) kan tjene som aksial ligander til heme jern (Figur 3), har vi fjernet aksial ligander fra datasettet og beregnet den relative frekvenser., Figur 4B viser at nivået av histidin reduseres til bakgrunnen nivå, noe som tyder berikelse av histidin er i hovedsak på grunn av det store antallet av heme histidin ligander. De fire andre reststoffer, på den andre siden, har nesten samme relative frekvenser med eller uten ligand rester (Figur 4B). I heme c proteiner, forekomst av cystein rester er ekstremt høy med en åtte brett berikelse i forhold til bakgrunnen distribusjon., Dette er ikke overraskende som den klassiske CXXCH bindende motiv, som histidin tjene som ligand og cystein rester form covalent thioether obligasjoner med heme vinyl grupper, har dominerende tilstedeværelse i heme c proteiner.

Figur 4

Relativ frekvens av heme i samspill aminosyrer. (En) Relativ frekvens av rester i heme b (HEM), heme c (HEKTIS), og heme b og c (ALLE); (B) den relative frekvensen av 5 rester med eller uten dem som aksial heme ligander.,

i Samsvar med tidligere rapporter, aromatiske rester (fenylalanin, tyrosin og tryptofan) spiller en viktig rolle i protein-heme vekselsvirkningene gjennom stabling vekselsvirkningene med porphyrin. Ett unntak er tryptofan i heme c proteiner, som viste et tilsvarende nivå på forekomster i forhold til bakgrunn (Figur 4A). Leucin, isoleucin og valin, som gjør hydrofobe interaksjoner med heme ring struktur, er noe økt i forhold til bakgrunnen frekvenser., Rester med færrest forekomster, asparaginsyre, glutaminsyre, og lysin er belastet rester, noe som tyder på heme bindende lomme, er hovedsakelig et hydrofobt miljø. I kontrast, arginin, en positivt ladet rester som har vært ansett som en viktig aktør i forankre heme propionates, har en mye høyere forekomst enn andre belastet aminosyrer og viser en lignende (HEM) eller litt høyere (HEKTIS) nivå av frekvensen til bakgrunn (Figur 4A) .

sekundær struktur typer for heme i samspill rester er vist i Figur 5., Det er mer spiralformet og mindre coil typer proteiner med heme b uansett hva dataset (heme proteiner eller alle proteiner) er brukt som en referanse. Derfor forskjellen er ikke på grunn av det store antallet av alle-α proteiner i datasettet. Som for heme i samspill rester i heme c, de har de samme fordeling til bakgrunn (Figur 5). Basert på vår 3-kategori klassifisering av relativ solvent tilgjengelighet , heme i samspill rester er mindre sannsynlighet for å bli eksponert. De begravde rester er sammenlignbare med bakgrunn distribusjon., Om 20% økning er observert i de mellomliggende kategori (Ekstra fil 2, Figur S2).

Figur 5

Frekvenser av sekundær struktur typer for heme i samspill rester.

Heme bindende sekvens motiver

for Å undersøke mulige sekvens motiver som er involvert i heme bindende, flankerer sekvenser med fire rester på hver side av heme aksial ligander ble samlet inn og sammenstilt., Non-redundant dataset har 34 heme c ligander, 32 av disse har histidin som aksial ligander. Justeringen av disse sekvensene viser den klassiske CXXCH heme c bindende motiv (Figur 6A).

Figur 6

Sekvens motiver rundt aksial ligander. (A) Sekvens-logoen fra 32 heme c proteiner med histidin som aksial ligand viser den klassiske CXXCH heme c bindende motiv; (B) Sekvens-logoen fra 18 heme b proteiner med cystein som aksial ligand., Sekvensen logoer ble opprettet med WebLogo ; (C) Arginin-334 (red pinner) av 1N97A samhandler med heme propionates (røde kuler); og (D) Interaksjoner mellom histidin-353 (red pinner) av 1GWIA og heme propionate grupper (røde kuler).

et Annet motiv verd å merke, G XXCG, kommer fra heme b proteiner med cystein som aksial ligander (Figur 6B). Motivet representerer den klassiske CYP signatur heme bindende motiv FXXGXXCXG i bakterier, planter, og nukleære cytokrom P450-s ., På -4 og +2 stillinger (med ligand cystein som referanse posisjon) er små aminosyrer (glycine), mens -2 posisjon foretrekker en positivt ladet aminosyre som histidin eller arginin. Disse positivt ladet rester samhandle elektronisk med negativt ladet heme propionates (Figur 6C og 6D). Den lille glysin rester på -4 posisjon kan gi den fleksibilitet som er nødvendig for å plassere positivt ladet rester nær heme propionate grupper. +1-posisjon er dominert av proline og hydrofobe aminosyrer, leucin, alanin, valin og isoleucin., Seks av de atten tilfeller har proline rett etter at den aksiale ligand cystein, som minner om dipeptide CP motiv for å være innblandet i heme sensing og regulering ., Mens betydningen av CP motiv har blitt studert gjennom sletting eller et nettsted-anvist mutasjon eksperimenter i flere viktige proteiner, inkludert transkripsjon repressor Bach1, strykejern regulatorisk protein 2 (IRP2) , døgnrytmen faktor periode 2 (Per2) og δ-aminolevulinic syre syntase (AKK) , den mulige rollen som den CP motiv i heme interaksjon fra et strukturelt synspunkt er fortsatt uklart når den strukturer for de fleste av disse proteiner med slike CP motivene er ukjent.,

Alle de seks CP dipeptides som har direkte fysiske interaksjoner med heme viser lignende strukturelle roller med cysteines tjene som ligander til heme jern og proline rester innføre en bøye for nedstrøms strukturer, hovedsakelig α-helices, til å styre dem bort fra heme ansikt (Figur 7B og 7C). En syvende protein kjede, 2PBJA, inneholder en CP der proline viser svært lik strukturell implikasjon, mens cystein rester samhandler med heme, men ikke som en ligand., I stedet, tilstedeværelse av en glutathione-molekyl (GSH), som danner en koordinering bånd med heme jern, synes å presse cystein litt bort fra den aksiale ligand posisjon (5.25 Å fra heme jern) . Vurderer konformasjon i proline-bend struktur og liten avstand mellom cystein og heme jern, er det sannsynlig at cystein kan tjene som en heme ligand hvis GSH er ikke til stede i strukturen., Det er interessant at en nærmere undersøkelse av de strukturelle konformasjon nedstrøms av proline rester i 2CIWA (cloroperoxidase), 3CQVA (Rev-erb), og 2PBJA (mikrosomale prostaglandin E syntase), som har CP heme motiver med bevart proline, viser nesten vinkelrett retning til heme-fly (Figur 7A, 7B og 7D)., I kontrast, i P450 familie der proline rester er mindre bevart, med leucin, isoleucin, og metionin også funnet på posisjon av proline som vist i motiv-logoen (Figur 6B), og α-helices etter proline rester er parallelt med heme-fly (Figur 7C). Forskjellen foreslår en annen strukturell rolle for proline i et CP dipeptides fra at det i mindre bevart CP dipeptides, mer spesifikt på proline posisjon.,

Figur 7

Tre-dimensjonale strukturer av heme proteiner med «CP» motiver. (En) 3CQVA; (B) 2CIWA; (C) 1GIWA; og (D) 2PBJA. CP dipeptides er vist som røde pinner. Umiddelbar nedstrøms strukturer av CP dipeptides er vist i blått.

CP dipeptides har også vært innblandet i indirekte samspill med heme., Ragsdale og medarbeidere rapporterte en ny rolle for CP motiver i heme oxygenase 2 (HMOX-2) som en thiol/disulfide redox-bryter som lokaliserer utenfor heme-bindende lommen , derfor regulere heme-protein interaksjon via sensing redox status i miljøet. Det er en total av tjue-ni CP dipeptides i vårt datasett. Mindre enn en fjerdedel av dem (i 7 protein kjeder, inkludert 2PBJA) vis fysiske interaksjoner med heme molekyler., Det ville være upraktisk på dette punktet for å forutsi den funksjonelle rollen til de resterende CP dipeptides i heme-protein samhandling, hovedsakelig på grunn av den begrensede eksempel størrelse og mangel på strukturelle detaljer på heme lomme-CP samhandling. Her har vi gjort bruk av statistisk analyse for å indirekte vurdere den funksjonelle betydning av CP dipeptides i heme samhandling. Bakgrunnen for analysen er at hvis CP dipeptides er viktig heme signaturer for heme samspill, den forventede forekomster av CP dipeptides i hemoproteins bør være høyere i forhold til å kontrollere befolkningen., Vi fant ingen statistisk signifikant forskjell mellom forekomsten av CP dipeptides i heme proteiner og ikke-heme proteiner (data ikke vist), noe som tyder på andre ennå ikke identifisert faktorer som kan finnes for å hjelpe deg å avgjøre rolle CP dipeptides spille i heme bindende ., Det bør bemerkes at vi ikke utelukke muligheten for at i kontrollprøve det finnes ukjent hemoproteins, men for dem å påvirke frekvensen av CP-signaler det ville være en betydelig stor del av kontroll-proteiner blir analysert for å være heme-samspill, som vi vurderer som mindre sannsynlig.,

– Struktur sammenligning mellom apo og holo heme proteiner

Et interessant spørsmål knyttet til struktur-basert heme bindende protein design og prediksjon, er graden av global conformational overgangen og den lokale endringer av heme-bindende lomme på heme bindende. Vi samlet inn 446 heme protein kjeder (etter fjerning av heme protein kjeder med minst 90% sekvens identitet), og sammenlignet med sine sekvenser med protein kjeder uten heme eller heme-som ligander (Ekstra fil 1, Tabell S2)., Ett hundre og sytti-ni heme protein kjeder er funnet å ha apo strukturer med høy sekvens likhet og dekning. Etter å fjerne overflødig apo/holo par med 25% sekvens identitet cutoff og proteiner med ikke-heme eller ikke-heme-ligander som opptar heme bindende pocket, den endelige datasettet består av 10 apo-holo protein par. Tabell 2 viser at 9 av 10 proteiner gjennomgå svært liten global conformational endringer etter heme bindende med RMSDs av 1.03 Å eller mindre. For eksempel 2ZDOA-1XBWD par (jern-regulert overflate determinanten IsdG fra Staphylococcus aureus) har en RMSD av 0.,59 Å. I fravær av heme, protein forutsetter samme konformasjon som holo protein med heme (Figur 8A, B). Selv siden kjeden posisjoner av histidin ligand er lik. En med relativt stor conformational endringer er Rev-erb (3CQVA-2V7CA). Uten heme C-terminal helix (rester 568-576) beveger seg mot heme lomme med His568 (heme-bindende ligand) vender bort fra bindende lomme (Figur 8C, D) .,

Table 2 Comparisons between apo and holo heme protein structures
Figure 8

Structural comparison of apo-holo heme protein pairs. (A,B) 2ZDOA-1XBWD; (C,D) 3CQVA-2V7CA.

Three of the ten heme proteins in Table 2 have multiple known apo structures., 1KBIA (flavin-bindende domene av Baker ‘ s gjær flavocytochrome b2), 1N45A (human heme oxygenase-1), og 1N5UA (humant serum albumin) har 9, 3 og 28 apo strukturer henholdsvis (med minst 99% sekvens identitet, Ekstra fil 1, Tabell S3). Fordi proteiner er iboende dynamiske og conformational utvalget har vært ansett som en viktig mekanisme for biologiske makromolekylers anerkjennelse , vi sjekket conformational forskjeller mellom hver av apo strukturer og holo strukturer. Figur 9A viser RMSD (Ca atomer av justert rester) verdier av apo-holo strukturelle forskjeller., Den RMSDs er generelt mindre enn 1Å for 1KBIA og 1N45A. Tvert imot, apo strukturer av 1N5UA danne to grupper. Medlemmer av en klynge med 12 apo strukturer har RMSDs rundt 0.8 Å mens den andre inneholder 15 apo strukturer med RMSDs alt fra 4 til 5Å. Gjennom manuell inspeksjon, finner vi at forskjellene er forårsaket av antallet ikke-heme ligander i strukturer. I tillegg til heme, 1N5UA har også 5 myristic syre (MYR) – molekyler (Figur 9B). Den apo strukturer med høyere RMSDs enten ikke har ligander (Figur 9C) eller har bare én eller to ikke-MYR ligander., For eksempel, 1E7AA og 2BX8B har 2 PFL og 1 AZQ henholdsvis. På den annen side, apo strukturer med MYR ligander i liknende stillinger som i 1N5UA generelt har mindre RMSDs (Figur 9D). Derfor, under lignende miljø, det er relativt små strukturelle forskjeller mellom holo og apo heme protein strukturer.

Figur 9

Eksempler på heme proteiner med flere apo strukturer., (En) RMSD distribusjon av apo strukturen av tre heme protein kjeder, 1KBIA, 1N45A, og 1N5UA. 28 apo strukturer av 1N5UA form to klynger (red ovaler). (B) Struktur av 1N5UA med en heme og fem myristic syre-molekyler (MYR, rød spacefill). (C) Strukturen av 1AO6A med ingen ligander. (D) Strukturen av 3CX9A med fem myristic syre-molekyler (MYR, rød spacefill) og en LPX ligand (oransje spacefill).,

Det bør bemerkes at over sammenligningene er basert på heme proteiner som har stabil apo strukturer løses gjennom X-ray crystallography. For noen proteiner, som i tilfelle av hemoglobin, fravær av ligand(s) kan øke fleksibilitet og føre til delvis utfoldelsen av protein-strukturen, noe som gjør det vanskelig for strukturbestemmelse . Videre, i bunn og grunn er forstyrret eller ustrukturerte områder er vurdert til å være ansvarlig for mange viktige cellulære funksjoner som ligand bindende ., Men eksistensen av slike fleksible apo strukturer ville ikke forstyrre vårt mål i struktur-basert heme protein prediksjon som vi tar sikte på å ta eksisterende apo strukturer i PDB som innganger .

Andre funksjoner nyttig for å sammenligne apo-holo heme proteiner lomme størrelse og form. På grunn av forskjellige heme bindende moduser (delvis eksponert eller fullt integrert, Flere fil 2 Figur S3) og problemer med å identifisere den nøyaktige heme bindende pocket fra eksisterende automatiske programmer, størrelser av heme bindende lommer variere fra liten (~400 Å3) til svært stor (over 2000 Å3) (Tabell 2)., I tillegg, endringer i absolutte lomme volumer etter heme bindende er variabel. Små endringer er sett i 2ITFA-2ITEB, 2R7AA-2RG7 D, og 2ZDOA-1XBWD. Andre parene viste betydelige endringer i volum, til tross for den minimale conformational endre (Tabell 2). Å ta form i betraktning vi beregnet Rvs verdi (forholdet mellom pocket volum over lommen areal) av hver lomme. De fleste av apo eller holo proteiner har Rvs verdier rundt 1.4., For å undersøke nærmere om bindende lommen kan brukes som ett av kjennetegnene for heme protein prediksjon, sammenlignet vi Rvs fordelingen mellom heme bindende lommer og lommer i ikke-heme proteiner (proteiner som ikke har heme ligand(s) og er ikke homologe til heme proteiner) med tilsvarende størrelser fra 350 til 2000Å3. Rvs av heme bindende lommer har en smal distribusjon mens Rvs fra lignende lomme størrelser av ikke-heme proteiner har et bredt fordelt med en lang høyre hale (Ekstra fil 2, Figur S4-En)., Vi har også undersøkt fordelingen av Rvs normalisert til en sfære form som er innført av Sonavane og Chakrabarti . En tilsvarende trend ble funnet (Ekstra fil 2, Figur S4-B). Det bør bemerkes at selv om ukjente heme proteiner kan være inkludert i den ikke-heme dataset, mange ikke-heme proteiner dele lignende lomme egenskaper.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert. Obligatoriske felt er merket med *