Site Overlay

Structural analysis of heme proteins: implications for design and prediction

niet-redundante dataset van heme binding proteins

Er zijn 1998 en 113 PDB entries die respectievelijk ligand HEM (heme type-b) en HEC (heme type-c) bevatten met resoluties van 3Å of beter vanaf 24 November 2009 . Onder deze vermeldingen bevatten 10 (1BE3, 1BGY, 1FGJ, 1GWS, 1PP9, 1PPJ, 1S56, 1S61, 2A06 en 3H1J) zowel heme type b als c., In toto 4272 werden de eiwitketens geà dentificeerd als heme die eiwitketens op elkaar inwerken zoals beschreven in methodes. Een niet-redundante dataset van 125 eiwitketens (114 heme-b en 11 heme-c, aanvullend bestand 1, tabel S1) werd gegenereerd met behulp van vissen met een sequence identity cutoff van 25%. Tweeentachtig procent van deze eiwitketens bevatten slechts één heemmolecuul, terwijl het aantal heemmoleculen in de resterende eiwitketens varieert van 2 tot 8 (aanvullend dossier 1, tabel S1)., Twee voorbeelden van multi-heem eiwitketens, 1FS7A met 5 type b en 3F29A met 8 Type c heemmoleculen, worden getoond in (Figuur 2A & 2B).

Figuur 2

voorbeelden van driedimensionale structuur van multi-heem eiwitten en identificatie van heem-bindende omgeving., (A) cytochroom C-nitriet reductase van Wolinella succinogenes (PDB-keten: 1FS7A) met 5 heme B-moleculen; (B) Thioalkalivibrio-nitratiereducens cytochroom C-nitriet reductase (PDB-keten: 3F29A) met 8 heme C-moleculen; (C) globine-domein van globingekoppelde sensor in Geobacter sulfurreducens (PDB-keten: 2W31A). De rode stokken zijn axiale liganden van het heemijzer en de blauwe stokken vertegenwoordigen andere heem interagerende residuen. Voor een betere visualisatie zijn de naburige heemresiduen In A en B respectievelijk geel en groen gekleurd. De heme moleculen worden weergegeven als ruimtevulling., De images werden gegenereerd met Pymol http://www.pymol.org.

de dataset van heembindende eiwitten omvat een grote verscheidenheid aan eiwitplooien. Een totaal van 86 eiwitketens (~69% van de dataset) hebben scop annotaties (gebaseerd op versie 1.75 en Pre-SCOP) en behoren tot 31 verschillende structurele vouwen in alle vier belangrijke klassen (Tabel 1). De dataset wordt gedomineerd door eiwitten in de all-α klasse, die 64% (55 van 86) van het totaal uitmaken. De bovenste 4 vouwen, globine-achtige (a.1), cytochroom P450 (a.104), cytochroom c (a.3), en multi-heme cytochromen (a.,138) vertegenwoordigen de bekende heembindende eiwitten die uitgebreid zijn onderzocht (Tabel 1).

Table 1 scop fold classes of the 125 heme binding protein chains in the non-redundant data set

structurele omgeving van de heme binding pockets

om de structurele omgeving van heme binding pockets te onderzoeken, identificeerden we beide residuen die coördineer bindingen met het heemijzer en degenen die interageren met de Heem porfyrine structuur (figuur 2c en methoden)., Van de 125 heem bindende eiwitketens, hebben slechts 2PBJA en 3HCNA geen residuen geïdentificeerd als axiale liganden aan heme ijzer hoewel beide uitgebreide interacties met heme hebben; in plaats daarvan andere kleine moleculen, zoals glutathion (GSH) in 2PBJA (microsomale prostaglandine E synthase) en imidazol (IMD) in 3HCNA (menselijk ferrochelatase) vormen coördinaatbindingen met heme ijzer. Vijf verschillende aminozuren (H, M, C, Y, K) worden gevonden om als axiale liganden aan het Ijzer van heme met histidine als dominant residu (~80%) in zowel types van heme b als heme c te dienen (Figuur 3)., Heme b gebruikt meer cysteïne residuen terwijl heme c iets meer methionine residuen als axiale liganden heeft. Er zij op gewezen dat er slechts 41 residuen zijn als heme C liganden. Daarom kunnen de percentages van niet-histidine liganden een vrij grote verandering met een lichte verhoging of daling van ligandaantallen toe te schrijven aan de kleine dataset hebben.

Figuur 3

verdeling van de axiale liganden voor heme b (HEM) en heme c (HEC).,

De behouden interacties tussen eiwitresiduen en heme werden eerder bestudeerd door de frequenties van residuen die in contact komen met heme van der Waals voor elke vouwklasse van B-type heme-eiwitten te berekenen of door het gemiddelde aantal per bindingsplaats te berekenen . Smith et al paste ook genormaliseerde aminozuurprofielen toe om de samenstelling en het behoud van heembindingsplaatsen te beoordelen ., Hier onderzochten we de residu voorkeuren in de heme binding pockets door het berekenen van de relatieve frequenties van heme binding residu ‘ s in onze niet-redundante dataset. De relatieve frequentie van elk aminozuur wordt genormaliseerd aan zijn achtergrondfrequentie.

normaal gesproken worden de achtergrondfrequenties die worden gebruikt voor vergelijkingen berekend op basis van een niet-redundante eiwitgegevensset. Vanwege de dominante aanwezigheid van All-α-plooien is het echter niet duidelijk of de residudistributie in heme-eiwitten verschilt van die in andere eiwitten., Daarom hebben we eerst de residudistributies vergeleken tussen niet-redundante heem-eiwitten en niet-redundante alle eiwitten. Om problemen met ontbrekende resten en het klonen van artefacten (His-tags etc.) geassocieerd met PDB-sequenties, gebruikten we native full-length eiwitsequenties om residusamenstellingen te berekenen door de PDB-ketens in kaart te brengen met Uniprot-ingangen met PDBSWS ., De relatieve residufrequenties tussen heme-eiwitten en alle eiwitten tonen aan dat heme-eiwitten meer alanine, fenylalanine, histidine, methionine en tryptofaanresiduen bevatten en minder cysteïne, asparaginezuur, isoleucine, lysine, asparagine en serineresiduen (aanvullend dossier 2, Figuur S1). Statistische analyse (χ2) heeft een significant verschil aangetoond tussen deze twee frequentieprofielen (gegevens niet weergegeven)., Om een betekenisvolle beschrijving te hebben van de verrijking of deficiëntie van residuen in de heme-interagerende omgeving, gebruikten we de achtergrondfrequenties van de niet-redundante set van heme-eiwitten als referentie.

de top vijf residuen met hoge relatieve frequenties zijn cysteïne( C), histidine (H), fenylalanine (F), methionine (M) en tyrosine (Y) (figuur 4A). Omdat vier van de top vijf (C, H, M en Y) kunnen dienen als axiale liganden aan heme ijzer (Figuur 3), verwijderden we axiale liganden uit de dataset en herberekenden we de relatieve frequenties., Figuur 4B toont aan dat het niveau van histidine daalt tot het achtergrondniveau, wat suggereert dat de verrijking van histidine hoofdzakelijk te wijten is aan het grote aantal heme histidine liganden. De andere vier residuen daarentegen hebben vrijwel dezelfde relatieve frequenties met of zonder ligandresiduen (figuur 4B). Bij heme C-eiwitten is het voorkomen van cysteïneresiduen extreem hoog met een achtvoudige verrijking vergeleken met de achtergronddistributie., Dit is niet verwonderlijk omdat het klassieke cxxch-bindingsmotief, waarin het histidine dienst doet als ligand en de cysteineresiduen covalente thioetherbanden vormen met de heme vinylgroepen, dominant aanwezig is in heme C-eiwitten.

Figuur 4

relatieve frequentie van de heme-interagerende aminozuren. A) de relatieve frequentie van de residuen in heme b (HEM), heme c (HEC), en heme b en C (ALL); B) De relatieve frequentie van de 5 residuen met of zonder deze als axiale heme liganden.,

in overeenstemming met eerdere meldingen spelen de aromatische residuen (fenylalanine, tyrosine en tryptofaan) een belangrijke rol in eiwit-heme interacties door stapeling interacties met porfyrine. Een uitzondering is tryptofaan in heme C proteã nen, die een gelijkaardig niveau van gebeurtenissen vergeleken met de achtergrond toonden (figuur 4A). Leucine, isoleucine en valine, die hydrofobe interacties met de heme ringstructuur maken, zijn lichtjes verhoogd over de achtergrondfrequenties., De residuen met de minste voorvallen, asparaginezuur, glutaminezuur, en lysine zijn geladen residuen, wat suggereert dat de heme bindende zak hoofdzakelijk een hydrophobic milieu is. In tegenstelling, arginine, een positief geladen residu dat is beschouwd als een belangrijke speler in het verankeren van de heme propionaten, heeft een veel hoger voorkomen dan andere geladen aminozuren en toont een vergelijkbaar (HEM) of iets hoger (HEC) niveau van frequentie aan de achtergrond (figuur 4A) .

De secundaire structuurtypes voor heme-interagerende residuen zijn weergegeven in Figuur 5., Er zijn meer spiraalvormige en minder spoel types in eiwitten met heme b maakt niet uit welke dataset (heme eiwitten of alle eiwitten) wordt gebruikt als referentie. Daarom is het verschil niet te wijten aan het grote aantal all-α-eiwitten in de dataset. Wat heme-interagerende residuen in heme c betreft, hebben deze een vergelijkbare verdeling als de achtergrond (Figuur 5). Gebaseerd op onze 3-Categorie Classificatie van relatieve oplosmiddeltoegankelijkheid , zijn de heme-interagerende residuen minder waarschijnlijk om te worden blootgesteld. De begraven resten zijn vergelijkbaar met de achtergrondverdeling., Ongeveer 20% toename wordt waargenomen in de tussencategorie (extra bestand 2, Figuur S2).

Figuur 5

frequenties van secundaire structuurtypes voor heme-interagerende residuen.

heme binding sequence motifs

om mogelijke sequence motifs betrokken bij heme binding te onderzoeken, werden de flankerende sequenties met vier residuen aan elke zijde van heme axiale liganden verzameld en uitgelijnd., De niet-redundante dataset heeft 34 heme C liganden, waarvan 32 histidine als axiale liganden hebben. De uitlijning van deze sequenties toont het klassieke cxxch heme C bindende motief (figuur 6A).

Figure 6

Sequentiemotieven rond de axiale liganden. (A) Sequentielogo van 32 heme C-eiwitten met histidine als axiale ligand toont het klassieke cxxch heme C-bindingsmotief; (B) Sequentielogo van 18 heme B-eiwitten met cysteïne als axiale ligand., De sequentie logo ‘ s werden gemaakt met WebLogo ; (C) Arginine-334 (rode sticks) van 1N97A interageert met heme propionaten (rode bollen); en (D) interacties tussen histidine-353 (rode sticks) van 1gwia en heme propionaat groepen (rode bollen).

een ander opmerkelijk motief, g XXCG, komt van de heme B-eiwitten met cysteïne als axiale liganden (figuur 6B). Het motief vertegenwoordigt het klassieke CYP signature heme bindende motief FXXGXXCXG in bacteriën, planten en zoogdieren cytochroom P450 s ., Op de -4 en +2 posities (met ligand cysteïne als referentiepositie) zijn kleine aminozuren (glycine) terwijl de -2 positie een positief geladen aminozuur zoals histidine of arginine verkiest. Deze positief geladen residuen interageren elektronisch met negatief geladen heme propionaten (figuur 6C en 6D). Het kleine glycineresidu bij de -4 positie kan de flexibiliteit verstrekken die nodig is voor het plaatsen van de positief geladen residuen dicht bij heme propionaatgroepen. De +1 positie wordt gedomineerd door proline en hydrofobe aminozuren, leucine, alanine, valine en isoleucine., Zes van de achttien gevallen hebben proline direct na de axiale ligand cysteïne, die doet denken aan de dipeptide CP motief wordt betrokken bij heme sensing en Regulatie ., Hoewel het belang van het CP-motief is onderzocht door middel van deletie of site-directed mutatieexperimenten in verschillende belangrijke eiwitten, waaronder transcriptie-repressor Bach1, iron regulatory protein 2 (IRP2) , circadiaanse factorperiode 2 (Per2) en δ-aminolevulinezuur synthase (ALAS) , blijft de mogelijke rol van het CP-motief in heme-interactie vanuit structureel oogpunt onduidelijk, aangezien de structuren voor de meeste van deze eiwitten met dergelijke CP-motieven onbekend zijn.,

alle zes CP-dipeptiden die directe fysieke interacties met heme hebben, vertonen een soortgelijke structurele rol, waarbij de cysteinen dienen als liganden voor het heemijzer en het Proline-residu een bocht voor de downstreamstructuren, voornamelijk α-helices, introduceren om ze weg te sturen van het heemfront (figuur 7B en 7C). Een zevende eiwitketen, 2PBJA, bevat een CP waarbij de proline een sterk vergelijkbare structurele implicatie vertoont, terwijl het cysteine residu in wisselwerking staat met heme maar niet als ligand., In plaats daarvan lijkt de aanwezigheid van een glutathionmolecuul (GSH), die een coördinatieband vormt met het heemijzer, de cysteïne enigszins weg te duwen van de axiale ligandpositie (5,25 Å van heemijzer) . Gezien de conformatie in de proline-bocht structuur en de kleine afstand tussen cysteïne en heem ijzer, is het waarschijnlijk dat de cysteïne kan dienen als een heem ligand als GSH niet aanwezig is in de structuur., Interessant is dat een nader onderzoek van de structurele conformatie stroomafwaarts van het proline residu in 2CIWA (cloroperoxidase), 3CQVA (Rev-erb), en 2PBJA (microsomale prostaglandine E synthase), die de CP heem motieven met geconserveerde proline, wijst op bijna loodrechte oriëntatie op het heemvlak (figuur 7A, 7B en 7D)., In de P450-familie daarentegen, waar het proline-residu minder geconserveerd is, waarbij leucine, isoleucine en methionine ook worden aangetroffen op de positie van proline zoals aangegeven in het motieflogo (figuur 6B), lopen de α-helices die het Proline-residu volgen parallel met het heemvlak (figuur 7C). Het verschil suggereert een andere structurele rol voor de proline in geconserveerde CP dipeptiden dan die in de minder geconserveerde CP dipeptiden, meer bepaald op de proline positie.,

Figuur 7

driedimensionale structuren van heem-eiwitten met” CP ” – motieven. A) 3CQVA; B) 2CIWA; C) 1GIWA; en D) 2PBJA. De CP dipeptiden worden weergegeven als rode stokken. De directe downstream structuren van de CP dipeptiden zijn in blauw weergegeven.

CP dipeptiden zijn ook betrokken bij indirecte interactie met heme., Ragsdale en collega ‘ s rapporteerden een nieuwe rol voor CP-motieven in heme oxygenase 2 (HMOX-2) als een thiol/disulfide-redoxschakelaar die zich buiten de heme-bindende zak bevindt , waardoor de heme-eiwitinteractie wordt gereguleerd via het detecteren van de redoxstatus in het milieu. Er zijn in totaal negenentwintig CP dipeptiden in onze dataset. Minder dan een kwart van hen (in 7 eiwitketens waaronder 2PBJA) vertonen fysieke interacties met heemmoleculen., Het zou op dit punt onpraktisch zijn om de functionele rol van de resterende CP dipeptiden in heme-eiwitinteractie te voorspellen, hoofdzakelijk wegens de beperkte steekproefgrootte en het gebrek aan structurele details over heme pocket-CP interactie. Hier maakten we gebruik van statistische analyse om indirect de functionele relevantie van CP dipeptiden in heme interactie te beoordelen. De grondgedachte achter de test is dat, als CP dipeptiden belangrijke heme-signaturen zijn voor heme-interactie, het verwachte voorkomen van CP dipeptiden in hemoproteïnen hoger zou moeten zijn in vergelijking met de controlegroep., We vonden geen statistisch significant verschil tussen de aanwezigheid van CP dipeptiden in heme eiwitten en niet-heme eiwitten (gegevens niet getoond), suggereren Andere nog te worden geïdentificeerd factoren kunnen bestaan om te helpen bepalen van de rol CP dipeptiden spelen in heme binding ., Opgemerkt moet worden dat we de mogelijkheid niet uitsluiten dat er in de controlesteekproef Onbekende hemoproteïnen bestaan; maar om de frequentie van CP-signalen significant te beïnvloeden, zou er een aanzienlijk groot deel van de controle-eiwitten moeten zijn die worden geanalyseerd om heme-interactie te hebben, wat we als minder waarschijnlijk verwachten.,

Structuurvergelijking tussen apo-en holo heme-eiwitten

een interessante vraag met betrekking tot structuurgebaseerd heme-bindend eiwitontwerp en-voorspelling is de mate van globale conformationele transitie en de lokale veranderingen van de heme-bindende pocket op heme-binding. We verzamelden 446 heme eiwitketens (na het verwijderen van heme eiwitketens met minstens 90% sequentieidentiteit) en vergeleken hun sequenties met de eiwitketens zonder heme of heme-achtige liganden (aanvullend bestand 1, tabel S2)., Honderd negenenzeventig heme eiwitketens worden gevonden om apo-structuren met hoge opeenvolgingsgelijkenis en dekking te hebben. Na het verwijderen van overtollige apo / holo paren met een 25% sequentie identiteit cutoff en eiwitten met niet-heme of niet-heme-achtige liganden bezetten de heme binding pocket, de definitieve dataset bestaat uit 10 apo-holo eiwitparen. Tabel 2 laat zien dat 9 van de 10 eiwitten zeer kleine globale conformationele veranderingen ondergaan na heme binding met Rmsd ‘ s van 1,03 Å of minder. Het 2zdoa-1XBWD-paar (ijzergeregelde oppervlaktedeterminant IsdG van Staphylococcus aureus) heeft bijvoorbeeld een RMSD van 0.,59 Å. Bij afwezigheid van heem neemt het eiwit dezelfde bouw aan als het Holo-eiwit met heem (figuur 8A, B). Zelfs de zijketenposities van het histidine ligand zijn vergelijkbaar. Degene met relatief grote conformationele veranderingen is Rev-erb (3CQVA-2V7CA). Zonder heme beweegt de C-terminal helix (residuen 568-576) naar de heme pocket met His568 (heme-bindende ligand) gericht weg van de binding pocket (figuur 8C, D).,

Table 2 Comparisons between apo and holo heme protein structures
Figure 8

Structural comparison of apo-holo heme protein pairs. (A,B) 2ZDOA-1XBWD; (C,D) 3CQVA-2V7CA.

Three of the ten heme proteins in Table 2 have multiple known apo structures., 1KBIA (flavinbindend domein van bakkersgist flavocytochroom b2), 1N45A (humaan heme oxygenase-1), en 1N5UA (humaan serumalbumine) hebben respectievelijk 9, 3 en 28 apo-structuren (met ten minste 99% sequentieidentiteit, aanvullend dossier 1, tabel S3). Omdat de proteã nen inherent dynamisch zijn en conformational selectie als een belangrijk mechanisme voor biomoleculaire erkenning is beschouwd , controleerden wij de conformational verschillen tussen elk van de APO structuren en de holo structuren. Figuur 9A toont de RMSD (Ca atomen van aligned residues) waarden van de APO-holo structurele verschillen., De Rmsd ‘ s zijn over het algemeen minder dan 1Å voor 1KBIA en 1N45A. integendeel, apo structuren van 1N5UA vormen twee clusters. Leden van een cluster met 12 apo-structuren hebben Rmsd ’s rond 0,8 Å terwijl de andere 15 apo-structuren met Rmsd’ s variërend van 4 tot 5Å bevat. Door middel van handmatige inspectie, vonden we dat de verschillen worden veroorzaakt door het aantal niet-heme liganden in structuren. Naast heme heeft 1N5UA ook 5 myristinezuur (MYR) moleculen (figuur 9B). De APO structuren met hogere Rmsd ‘ s of hebben geen liganden (figuur 9C) of hebben slechts één of twee niet-MYR liganden., Bijvoorbeeld, 1E7AA en 2BX8B hebben respectievelijk 2 PFL en 1 AZQ. Aan de andere kant hebben apo-structuren met MYR liganden in vergelijkbare posities als die in 1N5UA over het algemeen kleinere Rmsd ‘ s (Figuur 9D). Daarom, onder gelijkaardig milieu, zijn er vrij kleine structurele verschillen tussen Holo en apo heme eiwitstructuren.

figuur 9

voorbeelden van heme-eiwitten met meerdere apo-structuren., A) RMSD-verdeling van de APO-structuur van drie heme-eiwitketens, 1KBIA, 1N45A en 1N5UA. De 28 apo structuren van 1N5UA vormen twee clusters (rode ovalen). (B) structuur van 1N5UA met één heme en vijf myristische zuurmoleculen (MYR, red spacefill). C) structuur van 1AO6A zonder liganden. (D) structuur van 3CX9A met vijf myristische zuurmoleculen (MYR, red spacefill) en één LPX ligand (orange spacefill).,

bovenstaande vergelijkingen zijn gebaseerd op heme-eiwitten met stabiele apo-structuren die zijn opgelost door middel van röntgenkristallografie. Voor sommige proteã nen, zoals in het geval van hemoglobine, kan de afwezigheid van ligand(s) de flexibiliteit verhogen en gedeeltelijke ontvouwing van de eiwitstructuur veroorzaken, die het voor structuurbepaling moeilijk maken . Voorts worden intrinsiek wanordelijke of ongestructureerde gebieden beschouwd om voor vele belangrijke cellulaire functies zoals ligandband verantwoordelijk te zijn ., Het bestaan van dergelijke flexibele apo-structuren zou echter niet interfereren met ons doel in structuurgebaseerde heme-eiwitvoorspelling aangezien we de bestaande apo-structuren in PDB als input willen nemen .

andere eigenschappen die nuttig zijn voor het vergelijken van apo-holo heme-eiwitten zijn de zakformaat en-vorm. Als gevolg van verschillende heme binding modi (gedeeltelijk blootgesteld of volledig ingebed, extra bestand 2 Figuur S3) en de moeilijkheid bij het identificeren van de exacte heme binding pocket van bestaande automatische programma ‘ s, de maten van heme binding pockets variëren van kleine (~400 Å3) tot zeer grote (meer dan 2000 Å3) (Tabel 2)., Bovendien zijn de veranderingen in absolute zakvolumes na heme binding variabel. Kleine veranderingen worden gezien in 2ITFA – 2ITEB, 2R7AA-2RG7 D, en 2ZDOA-1XBWD. Andere paren vertoonden significante volumeveranderingen ondanks de minimale conformationele verandering (Tabel 2). Om de vorm in overweging te nemen hebben we de Rvs-waarde (de verhouding van het zakvolume over het zakoppervlak) van elke zak berekend. De meeste apo of holo proteã nen hebben Rvs waarden rond 1.4., Om verder te onderzoeken of de binding zak kan worden gebruikt als een van de kenmerken voor heme eiwit voorspelling, we vergeleken de rvs distributies tussen heme binding zakken en zakken in niet-heme eiwitten (eiwitten die niet heme ligand(s) en zijn niet homoloog aan heme eiwitten) met vergelijkbare maten variërend van 350 tot 2000Å3. De Rvs van heme bindende zakken heeft een smalle verdeling terwijl de Rvs van vergelijkbare zakformaten van niet-heme proteã nen een brede verspreiding met een lange rechter staart heeft (extra dossier 2, Figuur S4-A)., We onderzochten ook de verdeling van Rvs genormaliseerd tot een bolvorm zoals geïntroduceerd door Sonavane en Chakrabarti . Een soortgelijke trend werd gevonden (aanvullend dossier 2, Figuur S4-B). Er moet op worden gewezen dat, hoewel Onbekende heme-eiwitten kunnen worden opgenomen in de niet-heme dataset, veel niet-heme-eiwitten delen soortgelijke pocket kenmerken.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *