Ikke-redundante datasæt af hæm-bindende proteiner
Der er i 1998 og 113 FBF poster, der indeholder ligand HEM (hæm-type-b) og HEC (hæm-type-c) henholdsvis med beslutninger af 3Å eller bedre som af November 24, 2009 . Blandt disse poster, 10 (1BE3, 1BGY, 1FGJ, 1GWS, 1PP9, 1PPJ, 1S56, 1S61, 2A06, og 3H1J), indeholder både hæm-type b og c., I toto 4272 blev proteinkæder identificeret som hæm-interagerende proteinkæder som beskrevet i metoder. Et ikke-redundant datasæt på 125 proteinkæder (114 hæm-B og 11 hæm-C, yderligere fil 1, tabel S1) blev genereret ved hjælp af fiskene med en sekvensidentitet cutoff på 25%. Toogfirs procent af disse proteinkæder indeholder kun et hæmmolekyle, mens antallet af hæmmolekyler i de resterende proteinkæder varierer fra 2 til 8 (yderligere fil 1, tabel S1)., To eksempler på multi-hæm protein kæder, 1FS7A med 5 type b og 3F29A med 8 type c hæm-molekyler, der er vist på (Figur 2A & 2B).
datasættet for hæmbindende proteiner inkluderer en lang række proteinfoldninger. I alt 86 protein kæder (~69% af datasættet) har SCOP anmærkninger (baseret på frigivelse 1.75 og Pre-SCOP), og hører til 31 forskellige strukturelle foldninger i alle fire hovedkategorier (Tabel 1) . Datasættet domineres af proteiner i all-class-klassen, hvilket udgør 64% (55 af 86) af det samlede antal. De øverste 4 folder, Globinlignende (a.1), cytochrom P450 (a.104), cytochrom c (a.3) og Multiheme cytochromer (a.,138) repræsenterer de velkendte hæmbindende proteiner, der er blevet undersøgt omfattende (tabel 1).
Strukturelle miljø af hæm-bindende lommer
for At undersøge de strukturelle miljø af hæm-bindende lommer, vi identificeret både rester, der gør koordinere obligationer med hæm-jern-og dem, der interagerer med hæm-porphyrin struktur (Figur 2C og Metoder)., Ud af de 125 hæm-bindende protein kæder, kun 2PBJA og 3HCNA ikke har rester identificeret som aksiale ligander til hæm jern selvom de begge har omfattende samspil med hæm; i stedet andre små molekyler, såsom glutathion (GSH) i 2PBJA (mikrosomale prostaglandin E-syntase) og imidazol (IMD) i 3HCNA (human ferrochelatase) form koordinere obligationer med hæm-jern. Fem forskellige aminosyrer (H, M, C, Y, K) er fundet til at tjene som aksiale ligander til hæm-jern med histidin som den dominerende rest (~80%) i begge hæm-b og hæm-c-typer (Figur 3)., Heme B udnytter flere cysteinrester, mens heme C har lidt flere methioninrester som aksiale ligander. Det skal påpeges, at der kun er 41 rester som heme C-ligander. Derfor kan procentdelene af ikke-histidinligander have en relativt stor ændring med en lille stigning eller fald i ligandtal på grund af det lille datasæt.
Den bevares interaktioner mellem proteiner restprodukter og hæm tidligere blev undersøgt ved at beregne enten de frekvenser, der er af rester, der er i van der Waals kontakt med hæm-for hver fold klasse b-type hæm proteiner eller ved at beregne det gennemsnitlige antal pr bindende site . Smith et al anvendte også normaliserede aminosyreprofiler for at vurdere sammensætningen og bevarelsen af hæmbindingssteder ., Her undersøgte vi restpræferencerne i hæmbindingslommerne ved at beregne de relative frekvenser af hæmbindingsrester i Vores ikke-redundante datasæt. Den relative frekvens af hver aminosyre normaliseres til dens baggrundsfrekvens.
normalt beregnes baggrundsfrekvenserne, der anvendes til sammenligninger, ud fra et ikke-redundant protein datasæt. På grund af den dominerende tilstedeværelse af all-a-folder er det imidlertid ikke klart, om restfordelingen i hæm-proteiner er forskellig fra den i andre proteiner., Derfor sammenlignede vi først restfordelingen mellem ikke-redundante hemeproteiner og ikke-redundante alle proteiner. For at undgå problemer med manglende rester og kloning artefakter (hans-tags osv.) forbundet med PDB-sekvenser brugte vi native fuldlængde proteinsekvenser til at beregne restsammensætninger ved at kortlægge PDB-kæderne til Uniprot-poster med PDBS .s ., Den relative rest frekvenser mellem hæm proteiner og alle proteiner, der viser, at hæm proteiner har en tendens til at indeholde mere alanin, phenylalanin, histidin, methionin, og tryptophan restprodukter og færre cystein, asparaginsyre, isoleucin, lysin, asparagin, og serin rester (Ekstra fil 2, Figur S1). Statistisk analyse (22) afslørede en signifikant forskel mellem disse to frekvensprofiler (data ikke vist)., For at få en meningsfuld beskrivelse af berigelsen eller manglen på rester i heme-interagerende miljø brugte vi baggrundsfrekvenserne fra det ikke-redundante sæt heme-proteiner som referencer.
De fem rester med relativt høje frekvenser er cystein (C), histidin (H), phenylalanin (F), methionin (M), og tyrosin (Y) (Figur 4A). Fordi fire af de fem øverste (C, H, M og Y) kan tjene som aksiale ligander til hæm jern (figur 3), fjernede vi aksiale ligander fra datasættet og genberegnede de relative frekvenser., Figur 4B viser, at niveauet af histidin falder til baggrundsniveauet, hvilket antyder, at berigelsen af histidin i det væsentlige skyldes det store antal hæm histidinligander. De andre fire rester har på den anden side næsten de samme relative frekvenser med eller uden ligandrester (figur 4B). I heme C-proteiner er forekomsten af cysteinrester ekstremt høj med en otte gange berigelse sammenlignet med baggrundsfordelingen., Dette er ikke overraskende, da den klassiske CXXCH bindende motiv, hvor histidin fungerer som ligand og cystein rester danner kovalente thioether obligationer med hæm-vinyl grupper, der har en dominerende tilstedeværelse i hæm-c proteiner.
i Overensstemmelse med tidligere rapporter, aromatiske rester (phenylalanin, tyrosin og tryptophan) spiller en vigtig rolle i protein-hæm interaktioner gennem stabling interaktioner med porphyrin. En undtagelse er tryptophan i hæm C-proteiner, som viste et lignende niveau af forekomster sammenlignet med baggrunden (figur 4A). Leucin, isoleucin og valin, der skaber hydrofobe interaktioner med hæm ringstrukturen, øges lidt over baggrundsfrekvenserne., Resterne med færrest forekomster, asparaginsyre, glutaminsyre og lysin er ladede rester, hvilket antyder, at hæmbindingslommen hovedsageligt er et hydrofobt miljø. I modsætning, arginin, en positivt ladet rest, som har været betragtet som en vigtig aktør i at forankre hæm propionates, har en meget højere forekomst end andre ladede aminosyrer og viser en lignende (HEM) eller lidt højere (HEC) niveau af frekvens til baggrund (Figur 4A) .
de sekundære strukturtyper for hæm-interagerende rester er vist i figur 5., Der er mere spiralformede og mindre spoletyper i proteiner med hæm b, uanset hvilket datasæt (hæm-proteiner eller alle proteiner) der bruges som reference. Forskellen skyldes derfor ikke det store antal all-a-proteiner i datasættet. Hvad angår hæm-interagerende rester i hæm c, har de samme fordeling som baggrunden (figur 5). Baseret på vores 3-kategori klassificering af relativ opløsningsmiddeltilgængelighed er det mindre sandsynligt, at de heme-interagerende rester udsættes. De nedgravede rester kan sammenlignes med baggrundsfordelingen., 20% stigning observeres i mellemkategorien (yderligere fil 2, Figur S2).
Hæm bindende rækkefølge motiver
for At undersøge en mulig sekvens motiver, der er involveret i hæm bindende, de flankerende sekvenser med fire rester på hver side af hæm-axial ligander blev indsamlet og justeret., Det ikke-redundante datasæt har 34 hæm C-ligander, hvoraf 32 har histidin som aksiale ligander. Justeringen af disse sekvenser viser det klassiske C..ch heme c-bindingsmotiv (figur 6A).
et andet motiv, der er værd at bemærke, G..cg, kommer fra hæm B-proteinerne med cystein som aksiale ligander (figur 6B). Motivet repræsenterer det klassiske CYP signature hæmbindingsmotiv f ..g. .c .g i bakterier, planter og pattedyr cytochrom P450 s., På -4 og +2 positioner (med ligand cystein som reference position) er små aminosyrer (glycin), mens -2 position foretrækker en positivt ladet aminosyre-såsom arginin, histidin eller. Disse positivt ladede rester interagerer elektronisk med de negativt ladede hæmpropionater (figur 6C og 6D). Den lille glycinrest i -4-positionen kan give den fleksibilitet, der er nødvendig for at placere de positivt ladede rester tæt på heme propionatgrupper. Positionen + 1 er domineret af prolin og hydrofobe aminosyrer, leucin, alanin, valin og isoleucin., Seks af de atten tilfælde har prolin lige efter den aksiale ligandcystein, der minder om, at dipeptidet CP-motiv er impliceret i heme sensing og regulering ., Mens betydningen af CP motivet er blevet undersøgt ved sletning eller site-directed mutation eksperimenter i flere vigtige proteiner, herunder transskription repressor Bach1, strygejern regulerende protein 2 (IRP2) , døgnrytmen faktor, periode 2 (Per2) og δ-aminolevulinic acid-syntase (ALAS) , den mulige rolle, CP motiv i hæm interaktion fra et strukturelt synspunkt er fortsat uklart, de strukturer, der for de fleste af disse proteiner med en sådan CP motiver er ukendte.,
Alle de seks CP dipeptides, der har direkte fysisk interaktion med hæm udviser lignende strukturelle roller med cysteines, der tjener som ligander til hæm-jern og prolin rest indføre en bøje for downstream-strukturer, primært α-helices, at styre dem væk fra hæm-ansigt (Figur 7B og 7C). En syvende proteinkæde, 2PBJA, indeholder en CP, hvor prolin viser meget lignende strukturelle implikationer, hvorimod cysteinresten interagerer med hæm, men ikke som en ligand., I stedet, tilstedeværelsen af en glutathion-molekyle (GSH), som danner en koordinering obligation med hæm-jern, ser ud til at skubbe cystein lidt væk fra den aksiale ligand position (5.25 Å fra hæm-jern) . I betragtning af konformationen i prolin-bøjningsstrukturen og den lille afstand mellem cystein og hemejern er det sandsynligt, at cystein kan tjene som en heme ligand, hvis GSH ikke er til stede i strukturen., Det er interessant, at en nærmere undersøgelse af de strukturelle kropsbygning neden for prolin rest i 2CIWA (cloroperoxidase), 3CQVA (Rev-erb), og 2PBJA (mikrosomale prostaglandin E-syntase), der har CP hæm-motiver med bevaret, prolin, angiver næsten vinkelret orientering til hæm-plan (Figur 7A, 7B og 7D)., I modsætning hertil, i P450 familie, hvor prolin resten er mindre bevaret, med leucin, isoleucin, og methionin også findes på position af prolin, som vist i motiv, logo (Figur 6B), α-helices efter prolin rest er parallelt med hæm-plan (Figur 7C). Forskellen antyder en anden strukturel rolle for prolin i konserverede CP dipeptider end den i de mindre konserverede CP dipeptider, mere specifikt i prolinpositionen.,
CP dipeptider er også blevet impliceret i indirekte interaktion med hæm., Ragsdale og kolleger rapporterede en ny rolle for CP-motiver i hæm oxygenase 2 (HMOX-2) som en thiol/disulfid redox-switch, der lokaliserer uden hæm-bindende lommen , derfor regulerer hæm-protein interaktion via sensing redox-status i miljøet. Der er i alt niogtyve CP dipeptider i vores datasæt. Mindre end en fjerdedel af dem (i 7 proteinkæder inklusive 2PBJA) viser fysiske interaktioner med hæmmolekyler., Det ville være upraktisk på dette tidspunkt at forudsige den funktionelle rolle af de resterende CP-dipeptider i hæm-protein-interaktion, hovedsageligt på grund af den begrænsede prøvestørrelse og manglen på strukturelle detaljer om hæm pocket-CP-interaktion. Her gjorde vi brug af statistisk analyse til indirekte at vurdere den funktionelle relevans af CP dipeptider i hæm interaktion. Begrundelsen bag analysen er, at hvis CP-dipeptider er vigtige hæm-signaturer for hæm-interaktion, bør de forventede forekomster af CP-dipeptider i hæmoproteiner være højere sammenlignet med kontrolpopulationen., Vi fandt ingen statistisk signifikant forskel mellem tilstedeværelsen af CP-dipeptider i hemeproteiner og ikke-hemeproteiner (data ikke vist), hvilket antyder, at andre endnu ikke identificerede faktorer kan eksistere for at hjælpe med at bestemme den rolle, CP-dipeptider spiller i heme-binding ., Det skal bemærkes, at vi ikke udelukke muligheden for, at der i stikprøven findes der ukendte hemoproteins; men for dem at påvirke hyppigheden af CP signaler, der ville have til at være en betydelig stor del af den kontrol proteiner ved at blive analyseret til at være hæm-interaktion, som vi forventer som mindre sandsynligt.,
Struktur sammenligning mellem apo og holo hæm proteiner
Et interessant spørgsmål, der er relateret til struktur-baseret hæm-bindende protein, design og forudsigelse er graden af global konformationelle overgang og de lokale ændringer af hæm-bindende lomme på hæm bindende. Vi indsamlede 446 hæm-proteinkæder (efter fjernelse af hæm-proteinkæder med mindst 90% sekvensidentitet) og sammenlignede deres sekvenser med proteinkæderne uden hæm eller hæm-lignende ligander (yderligere fil 1, tabel S2)., Et hundrede nioghalvfjerds heme-proteinkæder viser sig at have apo-strukturer med høj sekvenslighed og dækning. Efter fjernelse af overflødige apo/holo par med en 25% sekvens identitet cutoff og proteiner med non-hæm eller ikke-heme-som ligander besætter hæm-bindende lomme, den endelige datasæt består af 10 apo-holo protein par. Tabel 2 viser, at 9 ud af 10 proteiner gennemgår meget små globale konformationsændringer efter hæmbinding med RMSDs på 1,03 Å eller mindre. For eksempel 2ZDOA-1XBWD par (jern-reguleret overflade determinant IsdG fra Staphylococcus aureus) er en RMSD på 0.,59 Å. I fravær af hæm antager proteinet den samme konformation som holo-proteinet med hæm (figur 8A, B). Selv sidekædepositionerne i histidinliganden er ens. Den med relativt store konformationsændringer er Rev-ERB (3C .va-2V7CA). Uden hæm bevæger den C-terminale Heli. (rester 568-576) sig mod hæm lommen med His568 (hæm-bindende ligand) vendt væk fra bindelommen (figur 8C, D).,
Three of the ten heme proteins in Table 2 have multiple known apo structures., 1KBIA (flavin-bindende domæne af bagegær flavocytochrome b2), 1N45A (human hæm oxygenase-1), og 1N5UA (human serum albumin) har 9, 3, og artikel 28, apo strukturer henholdsvis (med mindst 99% sekvens identitet, Ekstra fil 1, Tabel S3). Da proteiner i sagens natur er dynamiske, og konformationsvalg er blevet betragtet som en vigtig mekanisme til biomolekylær genkendelse , kontrollerede vi konformationelle forskelle mellem hver af apo-strukturerne og holo-strukturerne. Figur 9A viser rmsd (Ca atomer af justerede rester) værdier af APO-holo strukturelle forskelle., Rmsd ‘ erne er generelt mindre end 1Å for 1KBIA og 1N45A. tværtimod danner apo strukturer af 1N5UA to klynger. Medlemmer af en klynge med 12 apo strukturer har RMSDs omkring 0,8 Å, mens den anden indeholder 15 apo strukturer med RMSDs spænder fra 4 til 5Å. Gennem manuel inspektion fandt vi, at forskellene skyldes antallet af ikke-hæm ligander i strukturer. Foruden hæm har 1N5UA også 5 myristinsyre (MYR) molekyler (figur 9B). Apo strukturer med højere RMSDs enten ikke har ligander (figur 9C) eller har kun en eller to ikke-MYR ligander., For eksempel har 1E7AA og 2B .8b henholdsvis 2 PFL og 1 A respectively respectively. På den anden side har apo-strukturer med MYR-ligander i lignende positioner som dem i 1N5UA generelt mindre Rmsd ‘ er (Figur 9D). Derfor er der under lignende miljø relativt små strukturelle forskelle mellem holo og apo hæm-proteinstrukturer.
det skal bemærkes, at ovenstående sammenligninger er baseret på hæm-proteiner, der har stabile apo-strukturer løst gennem røntgenkrystallografi. For nogle proteiner, som i tilfælde af hæmoglobin, kan fraværet af ligand(er) øge fleksibiliteten og forårsage delvis udfoldning af proteinstrukturen, hvilket gør det vanskeligt for strukturbestemmelse . Desuden betragtes iboende uordnede eller ustrukturerede regioner som ansvarlige for mange vigtige cellulære funktioner, såsom ligandbinding ., Eksistensen af sådanne fleksible apo-strukturer ville imidlertid ikke forstyrre vores mål i strukturbaseret heme-proteinforudsigelse, da vi sigter mod at tage de eksisterende apo-strukturer i FBF som input .
andre funktioner, der er nyttige til sammenligning af apo-holo heme-proteiner, er lommestørrelse og form. På grund af forskellige hæm bindende tilstande (delvist udsat eller fuldt integreret, Ekstra fil 2 Figur S3), og det er vanskeligt at identificere den nøjagtige hæm bindende lomme fra eksisterende automatiske programmer, størrelser af hæm-bindende lommer variere fra små (~400 Å3) til meget store (over 2000 Å3) (Tabel 2)., Derudover er ændringerne i absolutte lommevolumener efter hæmbinding variable. Små ændringer er set i 2ITFA-2ITEB, 2R7AA-2RG7 D, og 2ZDOA-1XBWD. Andre par udviste betydelige ændringer i volumen på trods af den minimale konformationsændring (tabel 2). For at tage formen i betragtning beregnet vi Rvs-værdien (forholdet mellem lommevolumen over lommens overfladeareal) på hver lomme. De fleste af apo-eller holo-proteinerne har Rvs-værdier omkring 1.4., For yderligere at undersøge, om den bindende lomme kan bruges som et af kendetegnene for hæm proteiner forudsigelse, vi har sammenlignet de Autocampere fordelinger mellem hæm bindende lommer samt lommer i non-hæm proteiner (proteiner, der ikke har hæm-ligand(s) og ikke er homologe til hæm proteiner) med tilsvarende størrelser fra 350 til 2000Å3. Rvs af hæm bindende lommer har en smal fordeling mens Rvs fra lignende pocket størrelser af ikke-hæm proteiner har en bred spredning med en lang højre hale (yderligere fil 2, Figur S4-a)., Vi undersøgte også fordelingen af Rvs normaliseret til en kugleform som introduceret af Sonavane og Chakrabarti . En lignende tendens blev fundet (yderligere fil 2, Figur S4-B). Det skal påpeges, at selvom ukendte hæm-proteiner kan indgå i ikke-hæm-datasættet, har mange ikke-hæm-proteiner lignende lommeegenskaber.