Icke-redundant dataset av heme-bindande proteiner
Det är 1998 och 113 PRELIMINÄRA poster som innehåller ligand HEM (heme typ-b) och HÖGSKOLEPOÄNG (heme typ-c) respektive med en upplösning på 3Å eller bättre från och med den 24 November 2009 . Bland dessa poster, 10 (1BE3, 1BGY, 1FGJ, 1GWS, 1PP9, 1PPJ, 1S56, 1S61, 2A06, och 3H1J) innehåller både heme typ b och c., I toto 4272 identifierades proteinkedjor som heme interagerar proteinkedjor som beskrivs i metoder. En icke-redundant dataset av 125 proteinkedjor (114 heme-B och 11 heme-C, ytterligare fil 1, Tabell S1) genererades med hjälp av fiskarna med en sekvensidentitet cutoff på 25%. Åttiotvå procent av dessa proteinkedjor innehåller endast en hememolekyl medan antalet hememolekyler i de återstående proteinkedjorna varierar från 2 till 8 (ytterligare fil 1, Tabell S1)., Två exempel på multi-heme protein kedjor, 1FS7A med 5 typ b och 3F29A med 8 typ c heme molekyler, visas i (Figur 2A & 2B).
datauppsättningen av heme bindande proteiner innehåller en mängd olika protein veck. Totalt 86 proteinkedjor (~69% av datauppsättningen) har SCOP-anteckningar (baserat på frisättning 1.75 och Pre-SCOP) och tillhör 31 olika strukturella veck i alla fyra huvudklasserna (Tabell 1) . Datauppsättningen domineras av proteiner i All-α-klassen, vilket utgör 64% (55 av 86) av den totala. De översta 4 veck, Globin-liknande (A.1), cytokrom P450 (a.104), Cytokrom c (a.3), och multi-heme cytokromer (a.,138) representerar de välkända heme-bindande proteinerna som har undersökts utförligt (Tabell 1).
strukturell miljö av heme bindningsfickorna
för att undersöka den strukturella miljön av heme bindningsfickor identifierade vi båda rester som gör koordinatbindningar med heme bindningsfickorna.heme järn och de som interagerar med heme porfyrin struktur (figur 2c och metoder)., Av de 125 heme-bindande protein kedjor, bara 2PBJA och 3HCNA inte har rester identifierats som axiella ligander till heme järn även om båda har omfattande kontakter med heme; i stället andra små molekyler, såsom glutation (GSH) i 2PBJA (mikrosomalt prostaglandin E syntas) och imidazol (IMD) i 3HCNA (mänskliga ferrochelatase) form samordna obligationer med heme järn. Fem olika aminosyror (H, M, C, Y, K) finns för att fungera som axiella ligander till heme järn med histidin som den dominerande återstoden (~80%) i både heme b och heme C-typer (Figur 3)., Heme b använder fler cysteinrester medan heme C har något mer metioninrester som axiella ligander. Det bör påpekas att det bara finns 41 rester som heme C ligander. Därför kan procentsatserna av icke-histidinligander ha en relativt stor förändring med en liten ökning eller minskning av ligandnummer på grund av den lilla datauppsättningen.
de bevarade interaktionerna mellan proteinrester och heme studerades tidigare genom att beräkna antingen frekvenserna av rester som finns i van der Waals kontakt med heme för varje vikklass av heme-proteiner av B-typ eller genom att beräkna medeltalet per bindningsställe . Smith et al tillämpade också normaliserade aminosyraprofiler för att bedöma kompositionen och bevarandet av heme-bindningsställen ., Här undersökte vi restpreferenser i heme bindande fickor genom att beräkna de relativa frekvenserna av heme bindande rester i vår icke-redundanta dataset. Den relativa frekvensen av varje aminosyra normaliseras till dess bakgrundsfrekvens.
normalt beräknas bakgrundsfrekvenserna som används för jämförelser från en icke-redundant proteindataset. På grund av den dominerande närvaron av All-α-veck är det emellertid inte klart om restfördelningen i heme-proteiner skiljer sig från den i andra proteiner., Därför jämförde vi först restfördelningarna mellan icke-överflödiga hemproteiner och icke-överflödiga alla proteiner. För att undvika problem med saknade rester och kloning artefakter (hans-taggar etc.) i samband med PDB-sekvenser använde vi inhemska proteinsekvenser i full längd för att beräkna restkompositioner genom att kartlägga PDB-kedjorna till Uniprot-poster med PDBSWS ., De relativa resthaltsfrekvenserna mellan hemproteiner och alla proteiner visar att hemproteiner tenderar att innehålla mer alanin, fenylalanin, histidin, metionin och tryptofanrester och färre cystein, asparaginsyra, isoleucin, lysin, asparagin och serinrester (ytterligare Fil 2, Figur S1). Statistisk analys (χ2) avslöjade en signifikant skillnad mellan dessa två frekvensprofiler (data visas inte)., För att få en meningsfull beskrivning av anrikning eller brist på rester i heme-interagerande miljön använde vi bakgrundsfrekvenserna från den icke-överflödiga uppsättningen heme-proteiner som referenser.
de fem högsta resthalterna med höga relativa frekvenser är cystein (C), histidin (H), fenylalanin (F), metionin (M) och tyrosin (Y) (figur 4A). Eftersom fyra av de fem bästa (C, H, M och Y) kan fungera som axiella ligander till heme järn (Figur 3), tog vi bort axiella ligander från datauppsättningen och räknade om de relativa frekvenserna., Figur 4B visar att nivån av histidin minskar till bakgrundsnivån, vilket tyder på att anrikningen av histidin huvudsakligen beror på det stora antalet heme histidinligander. De övriga fyra resthalterna har däremot nästan samma relativa frekvenser med eller utan ligandrester (figur 4B). I heme C-proteiner är förekomsten av cysteinrester extremt hög med en åtta faldig anrikning jämfört med bakgrundsfördelningen., Detta är inte förvånande eftersom det klassiska cxxch-bindande motivet, där histidin tjänar som ligand och cysteinrester bildar kovalenta tioetrebindningar med heme-vinylgrupperna, har dominerande närvaro i heme C-proteiner.
i överensstämmelse med tidigare rapporter spelar de aromatiska resterna (fenylalanin, tyrosin och tryptofan) viktiga roller i protein-heme-interaktioner genom att stapla interaktioner med porfyrin. Ett undantag är tryptofan i heme C-proteiner, vilket visade en liknande nivå av händelser jämfört med bakgrunden (figur 4A). Leucin, isoleucin och valin, som gör hydrofoba interaktioner med heme ringstrukturen, ökar något över bakgrundsfrekvenserna., Resterna med de minsta förekomsterna, asparaginsyra, glutaminsyra och lysin är laddade rester, vilket tyder på att heme bindningsfickan huvudsakligen är en hydrofob miljö. Däremot har arginin, en positivt laddad rest som har ansetts vara en stor aktör i förankringen av heme propionater, en mycket högre förekomst än andra laddade aminosyror och visar en liknande (HEM) eller något högre (HEC) frekvens till bakgrunden (figur 4A) .
de sekundära strukturtyperna för heme-interagerande rester visas i Figur 5., Det finns mer spiralformade och mindre spoltyper i proteiner med heme B oavsett vilken dataset (heme proteiner eller alla proteiner) används som referens. Skillnaden beror därför inte på det stora antalet all-a-proteiner i datauppsättningen. När det gäller heme interagerande rester i heme c har de liknande fördelning till bakgrunden (Figur 5). Baserat på vår 3-Kategori Klassificering av relativ lösningsmedelstillgänglighet är heme-interagerande rester mindre benägna att exponeras. De begravda resterna är jämförbara med bakgrundsfördelningen., Ca 20% ökning observeras i mellankategorin (ytterligare Fil 2, Figur S2).
Heme bindande sekvensmotiv
för att undersöka möjliga sekvensmotiv involverade i heme bindning samlades flankeringssekvenserna med fyra rester på varje sida av heme axiella ligander och justerades., Den icke-redundanta datasetet har 34 heme C-ligander, varav 32 har histidin som axiella ligander. Inriktningen av dessa sekvenser visar det klassiska cxxch heme C-bindningsmotivet (figur 6A).
ett annat motiv värt att notera, g XXCG, kommer från heme B-proteinerna med cystein som axiella ligander (figur 6B). Motivet representerar den klassiska CYP signatur heme bindande motiv FXXGXXCXG i bakterier, växter och däggdjur cytokrom P450-s ., Vid -4 och + 2-positionerna (med ligandcystein som referensposition) är små aminosyror (glycin) medan -2-positionen föredrar en positivt laddad aminosyra som histidin eller arginin. Dessa positivt laddade rester interagerar elektroniskt med de negativt laddade heme propionaten (figur 6C och 6D). Den lilla glycinrester vid -4-positionen kan ge den flexibilitet som behövs för att placera de positivt laddade resterna nära heme propionatgrupper. + 1-positionen domineras av prolin och hydrofoba aminosyror, leucin, alanin, valin och isoleucin., Sex av de arton fallen har prolin direkt efter den axiella ligandcysteinen, som påminner om dipeptid CP-motivet som är inblandat i heme-avkänning och reglering ., Medan betydelsen av CP-motiv har studerats genom radering eller platsstyrda mutationsexperiment i flera viktiga proteiner, inklusive transkriptionsrepressor Bach1, järnreglerande protein 2 (IRP2) , cirkadian factor period 2 (Per2) och δ-aminolevulinsyrasyntas (ALAS) , är den möjliga rollen av CP-motivet i heme interaktion ur strukturell synvinkel oklart eftersom strukturerna för de flesta av dessa proteiner med sådana CP-motiv är okända.,
alla sex CP-dipeptider som har direkta fysiska interaktioner med heme uppvisar liknande strukturella roller med cysteinerna som tjänar som ligander till heme-järnet och prolinrester som introducerar en böjning för nedströmsstrukturerna, främst α-helices, för att styra dem bort från heme-ansiktet (figur 7B och 7C). En sjunde proteinkedja, 2PBJA, innehåller en CP där prolinen visar mycket liknande strukturella konsekvenser, medan cysteinrester interagerar med heme men inte som en ligand., Istället verkar närvaron av en glutationmolekyl (GSH), som bildar en samordningsbindning med heme-järnet, trycka cysteinen något bort från axial ligandpositionen (5.25 Å från heme-järn) . Med tanke på konformationen i prolin-böjstrukturen och det lilla avståndet mellan cystein och heme järn, är det troligt att cystein kan fungera som en heme ligand om GSH inte är närvarande i strukturen., Intressant, en närmare undersökning av den strukturella konformationen nedströms prolin rester i 2CIWA (cloroperoxidas), 3cqva (Rev-erb), och 2PBJA (microsomal prostaglandin E syntas), som har CP heme motiv med konserverade prolin, indikerar nästan vinkelrät orientering till heme Planet (figur 7A, 7B och 7D)., I P450-familjen där prolinrester är mindre bevarade, med leucin, isoleucin och metionin som också finns i prolinens position som visas i motivets logotyp (figur 6B), är α-helices efter prolinrester parallella med heme-Planet (figur 7C). Skillnaden tyder på en annan strukturell roll för prolin i konserverade CP-dipeptider från den i de mindre konserverade CP-dipeptiderna, mer specifikt vid prolinpositionen.,
CP dipeptider har också varit inblandade i indirekt interaktion med heme., Ragsdale och kollegor rapporterade en ny roll för CP motiv i heme oxygenas 2 (HMOX-2) som en tiol/disulfid redox switch som lokaliserar utanför heme-bindande fickan , därför reglerar heme-protein interaktion via sensing redox status i miljön. Det finns totalt tjugonio CP-dipeptider i vår dataset. Mindre än en fjärdedel av dem (i 7 proteinkedjor inklusive 2pbja) visar fysiska interaktioner med hemmolekyler., Det skulle vara opraktiskt vid denna tidpunkt att förutsäga den funktionella rollen hos de återstående CP-dipeptiderna i heme-proteininteraktion, främst på grund av den begränsade provstorleken och bristen på strukturella detaljer om heme pocket-CP-interaktion. Här använde vi oss av statistisk analys för att indirekt bedöma den funktionella relevansen av CP-dipeptider i heme-interaktion. Grunden bakom analysen är att om CP-dipeptider är viktiga heme-signaturer för heme-interaktion, bör de förväntade förekomsterna av CP-dipeptider i hemoproteiner vara högre jämfört med kontrollpopulationen., Vi fann ingen statistiskt signifikant skillnad mellan närvaron av CP-dipeptider i heme-proteiner och icke-heme-proteiner (data som inte visas), vilket tyder på att andra ännu inte identifierade faktorer kan existera för att bestämma rollen CP-dipeptider spelar i heme-bindning ., Det bör noteras att vi inte utesluter möjligheten att det i kontrollprovet finns okända hemoproteiner; men för att de väsentligt ska påverka frekvensen av CP-signaler måste det finnas en betydligt stor del av kontrollproteinerna som analyseras för att vara heme-interagerande, vilket vi förväntar oss som mindre sannolikt.,
Strukturjämförelse mellan apo och holo heme proteiner
en intressant fråga relaterad till strukturbaserad heme bindande protein design och förutsägelse är graden av global konformationsövergång och de lokala förändringarna av heme-bindande ficka på heme bindning. Vi samlade 446 heme proteinkedjor (efter att ha tagit bort heme proteinkedjor med minst 90% sekvensidentitet) och jämförde deras sekvenser med proteinkedjorna utan heme eller heme-liknande ligander (ytterligare fil 1, Tabell S2)., Ett hundra sjuttionio heme proteinkedjor finns att ha apo strukturer med hög sekvens likhet och täckning. Efter att ha tagit bort överflödiga apo/holo-par med en 25% sekvensidentitet cutoff och proteiner med icke-heme eller icke-heme-liknande ligander upptar heme bindande ficka, den slutliga datasetet består av 10 apo-holo proteinpar. Tabell 2 visar att 9 av 10 proteiner genomgår mycket små globala konformationsförändringar efter heme-bindning med RMSDs på 1,03 Å eller mindre. Till exempel 2ZDOA-1XBWD par (järn-reglerade yta faktor IsdG från Staphylococcus aureus) har en RMSD 0.,59 Å. I avsaknad av heme antar proteinet samma konformation som holo-proteinet med heme (figur 8A, B). Även sidokedjans positioner hos histidinliganden är likartade. Den med relativt stora konformationsförändringar är Rev-erb (3CQVA-2V7CA). Utan heme rör sig C-terminalen helix (rester 568-576) mot hemfickan med His568 (heme-bindande ligand) vänd bort från bindningsfickan (figur 8C, D).,
Three of the ten heme proteins in Table 2 have multiple known apo structures., 1KBIA (flavinbindande domän för bakersjäst flavocytokrom b2), 1n45a (humant heme-oxygenas-1) och 1n5ua (humant serumalbumin) har 9, 3 respektive 28 apo-strukturer (med minst 99% sekvensidentitet, ytterligare fil 1, Tabell S3). Eftersom proteiner i sig är dynamiska och konformationellt urval har ansetts vara en viktig mekanism för biomolekylärt erkännande, kontrollerade vi konformationsskillnaderna mellan var och en av apo-strukturerna och holo-strukturerna. Figur 9A visar rmsd-värdena (ca-atomer av aligned residues) för de strukturella skillnaderna mellan apo-holo., Den RMSDs är i allmänhet mindre än 1Å för 1KBIA och 1N45A. Tvärtom, apo strukturer 1N5UA form två kluster. Medlemmar i ett kluster med 12 apo strukturer har RMSDs runt 0,8 Å medan den andra innehåller 15 apo strukturer med RMSDs allt från 4 till 5Å. Genom manuell inspektion fann vi att skillnaderna orsakas av antalet icke-heme ligander i strukturer. Förutom heme har 1N5UA också 5 myristinsyra (MYR) molekyler (figur 9B). Apo-strukturerna med högre RMSDs har antingen inte ligander (figur 9C) eller har bara en eller två icke-MYR-ligander., Till exempel har 1e7aa och 2BX8B 2 PFL respektive 1 AZQ. Å andra sidan har apo-strukturer med MYR ligands i liknande positioner som de i 1n5ua i allmänhet mindre RMSDs (figur 9D). Därför finns det under liknande miljö relativt små strukturella skillnader mellan holo och apo heme proteinstrukturer.
det bör noteras att ovanstående jämförelser är baserade på hemproteiner som har stabila apo-strukturer lösta genom röntgenkristallografi. För vissa proteiner, som i fallet med hemoglobin, kan frånvaron av ligand(s) öka flexibiliteten och orsaka partiell utveckling av proteinstrukturen, vilket gör det svårt för strukturbestämning . Dessutom anses inneboende oordnade eller ostrukturerade regioner vara ansvariga för många viktiga cellulära funktioner som ligandbindning ., Förekomsten av sådana flexibla apo-strukturer skulle emellertid inte störa vårt mål i strukturbaserad heme-proteinprognos eftersom vi strävar efter att ta de befintliga apo-strukturerna i PDB som ingångar .
andra funktioner som är användbara för att jämföra apo-holo heme proteiner är fickstorleken och formen. På grund av olika heme bindningslägen (delvis exponerad eller helt inbäddad, ytterligare Fil 2 Figur S3) och svårigheten att identifiera den exakta heme bindningsfickan från befintliga automatiska program varierar storlekarna på heme bindningsfickor från små (~400 Å3) till mycket stora (över 2000 Å3) (Tabell 2)., Dessutom varierar förändringarna i absoluta fickvolymer efter heme bindning. Små förändringar ses i 2ITFA-2ITEB, 2R7AA-2RG7 D, och 2ZDOA-1XBWD. Andra par uppvisade betydande volymförändringar trots den minimala konformationsförändringen (Tabell 2). För att ta hänsyn till formen beräknade vi Rvs-värdet (förhållandet mellan fickvolymen över fickans yta) i varje ficka. De flesta apo-eller holoproteinerna har Rvs-värden runt 1,4., För att ytterligare undersöka om bindningsfickan kan användas som en av egenskaperna för heme protein förutsägelse, jämförde vi Rvs distributioner mellan heme bindande fickor och fickor I icke-heme proteiner (proteiner som inte har heme ligand(s) och är inte homologa till heme proteiner) med liknande storlekar som sträcker sig från 350 till 2000Å3. Rvs av heme bindande fickor har en smal fördelning medan Rvs från liknande fickstorlekar av icke-heme proteiner har en bred spridning med en lång höger svans (ytterligare Fil 2, Figur S4-A)., Vi undersökte också fördelningen av Rvs normaliseras till en sfär form som infördes av Sonavane och Chakrabarti . En liknande trend hittades (ytterligare Fil 2, Figur S4-B). Det bör påpekas att även om okända heme-proteiner kan ingå i icke-heme-dataset, delar många icke-heme-proteiner liknande fickegenskaper.