Nicht redundanter Datensatz von Häm-Bindungsproteinen
Es gibt 1998-und 113-PDB-Einträge, die Ligand-HEM (Häm-Typ-b) bzw. HEC (Häm-Typ-c) mit Auflösungen von 3% bzw. Unter diesen Einträgen, 10 (1BE3, 1BGY, 1FGJ, 1GWS, 1PP9, 1PPJ, 1S56, 1S61, 2A06, und 3H1J) enthalten sowohl die Häm-Typ-b-und-c., In Toto wurden 4272 Proteinketten als Häm-wechselwirkende Proteinketten identifiziert, wie in Methoden beschrieben. Ein nicht redundanter Datensatz von 125 Proteinketten (114 Häm-b und 11 Häm-c, zusätzliche Datei 1, Tabelle S1) wurde unter Verwendung von PISCES mit einer Sequenzidentitätsabschaltung von 25% generiert. Zweiundachtzig Prozent dieser Proteinketten enthalten nur ein Hämmolekül, während die Anzahl der Hämmoleküle in den verbleibenden Proteinketten zwischen 2 und 8 liegt (zusätzliche Datei 1, Tabelle S1)., Zwei Beispiele für Multi-Häm-Proteinketten, 1FS7A mit 5 Typ b und 3F29A mit 8 Typ c Häm-Molekülen, sind dargestellt in (Abbildung 2A & 2B).
Der Datensatz der Häm-Bindungsproteine enthält eine Vielzahl von Proteinfalten. Insgesamt 86 Proteinketten (~69% des Datensatzes) weisen SCOP-Annotationen auf (basierend auf Release 1.75 und Pre-SCOP) und gehören zu 31 verschiedenen Strukturfalten in allen vier Hauptklassen (Tabelle 1) . Der Datensatz wird von Proteinen in der All-α-Klasse dominiert, die 64% (55 von 86) der Gesamtmenge ausmachen. Die oberen 4 Falten, globinähnlich (a. 1), Cytochrom P450 (a. 104), Cytochrom c (a. 3) und Multihämzytochrome (a.,138) repräsentieren die bekannten Häm-Bindungsproteine, die ausgiebig untersucht wurden (Tabelle 1).
Structural environment of the häm binding pockets
Um die strukturelle Umgebung von Häm binding pockets zu untersuchen, identifizierten wir beide Rückstände, die Koordinatenbindungen mit dem Häm-Eisen herstellen, und diejenigen, die interagieren mit der Häm-Porphyrin-Struktur (Abbildung 2C und Methoden)., Von den 125 Häm-bindenden Proteinketten haben nur 2PBJA und 3HCNA keine Rückstände, die als axiale Liganden für Häm-Eisen identifiziert wurden, obwohl beide umfangreiche Wechselwirkungen mit Häm haben; Stattdessen bilden andere kleine Moleküle wie Glutathion (GSH) in 2PBJA (mikrosomale Prostaglandin-E-Synthase) und Imidazol (IMD) in 3HCNA (humane Ferrochelatase) Koordinatenbindungen mit Häm-Eisen. Es wird festgestellt, dass fünf verschiedene Aminosäuren (H, M, C, Y, K) als axiale Liganden für das Häm-Eisen mit Histidin als dominantem Rückstand (~80%) sowohl beim Häm-b-als auch beim Häm-c-Typ dienen (Abbildung 3)., Häm b verwendet mehr Cysteinreste, während Häm c etwas mehr Methioninreste als axiale Liganden aufweist. Es sollte darauf hingewiesen werden, dass es nur 41 Rückstände als Häm-c-Liganden. Daher können die Prozentsätze der Nicht-Histidin-Liganden aufgrund des kleinen Datensatzes eine relativ große Veränderung mit einer leichten Zunahme oder Abnahme der Ligandenzahlen aufweisen.
Die konservierten Wechselwirkungen zwischen Proteinresten und Häm wurden zuvor entweder durch Berechnung der Häufigkeit von Resten untersucht, die in Van der Waals Kontakt mit Häm für jede Falzklasse von Häm-Proteinen vom b-Typ sind, oder durch Berechnung der mittleren Anzahl pro Bindungsstelle . Smith et al wandten auch normalisierte Aminosäureprofile an, um die Zusammensetzung und Konservierung von Hämbindungsstellen zu beurteilen ., Hier untersuchten wir die Rückstandspräferenzen in den Häm-Bindungstaschen durch Berechnung der relativen Häufigkeit von Häm-Bindungs-Rückständen in unserem nicht redundanten Datensatz. Die relative Häufigkeit jeder Aminosäure wird auf ihre Hintergrundfrequenz normalisiert.
Normalerweise werden die für Vergleiche verwendeten Hintergrundfrequenzen aus einem nicht redundanten Proteindatensatz berechnet. Aufgrund des dominanten Vorhandenseins von All-α-Falten ist jedoch nicht klar, ob sich die Rückstandsverteilung in Häm-Proteinen von der in anderen Proteinen unterscheidet., Daher haben wir zunächst die Rückstandsverteilungen zwischen nicht redundanten Häm-Proteinen und nicht redundanten All-Proteinen verglichen. Zur Vermeidung von Problemen mit fehlenden Rückständen und Klonen Artefakte(His-Tags etc.) im Zusammenhang mit PDB-Sequenzen verwendeten wir native Proteinsequenzen in voller Länge, um Rückstandszusammensetzungen zu berechnen, indem wir die PDB-Ketten Uniprot-Einträgen mit PDBSWS zuordnen ., Die relativen Rückstandsfrequenzen zwischen Häm-Proteinen und allen Proteinen zeigen, dass Häm-Proteine tendenziell mehr Alanin -, Phenylalanin -, Histidin -, Methionin-und Tryptophan-Rückstände und weniger Cystein -, Asparaginsäure -, Isoleucin -, Lysin -, Asparagin-und Serin-Rückstände enthalten (zusätzliche Datei 2, Abbildung S1). Die statistische Analyse (χ2) ergab einen signifikanten Unterschied zwischen diesen beiden Frequenzprofilen (Daten nicht gezeigt)., Um eine aussagekräftige Beschreibung der Anreicherung oder des Mangels an Resten in der Häm-Interaktionsumgebung zu erhalten, verwendeten wir die Hintergrundfrequenzen aus dem nicht redundanten Satz von Häm-Proteinen als Referenzen.
Die fünf wichtigsten Rückstände mit hohen relativen Frequenzen sind Cystein (C), Histidin (H), Phenylalanin (F), Methionin (M) und Tyrosin (Y) (Abbildung 4A). Da vier der oberen fünf (C, H, M und Y) als axiale Liganden für Häm-Eisen dienen können (Abbildung 3), haben wir axiale Liganden aus dem Datensatz entfernt und die relativen Frequenzen neu berechnet., Abbildung 4B zeigt, dass der Histidinspiegel auf das Hintergrundniveau abnimmt, was darauf hindeutet, dass die Anreicherung von Histidin im Wesentlichen auf die große Anzahl von Häm-Histidinliganden zurückzuführen ist. Die anderen vier Rückstände weisen dagegen fast die gleichen relativen Frequenzen mit oder ohne Ligandenrückstände auf (Abbildung 4B). Bei Häm – c-Proteinen ist das Auftreten von Cysteinresten bei einer achtfachen Anreicherung im Vergleich zur Hintergrundverteilung extrem hoch., Dies ist nicht verwunderlich, da das klassische CXXCH-Bindungsmotiv, bei dem das Histidin als Ligand dient und die Cysteinreste kovalente Thioeterbindungen mit den Häm-Vinylgruppen bilden, in Häm-c-Proteinen dominant präsent ist.
Im Einklang mit früheren Berichten spielen die aromatischen Rückstände (Phenylalanin, Tyrosin und Tryptophan) eine wichtige Rolle bei Protein-Häm-Wechselwirkungen durch Stapelwechselwirkungen mit dem Porphyrin. Eine Ausnahme bildet Tryptophan in Häm-c-Proteinen, das im Vergleich zum Hintergrund ein ähnliches Vorkommen zeigte (Abbildung 4A). Leucin, Isoleucin und Valin, die hydrophobe Wechselwirkungen mit der Hämringstruktur herstellen, sind über die Hintergrundfrequenzen leicht erhöht., Die Rückstände mit den wenigsten Vorkommen, Asparaginsäure, Glutaminsäure und Lysin sind geladene Rückstände, was darauf hindeutet, dass die Häm-Bindungstasche hauptsächlich eine hydrophobe Umgebung ist. Im Gegensatz dazu hat Arginin, ein positiv geladener Rückstand, der als Hauptakteur bei der Verankerung der Häm-Propionate angesehen wurde, ein viel höheres Vorkommen als andere geladene Aminosäuren und zeigt eine ähnliche (HEM) oder etwas höhere (HEC) Frequenz zum Hintergrund (Abbildung 4A) .
Die Sekundärstrukturtypen für Häm-wechselwirkende Rückstände sind in Abbildung 5 dargestellt., Es gibt mehr helikale und weniger Spulentypen in Proteinen mit Häm b, unabhängig davon, welcher Datensatz (Häm-Proteine oder alle Proteine) als Referenz verwendet wird. Daher ist der Unterschied nicht auf die große Anzahl von All-α-Proteinen im Datensatz zurückzuführen. Häm-wechselwirkende Rückstände in Häm c haben eine ähnliche Verteilung wie der Hintergrund (Abbildung 5). Basierend auf unserer 3-Kategorien-Klassifizierung der relativen Lösungsmittelzugänglichkeit sind die Häm-interagierenden Rückstände weniger wahrscheinlich ausgesetzt. Die vergrabenen Rückstände sind vergleichbar mit der Hintergrundverteilung., Etwa 20% Anstieg ist in der Zwischenkategorie zu beobachten (Zusätzliche Datei 2, Abbildung S2).
Häm-Bindungssequenzmotive
Um mögliche Sequenzmotive zu untersuchen, die an der Häm-Bindung beteiligt sind, wurden die flankierenden Sequenzen mit vier Resten auf jeder Seite der Häm-Axialliganden gesammelt und ausgerichtet., Der nicht redundante Datensatz hat 34 Häm – c-Liganden, von denen 32 Histidin als axiale Liganden haben. Die Ausrichtung dieser Sequenzen zeigt das klassische CXXCH häm c Bindungsmotiv (Abbildung 6A).
Ein weiteres bemerkenswertes Motiv, G XXCG, stammt aus den Häm-b-Proteinen mit Cystein als Axialliganden (Abbildung 6B). Das Motiv repräsentiert das klassische CYP signature Häm Bindemotiv FXXGXXCXG in Bakterien, Pflanzen und Säugetieren Cytochrom P450 s., An den -4-und +2-Positionen (mit Ligandcystein als Referenzposition) befinden sich kleine Aminosäuren (Glycin), während die -2-Position eine positiv geladene Aminosäure wie Histidin oder Arginin bevorzugt. Diese positiv geladenen Rückstände interagieren elektronisch mit den negativ geladenen Häm-Propionaten (Abbildung 6C und 6D). Der kleine Glycinrückstand an der -4-Position kann die Flexibilität bieten, die zum Positionieren der positiv geladenen Rückstände in der Nähe von Häm-Propionatgruppen erforderlich ist. Die +1-Position wird von Prolin und hydrophoben Aminosäuren, Leucin, Alanin, Valin und Isoleucin dominiert., Sechs der achtzehn Fälle haben Prolin direkt nach dem axialen Liganden Cystein, erinnert an das Dipeptid CP-Motiv in Häm Sensing und Regulierung beteiligt ., Während die Bedeutung des CP-Motivs durch Deletions-oder standortgerichtete Mutationsexperimente an mehreren wichtigen Proteinen untersucht wurde, einschließlich Transkriptionsrepressor Bach1 , Eisenregulationsprotein 2 (IRP2), zirkadianer Faktor Periode 2 (Per2) und δ-Aminolevulinsäuresynthase (ACH), Die mögliche Rolle des CP-Motivs bei der Häm-Wechselwirkung aus struktureller Sicht bleibt unklar, da die Strukturen für die meisten dieser Proteine mit solchen CP-Motiven unbekannt sind.,
Alle sechs CP-Dipeptide, die direkte physikalische Wechselwirkungen mit Häm haben, weisen ähnliche strukturelle Rollen auf, wobei die Cysteine als Liganden für das Häm-Eisen und den Prolinrest dienen und eine Biegung für die nachgeschalteten Strukturen, hauptsächlich α-Helices, einführen, um sie von der Häm-Fläche weg zu lenken (Abbildung 7B und 7C). Eine siebte Proteinkette, 2PBJA, enthält einen CP, bei dem das Prolin sehr ähnliche strukturelle Implikationen aufweist, während der Cysteinrest mit dem Häm interagiert, jedoch nicht als Ligand., Stattdessen scheint das Vorhandensein eines Glutathionmoleküls (GSH), das eine Koordinationsbindung mit dem Häm-Eisen bildet, das Cystein leicht von der axialen Ligandenposition wegzudrücken (5,25 Å von Häm-Eisen) . In Anbetracht der Konformation in der Prolin-Bend-Struktur und des geringen Abstands zwischen Cystein und Häm-Eisen ist es wahrscheinlich, dass das Cystein als Häm-Ligand dienen könnte, wenn GSH nicht in der Struktur vorhanden ist., Interessanterweise weist eine genauere Untersuchung der strukturellen Konformation stromabwärts des Prolinrückstands in 2CIWA (Cloroperoxidase), 3CQVA (Rev-erb) und 2PBJA (mikrosomale Prostaglandin-E-Synthase), die die CP-Häm-Motive mit konserviertem Prolin aufweisen, auf eine nahezu senkrechte Ausrichtung zur Häm-Ebene hin (Abbildung 7A, 7B und 7D)., Im Gegensatz dazu sind in der P450-Familie, in der der Prolinrest weniger konserviert ist, mit Leucin, Isoleucin und Methionin, die ebenfalls an der Position von Prolin gefunden werden, wie im Motivlogo gezeigt (Abbildung 6B), die α-Helices, die dem Prolinrest folgen, parallel zur Häm-Ebene (Abbildung 7C). Der Unterschied deutet auf eine andere strukturelle Rolle für das Prolin bei konservierten CP-Dipeptiden hin als bei den weniger konservierten CP-Dipeptiden, genauer gesagt an der Prolinposition.,
CP-Dipeptide wurden auch in indirekte Interaktion mit Häm verwickelt., Ragsdale und Kollegen berichteten über eine neuartige Rolle für CPD in Hämoxygenase 2 (HMOX-2) als Thiol/Disulfid-Redox-Schalter , der außerhalb der Häm-bindenden Tasche lokalisiert und daher die Häm-Protein-Interaktion reguliert, indem er den Redoxstatus in der Umgebung erfasst. Es gibt insgesamt neunundzwanzig CP-Dipeptide in unserem Datensatz. Weniger als ein Viertel von ihnen (in 7 Proteinketten einschließlich 2PBJA) zeigen physikalische Wechselwirkungen mit Hämmolekülen., Es wäre zu diesem Zeitpunkt unpraktisch, die funktionelle Rolle der verbleibenden CP-Dipeptide bei der Häm-Protein-Interaktion vorherzusagen, hauptsächlich aufgrund der begrenzten Probengröße und des Fehlens struktureller Details zur Häm-Tasche-CP-Interaktion. Hier haben wir statistische Analysen verwendet, um indirekt die funktionelle Relevanz von CP-Dipeptiden in der Häm-Interaktion zu bewerten. Der Grund für den Assay ist, dass, wenn CP-Dipeptide wichtige Häm-Signaturen für Häm-Wechselwirkungen sind, die erwarteten Vorkommen von CP-Dipeptiden in Hämoproteinen im Vergleich zur Kontrollpopulation höher sein sollten., Wir fanden keinen statistisch signifikanten Unterschied zwischen dem Vorhandensein von CP-Dipeptiden in Häm-Proteinen und Nicht-Häm-Proteinen (Daten nicht gezeigt), was darauf hindeutet, dass andere noch zu identifizierende Faktoren existieren können, um die Rolle von CP-Dipeptiden bei der Häm-Bindung zu bestimmen ., Es ist anzumerken, dass wir die Möglichkeit nicht ausschließen, dass in der Kontrollprobe unbekannte Hämoproteine vorhanden sind; Um jedoch die Frequenz von CP-Signalen signifikant zu beeinflussen, müsste ein beträchtlich großer Teil der zu analysierenden Kontrollproteine Häm-interagieren, was wir als weniger wahrscheinlich erwarten.,
Strukturvergleich zwischen Apo-und Holo-Häm-Proteinen
Eine interessante Frage im Zusammenhang mit strukturbasiertem Häm-Bindungsproteindesign und-vorhersage ist der Grad des globalen Konformationsübergangs und die lokalen Veränderungen der Häm-bindenden Tasche bei der Häm-Bindung. Wir sammelten 446 Häm-Proteinketten (nach Entfernung von Häm-Proteinketten mit mindestens 90% Sequenzidentität) und verglichen deren Sequenzen mit den Proteinketten ohne Häm-oder Häm-ähnliche Liganden (Zusätzliche Datei 1, Tabelle S2)., Es wird festgestellt, dass einhundertneunundsiebzig Häm-Proteinketten Apo-Strukturen mit hoher Sequenzähnlichkeit und Abdeckung aufweisen. Nach dem Entfernen redundanter Apo / Holo-Paare mit einem 25% igen Sequenzidentitätsabschnittund und Proteinen mit Nicht-Häm-oder Nicht-Häm-ähnlichen Liganden, die die Häm-Bindungstasche einnehmen, besteht der endgültige Datensatz aus 10 Apo-Holo-Proteinpaaren. Tabelle 2 zeigt, dass 9 von 10 Proteinen nach der Häm-Bindung mit RMSDs von 1,03 Å oder weniger sehr kleine globale Konformationsänderungen erfahren. Zum Beispiel hat das 2ZDOA-1XBWD-Paar (eisenregulierte Oberflächendeterminante IsdG von Staphylococcus aureus) einen RMSD von 0.,59 Å. In Abwesenheit von Häm nimmt das Protein die gleiche Konformation an wie das Holoprotein mit Häm (Abbildung 8A, B). Sogar die Seitenkettenpositionen des Histidinliganden sind ähnlich. Die mit relativ großen Konformationsänderungen ist Rev-erb (3CQVA-2V7CA). Ohne Häm bewegt sich die C-Terminal-Helix (Abbildung 568-576) in Richtung der Häm-Tasche mit His568 (Häm-Binding Ligand) weg von der Binding-Tasche (Abbildung 8C, D) .,
Three of the ten heme proteins in Table 2 have multiple known apo structures., 1KBIA (Flavin-bindende Domäne der Bäckerhefe Flavozytochrom b2), 1N45A (Human Hämoxygenase-1) und 1N5UA (Human Serum Albumin) haben 9, 3 und 28 Apo-Strukturen jeweils (mit mindestens 99% Sequenzidentität, Zusätzliche Datei 1, Tabelle S3). Da Proteine von Natur aus dynamisch sind und die Konformationsauswahl als wichtiger Mechanismus für die biomolekulare Erkennung angesehen wurde , haben wir die Konformationsunterschiede zwischen den einzelnen Apo-Strukturen und den Holo-Strukturen überprüft. Abbildung 9A zeigt die RMSD-Werte (Ca-Atome von ausgerichteten Resten) der Apo-Holo-Strukturunterschiede., Die RMSDs sind im Allgemeinen kleiner als 1Å für 1KBIA und 1N45A.Im Gegenteil, Apo-Strukturen von 1N5UA bilden zwei Cluster. Mitglieder eines Clusters mit 12 Apo-Strukturen haben RMSDs von etwa 0,8 Å, während der andere 15 Apo-Strukturen mit RMSDs von 4 bis 5 Å enthält. Durch manuelle Inspektion haben wir festgestellt, dass die Unterschiede durch die Anzahl der Nicht-Häm-Liganden in Strukturen verursacht werden. Neben Häm enthält 1N5UA auch 5 Myristinsäuremoleküle (MYR) (Abbildung 9B). Die Apo-Strukturen mit höheren RMSDs haben entweder keine Liganden (Abbildung 9C) oder nur einen oder zwei Nicht-MYR-Liganden., Zum Beispiel haben 1E7AA und 2BX8B jeweils 2 PFL bzw. Andererseits weisen Apo-Strukturen mit MYR-Liganden in ähnlichen Positionen wie in 1N5UA im Allgemeinen kleinere RMSDs auf (Abbildung 9D). Daher gibt es unter ähnlicher Umgebung relativ kleine strukturelle Unterschiede zwischen Holo – und Apo-Häm-Proteinstrukturen.
Es sollte beachtet werden, dass die obigen Vergleiche auf Häm-Proteinen basieren, die stabile apo-Strukturen aufweisen, die durch Röntgenkristallographie gelöst wurden. Bei einigen Proteinen, wie im Fall von Hämoglobin, kann das Fehlen von Liganden die Flexibilität erhöhen und eine teilweise Entfaltung der Proteinstruktur verursachen, was die Strukturbestimmung erschwert . Darüber hinaus werden intrinsisch gestörte oder unstrukturierte Regionen als für viele wichtige zelluläre Funktionen wie die Ligandenbindung verantwortlich angesehen ., Die Existenz solcher flexiblen Apo-Strukturen würde jedoch unser Ziel bei der strukturbasierten Häm-Proteinvorhersage nicht beeinträchtigen, da wir die vorhandenen Apo-Strukturen in PDB als Inputs verwenden wollen .
Weitere nützliche Funktionen zum Vergleich von Apo-Holo-Häm-Proteinen sind die Taschengröße und-form. Aufgrund unterschiedlicher Häm-Bindungsmodi (teilweise belichtet oder vollständig eingebettet, zusätzliche Datei 2 Abbildung S3) und der Schwierigkeit, die genaue Häm-Bindungstasche aus vorhandenen automatischen Programmen zu identifizieren, variieren die Größen der Häm-Bindungstaschen von klein (~400 Å3) bis sehr groß (über 2000 Å3) (Tabelle 2)., Darüber hinaus sind die Änderungen des absoluten Taschenvolumens nach der Hämbindung variabel. Kleine Änderungen sind in 2ITFA-2ITEB, 2R7AA-2RG7 D und 2ZDOA-1XBWD zu sehen. Andere Paare zeigten trotz der minimalen Konformationsänderung signifikante Volumenänderungen (Tabelle 2). Um die Form zu berücksichtigen, haben wir den Rvs-Wert (das Verhältnis des Taschenvolumens zur Taschenfläche) jeder Tasche berechnet. Die meisten der Apo – oder Holo-Proteine haben Rvs-Werte um 1.4., Um weiter zu untersuchen, ob die Bindungstasche als eine der Eigenschaften für die Häm-Protein-Vorhersage verwendet werden kann, verglichen wir die Rvs-Verteilungen zwischen Häm-Bindungstaschen und Taschen in Nicht-Häm-Proteinen (Proteine, die keine Häm-Liganden haben und nicht homolog zu Häm-Proteinen sind) mit ähnlichen Größen von 350 bis 2000 CM3. Die Rvs von Häm-Binding-Taschen haben eine schmale Verteilung, während die Rvs von ähnlichen Taschengrößen von Nicht-Häm-Proteinen eine breite Verbreitung mit einem langen rechten Schwanz haben (Zusätzliche Datei 2, Abbildung S4-A)., Wir untersuchten auch die Verteilung von Rvs, die zu einer Kugelform normalisiert wurden, wie sie von Sonavane und Chakrabarti eingeführt wurde . Ein ähnlicher trend wurde gefunden (Zusätzliche Datei 2, Abbildung S4-B). Es sollte darauf hingewiesen werden, dass, obwohl unbekannte Häm-Proteine in den Nicht-Häm-Datensatz aufgenommen werden können, viele Nicht-Häm-Proteine ähnliche Tascheneigenschaften aufweisen.