Molecular Biology of RNA 2nd edition (David Elliott & Michael Ladomery)
이제껏 RNA에 대한 여러가지 사실을 배우며 RNA는 진짜 개 쩌는 능력치를 가졌다는 사실을 알게 됐다. 물론 이것도 알바알(RNA by RNA)이지만 말이다. 그런데 사실 RNA가 진짜 대단한 이유는 RNA 그 자체만이 아니라 RNA binding protein에 있다. RNA binding protein이 없었다면 RNA가 이토록 다양한 기능을 수행하지 못했을 수도 있다. 대체 이 둘의 co-work이 어떤 시너지를 일으키기에? 둘은 어떻게 결합하기에? 이런 질문들에 대한 답을 (일부) 제시하는 단원의 서막이다.
hnRNP의 발견
RNA는 핵 안에서 전사되고, 세포질로 나와 번역된다는 사실은 너무나도 자명하다. 요즘에는 RNA가 nuclues 뿐만 아니라 cytosol, Mitochondria 등으로 이동하며 다양한 기능을 한다는 사실 또한 너무나도 당연해졌지만 과거에는 당연한 일이 아니었다. RNA는 핵 안에서 전사되기 때문에 핵 안에서만 활약할 것이라고 생각했기 때문이다. 하지만 hnRNP(heterogenous RNA nucleoprotein)이 발견되면서 이러한 생각은 깨지기 시작했다.
hnRNP는 hnRNA에 결합하는 단백질들을 이야기한다. 초창기에는 사람들이 hnRNA가 무엇인지 알지 못해서 저런 이름을 붙였지만 사실 hnRNA는 pre-mRNA와 거의 유사한 개념이다. 과거 사람들은 당연히 DNA와 RNA는 완벽하게 hybrid 될 것이라고 생각했다. 그래서 고농도의 fromamide를 처리해 DNA-RNA hybrid가 안정화될 수 있는 환경을 조성해주었다. 그런데 웬걸? 예상과 달리 hybrid를 형성하는 부위는 극히 일부분이었으며, 나머지 부위는 loop를 형성하는 것이 관측되었다. 이는 DNA에 mRNA로 전사되지 않는 부위가 있다는 뜻이었다. (이 loop를 R loop이라고한다. 자세한 이야기는 5 단원에서 다시 언급된다.)
즉 정리하자면 hnRNA(primary transcript in eukaryote much larger than mature mRNA)의 processing에 관여하는 protein들(hnRNP)이 존재한다는 것이 알려지면서 RNA binding protein이 주목을 받게 된다.
Geuens et al. 2016
+) 참고로 RNA의 processing이 일어나 RNA의 fate가 결정되는 장소를 P-bodies(Processing body)라고 한다.
RNA Binding Domain
그렇다면 RNA binding protein은 어떻게 RNA를 인식하고 결합하는 것일까? RNA만 보면 환장하고 달려들면 생명체는 세상에 없었을 것이다. 그러니 이들도 RNA를 인식하는 방법이 구축되어 있고 이를 통해 다양한 기능을 수행할 것이다. 그게 바로 뭐냐고? 뻔하게도 RNA binding domain이다. RNA binding domain은 여러가지 종류가 있는데, 그 중에서 RRM(RNA recognition motif)가 가장 많이 발견되며, 그 뒤를 Arginine rich domain이 따른다.
몇가지만 살펴보도록 하자.
1) RNA Recognition Motif(RRM)
가장 많이 발견되는 RNA binding domain인 RRM은 4개의 anti parallel β sheet와 2개의 α helix를 가진다. (β4α1β1β3α2β2). 이 중 가운데 두 개의 β sheet에서 conserved된 서열인 RNP1과 RNP2가 발견된다. 이들은 Aromatic&basic amino acid를 많이 가지고 있는데, Aromatic AA는 base와의 결합을 돕고, basic AA는 positive charge로 RNA의 negative charge를 중화하는 역할을 수행한다. RNA binding protein은 2~3개의 RRM을 통해서 RNA의 1차 및 2차 구조를 인식해 결합한다. 어떤 RRM은 특별히 더 specific하게 RNA와 결합하기도 한다.
DOI: 10.1111/j.1742-4658.2005.04653.x
여기서 잠깐, Domain과 Motif의 차이는?
Domain: conserved part of a given full-length protein sequence with a defined tertiary structure that can evolve, functon and exist independently of the rest of the protein chain. (독립적으로 기능하는 3차 구조) Motif: stable and easily folded arrangements but cannot exist independently. (독립적으로 기능하지 못하는 domain의 일부분)
즉 RRM이라는 domain에 RNP1, RNP2라는 motif가 존재하는 것이라고 이해할 수 있다. Stollar et al. 2020
2) Cold Shock Domain(CSD)
1. Cold shock protein
인간은 비가 오면 피할 수 있다. 추우면 옷을 입거나 더우면 옷을 벗는 건 좀 그렇고 에어컨을 틀거나 하는 방식으로 외부 stress에 대항할 수 있다. 하지만 박테리아는? 에어컨이 없다. 설령 있다고 한들 그들은 에어컨이나 히터 따위를 틀 수가 없다. 특히 박테리아에 있어서 추운 것은 gene expression에 영향을 미치기 때문에 큰 문제가 되는데, 그럼 이들은 추우면 다 죽어야만 하는가?
생명은 그렇게 잔혹한 방식으로 설계되어 있지는 않다. 다행히도 이들은 RNA chaperon으로 작용하는 Cold shock protein을 가진다. 그리고 당연하게도 여기에 β barrel 구조의 CSD이 존재한다. (β barrel 구조는 RNA가 통과할 수 있게끔 작용한다.)
박테리아가 추운 환경에 노출되면 RNA melting이 일어나지 않아서 2차구조를 형성하고 있다. 이렇게 되면 번역 개시 부위가 막혀 단백질을 생산할 수 없게 된다. 이때 CSP가 구원처럼 나타난다. CSP는 RNA의 2차 구조를 풀어서 ribosome이 잘 로딩될 수있게 해준다. 이러한 과정을 co-transcription regulation이라고 한다.
2. Y box protein (FRGY2 in Xenopus oocyte)
FRGY2와 Cyclin B1의 interaction을 보여준다.
A(in vivo)에서는 여러 다른 RBP가 존재해서 더 길고 다양한 패턴의 complex가 관측되는 한편
B(in vitro)에서는 넣어준 RBP만 존재하기 때문에 다 같은 크기로 관측된다.
이는 여러가지 RNA binding protein이 함께 작용할 수 있음을 보여준다고 할 수 있다.