Molecular Biology of RNA 2nd edition (David Elliott & Michael Ladomery)
모든 유전자가 단백질에 대한 정보를 가지고 있는 것은 아니다. operon의 발견이 보여주었듯이 단백질로 번역되지 않는 DNA의 부분이 존재한다. 사실 대부분(98%)의 유전자는 단백질로 번역되지 않는데, 과거 이러한 DNA 부위는 junk DNA로 불렸지만 최근에는 이러한 intron이 유전자 발현 조절에 있어 중요한 작용을 한다는 것이 밝혀지고 있다. 그렇다면 어떻게 이런 사실이 밝혀지게 된 것일까?
RNA splicing의 발견
R-loop
![]() |
![]() |
![]() |
처음 이런 사실이 밝혀진 것은 우연이었다. 고농도의 formamide 처리시 RNA-DNA hybrid가 안정화되는데 이 원리를 이용해 DNA와 RNA를 hybrid를 시켰더니 완전히 complementary할 거라는 추측과 달리 non-complementary한 영역이 loop(R-loop)로 발견되었다. DNA의 모든 부분이 mRNA가 되지 않는다는 사실이 밝혀지는 순간이었다. intron을 발견한 공로로 Richard J.Roberts와 Phlilip A.Sharp는 93년 노벨상을 수상하게 된다.
Split gene theory(Senapathy, 1986)
eukaryote는 prokaryote와 달리 굉장히 긴 size의 protein을 만드는데 어떻게 그럴 수 있는걸까? 라는 의문에서 컴퓨터로 DNA를 랜덤으로 생성하여 ORF가 몇 bp까지 생성되는지 확인해보았다. 그 결과 (자연의 DNA와 유사하게) 약 600bp에 수렴하는 결과를 얻을 수 있었다. 이 정도의 ORF로는 존재하는 긴 peptide를 합성할 수 없는데 어떻게 설명할 수 있을까? 진리는 언제나 간단하다는 말대로 답은 간단했다. ORF가 불연속적이라면, 충분히 더 긴 peptide를 만들 수 있을 것이다. 그리고 이러한 불연속성을 만드는데 intron이 기여하는 것이다.
생명체의 phylogeny를 살펴보면 인트론의 존재로 더 긴 peptide의 형성이 가능해졌다는 사실이 뒷받침된다. 유전자의 exon의 길이는 종마다 큰 차이가 없지만 intron의 경우 고등생물(필자는 고등생물이란 표현을 지지하지 않지만)로 갈수록 길어지는 경향성을 보여준다.
그렇다면 intron은 단순히 유전자를 불연속적으로 만드는 역할만을 수행하는 것일까? intron의 존재는 유전자의 전사 및 발현 효율을 높이는데 기여한다. intron이 없는 gene에 intron을 삽입하고, intron이 있는 gene에 intron을 제거한 결과 intron이 삽입되면 전사와 번역이 증가되고 반대로 제거했을 때는 전사 활성을 줄어든다는 사실이 확인되었다. 실제로 S.cerevisiae의 유전자 중에 intron을 포함하는 gene은 고작 4%에 불과하지만, 이 4%에서 37%의 mRNA가 생성된다는 사실이 확인되었다.
또한 이런 intron은 생명체의 발달과 진화에도 기여할 수 있다.
발달 시기를 조절하는 것은 생명체 내에서도 굉장히 까다로운 작업일 것이다. 만일 어떤 유전자가 발달 후기에 발현되어야 한다고 해보자. 이것은 전사 인자들을 통해서도 조절될 수 있지만 긴 RNA를 전사하여 적절한 단계에서 전사가 종결되게 함으로써 조절할 수도 있다. 그 예로 인간 내에서 가장 긴 유전자인 Dystrophin은 길이가 2.5Mb에 이르는데 전사되는데 무려 16시간이나 소요된다고 한다. 이러한 Dystrophin은 precursor muscle cell에서는 발현되면 안되는데 dystrophin의 긴 길이가 이런 현상을 제어해준다고 한다.
진화에 있어서는 duplication, transposon으로 새로운 exon이 flanking intron 사이로 끼어들어가면서 새로운 기능을 하는 단백질을 만들 수 있게 된다. 또한 alternative splicing 과정을 통해 여러 조합으로 유전자를 합성하여 다양한 단백질을 만들 수도 있다.
pre-mRNA splicing
2-transeterification
splicing은 기본적으로 2번의 trans-esterification 과정을 따른다.
Branchpoint의 A 2'OH가 5'splice site를 attack하면 exon1의 3'OH와 lariat이 형성된다.
이후 생성된 exon1의 3'OH가 3'splice site를 attack하면 exon2와 연결되며 lariat intermediate가 빠져나가게 된다.
lariat은 일반적으로 Dbr1(Debranching enzyme)에 의해 linear하게 바뀌어 분해되거나 ncRNA가 된다.
Splice site
그럼 생명체는 어떻게 intron을 알아보고 제거하느냐. 다 방법이 있다. 서열이 다 알려준다. 보존된 5' splice site와 3'splice site가 존재한다.
5' Splice site | CAG↓GUARGU | |
3' Splice site | Branch point | YNYURAC |
Polypyrimidine track | upstream of 3' splice site (주로 T) | |
3' Splice site | AG↓ |
당연하겠지만 이 서열들은 degenerate하다. 흔히 5' splice site GU / 3'splice site AG로 외우게 되는데 아래 그림을 보면 납득이 간다. 가장 잘 보존되어 있는 부분이기 때문이다.
Spliceosome
자 그럼 이제 이 서열을 누가 인식하느냐에 대해 알아볼 차례이다. Splicing하는 기구를 Spliceosome이라고 하는데 구성은 다음과 같다.
이들은 splicing이 일어나야 하는 곳마다 recruit되는데 보통 human gene은 8개의 exon으로 구성되기 때문에 7개의 spliceosome이 필요하다고 한다.
Spliceosome은 U1, U2, U4, U5, U6 snRNA와 protein으로 구성된다. snRNA는 inter/intramolecular interaction을 통해서 complementary pairing partner을 잘 찾을 수 있게 도와준다. 이들의 5'말단에는 TMG cap(2,2,7-Trimethyl Guanosine Cap)이 존재한다. snRNA는 7 sm protein 고리의 중심을 통과하는 형태로 존재한다.
* U3 snRNA는 인에서 rRNA processing에 참여한다. 반면 U1, U2, U4, U5, U6 snRNA는 nuclear speckle 근처 compartment A(transcription 활발) 영역에 존재하여 splicing을 수행한다.
'과학 Sceinece > RNA biology' 카테고리의 다른 글
Chp 06 Alternative Splicing (0) | 2022.06.21 |
---|---|
Chp 05 pre-mRNA splicing (0) | 2022.06.21 |
Chp4 Questions (0) | 2022.06.07 |
Chp4 RNA-Protein interaction experiments (0) | 2022.06.07 |
Chp4 RNA Binding Proteins (0) | 2022.06.07 |