게놈(genome)의 구성

생물학

by 김독립 2024. 3. 16. 00:06

게놈 구조와 조직

염색질. 염색질 단위는 뉴클레오좀입니다. 따라서, 염색질은 규칙적으로 배열된 뉴클레오좀의 반복이라고 생각할 수 있다. 뉴클레오좀 코어 입자는 히스톤 팔량체와 그 팔량체를 감싸는 DNA로 구성되어 있습니다.
히스톤은 다양한 공유결합 변형(후성적 변형)을 받는 유연한 N-말단(소위 "꼬리")을 가진 구형 염기성 단백질입니다. 히스톤 팔머는 히스톤 H2A, H2B, H3 및 H4의 두 가지 분자로 구성됩니다. DNA는 각각 약 150 bp를 포함하는 약 1.75 회전의 왼쪽 감기 슈퍼 코일로 팔 량체 주위를 감싸고 있습니다. 히스톤 H1은 링커 DNA와 인접한 뉴클레오좀 코어 입자를 물리적으로 연결하는 링커 히스톤입니다. 각 뉴클레오좀의 직경은 10 nm이고 뉴클레오좀은 30 nm의 솔레노이드 섬유 구조로 압축됩니다. 30 nm 솔레노이드 섬유는 추가로 압축되어 300 nm 필라멘트가 되고 결국 700 nm 염색체가 됩니다. 세포 분열 동안 염색체가 복제되면 두 염색체를 포함하는 1400 nm의 중기 염색체가 생성되며 각 염색체는 700 nm입니다. 염색질과 관련된 주요 비 히스톤 단백질은 고 이동성 그룹 (HMG) 단백질입니다.
히스톤은 염색질의 치밀도를 증가시키는 반면 HMG 단백질은 염색질의 치밀성을 감소시킵니다. HMG 단백질은 염색질의 치밀성을 감소시킴으로써 다양한 조절 인자의 DNA에 대한 접근을 용이하게 합니다. HMG 단백질은 DNA에 결합하여 DNA에 심각한 굴곡을 일으킬 수 있습니다. DNA의 굴곡은 전사 조절에서 전사 인자와 보조조절 인자(코어 액티베이터/콜리프레서) 간의 상호작용에 중요합니다.
다양한 단백질 DNA 상호 작용은 다양한 세포의 대사 요구에 따라 염색질의 입체 구조를 변화시킵니다. 변화된 염색질 구조는 전사 메커니즘의 접근 및 결합을 제한하거나 강화하여 전사를 제어할 수 있습니다. 이러한 조절 효과 중 일부는 후성유전자에 의해 매개될 수 있습니다.

대표적인 게놈의 구조 - 인간 게놈

여기에서는 대표적인 게놈으로서 인간 게놈에 대해 설명합니다.
인간 게놈은 32 억 (3.23109) 염기쌍 (53.2 Gbp)으로 구성되며 23 쌍의 염색체 (22 쌍의 상 염색체 1XX 또는 XY 성 염색체)에 분포합니다. 단백질을 코딩하는 유전자는 B21,000개이며, DNA의 단백질 코딩 부분은 게놈 DNA 전체의 2%인 B1.5를 구성합니다. 단백질을 코딩하는 유전자의 약 3분의 2는 태아 포유류 사이에 1:1 오르토 로그가 있습니다. 조정 배열은 게놈 B3의 3.5%를 구성합니다. 게놈은 상당한 수의 비 코딩 제어 RNA도 코딩합니다. 초기 연구는 게놈의 10% 이상이 성숙 전사체에 존재하고 게놈의 B20%가 기능적으로 중요할 수 있음을 시사했습니다. 이러한 추정은 나중에 설명하는 Encyclopedia of the DNA Elements (ENCODE) 프로젝트의 결과를 기반으로 수정되었으며 크게 확장되었습니다. 2명의 인간 게놈은 대략 99.9% 동일합니다. 반복 서열은 인간 게놈의 B50%를 차지합니다. 따라서 반복 서열은 유전적 다양성의 중요한 근원을 구성합니다. 반복 배열에는 여러 가지 유형이 있습니다. 단순 반복 (예 : (A) n, (CA) n, (CGG) n), 탠덤 반복 블록 (예 : 센트로미어 반복, 텔로미어 반복, 리보솜 유전자 클러스터), 세그먼트 중복 게놈의 한 영역에서 복사되고 게놈의 다른 영역에 통합된 200kb 이상의 반복, 흩어져있는 반복 (전이 인자 유래) 및 처리된 가짜 유전자. 반복 콘텐츠 외에도 더욱 기능적 인유전적 다양성은 단일 염기 다형성 (SNP) 및 복사 수 다형성 (CNP)라고도 하는 복사 수 돌연변이 (CNV)에 의해 주어집니다. 이전 정의에 따르면 SNP로 인증되기 위해서는 인구의 적어도 1%에서 점 돌연변이가 발생해야 하지만, 현재는 엄격하게 지켜지지 않습니다. 모든 점 돌연변이는 SNP라고 합니다. 인간 게놈에서 모든 SNP의 65%는 C-T 전이 돌연변이입니다. 최근의 증거는 인간 게놈이 광범위하게 전사되었음을 시사합니다. 그러나, 기능적 비코딩 전사체로 전사되는 게놈의 비율은 아직 정확하게 추정되지 않았습니다

Encyclopedia of the DNA Elements (ENCODE) 프로젝트의 발견은 게놈의 비 코딩 부분과 기능 부분이 염색체마다 크게 다를 수 있음을 시사합니다. 인간 게놈에서 센스 전사와 안티센스 전사의 증거도 있습니다. 전사 산물의 광범위한 선택적 스플라이싱이 존재하기 때문에 인간 게놈에 의해 코딩되는 단백질은 100,000을 훨씬 초과합니다. 게놈의 G1C가 풍부한 영역은 유전자가 밀집되어 있고, 인트론 크기가 작기 때문에, 이들 영역의 유전자는 보다 작고 보다 콤팩트 해진다. 반대로 A1T가 풍부한 영역은 유전자가 적고 인트론 크기가 길기 때문에 이러한 영역의 유전자는 길어집니다. 전체 인간 게놈의 평균 G1C 함량은 41% 이지만 국소 G1C 함량은 크게 다를 수 있습니다. G1C가 풍부한 게놈 영역의 중요한 구성 요소는 CpG 배열이며 클러스터에 존재하거나 존재하지 않을 수 있습니다. CpG 클러스터를 CpG 아일랜드라고 합니다.

인간 게놈에는 약 0.8%의 CpG 아일랜드가 포함되어 있습니다. 그러나 G1C 함량(B41%)을 기준으로 CpG 아일랜드의 빈도는 B4%가 되어야 합니다. 이 차이는 CpG 아일랜드의 시토신이 메틸화되어 진화 과정에서 메틸시토신(meC)이 자발적으로 탈아미노화되어 티민이 되는 경향이 있으며, 그 결과 CpG가 TpG로 변환된다고 하는 사실 때문입니다. meC-T 돌연변이는 DNA 이중 가닥에 TaG 불일치를 일으키며 일반적으로 복구됩니다. 그러나 경우에 따라 복구 메커니즘을 피하는 경우도 있습니다(예 : 복제와 사슬 분리 전에 발생하는 경우). CpG 아일랜드는 많은 유전자의 50 말단과 관련이 있습니다. 따라서 CpG 아일랜드의 식별은 유전자의 50 말단을 정의하는 데 도움이 됩니다. CpG의 C 메틸화는 전사 침묵과 관련이 있으며 메틸화의 부족은 활성 전사와 관련이 있습니다. 따라서, 비 메틸화 CpG 섬은 하우스 키핑 유전자와 같은 전사 활성 유전자의 프로모터 및 조직 특이 적 발현을 나타내는 유전자와 관련이 있다. 게놈에서 새로운 유전자의 탄생과 기존 유전자의 죽음은 게놈 진화에 기여하는 중요한 사건입니다. 새로운 유전자가 탄생하거나 게놈에 의해 획득될 수 있습니다. 새로운 유전자는 유전자 중복, 새로운 유전자 생성, 전이 인자 (TE) 가축화 등 여러 게놈 이벤트 중 하나를 통해 탄생할 수 있습니다.
중복된 유전자는 분기되어 새로운 기능을 획득할 수 있습니다. 이러한 유전자는 파라로가스 유전자 또는 파라로그스프라고 불립니다. 새로운 유전자는 DNA 이전에 비 코딩 영역이었던 기능을 기능화함으로써 새롭게 탄생할 수 있습니다. 경우에 따라 게놈이 TE를 모집하고 TE에 코딩된 단백질을 세포 단백질로 사용할 수 있습니다. 새로운 유전자는 유전자의 측방전달에 의해서도 얻을 수 있습니다.

유전자 사멸은 유전자가 불활성화 돌연변이를 얻고 기능을 잃을 때 발생합니다. 가짜 유전자화는 유전자 사멸의 일반적인 메커니즘입니다. 가짜 유전자는 처리되지 않은 가짜 유전자이거나 처리된 가짜 유전자일 수 있고 처리되지 않은 가짜 유전자는 불활성화 돌연변이를 획득한 유전자의 불활성화된 형태입니다. 따라서 엑손 인트론 구성은 손상되지 않을 수 있지만 ORF는 파괴되었습니다. 대조적으로, 가공된 가짜 유전자는 mRNA의 상보적인 DNA (cDNA) 로의 역전사와 후속 cDNA의 게놈 내장에 의해 발생합니다. 따라서, 처리된 가짜 유전자는 폴리(A) 꼬리를 가질 수 있지만, 프로모터 및 기타 요소가 부족합니다.

'생물학' 카테고리의 다른 글

유전 코드(GENETIC CODE) (1)	2024.03.21
시퀀싱(Sequencing) (0)	2024.03.19
ORF와 RNA (0)	2024.03.15
세포의 배양(Culture) (0)	2024.03.15
원핵세포와 진핵세포 (0)	2024.03.13