集団遺伝学 第5回 遺伝子頻度

3. 遺伝子頻度

第3回の講義で遺伝子プールの定義とその質的な特徴を述べた。 各個体には1対の対立遺伝子 allele があり、それらは親の交配の結果、対合したのである。 N人のヒト集団は2N個の遺伝子の遺伝子プールを構成する。

ここでは遺伝子プールの量的な表現法として、頻度 frequency という考え方について説明しよう。

あるヒト集団を特定の表現型(ここでは単因子遺伝形質)について調べると、その表現型の有無で集団を2分することができる。 特定の表現型の個体数を集団の総個体数で割った値を表現型頻度 phenotype frequency という。

制限酵素断片多型 restriction enzyme length polymorphisms (RELFs)のように共優性や、家系調査で遺伝子型がわかることがある。 遺伝子型頻度 genotype frequency は特定の遺伝子型の個体数を総個体で割って求める。

遺伝子頻度は遺伝子型頻度あるいは表現型頻度を用いて求める。

たとえば、6,782人の東京在住者のMN式血液型を抗MN血清を用いて調べたとしよう。 赤血球が凝集した人(M+)としない人(M-)の数はそれぞれ5,353人と1,429人であった。 (M+)表現型頻度は5,353/6,782=0.789、(M-)表現型頻度は1,429/6,782=0.211である。 両者を加えると当然ながら、1になる(計算のチェック。 本講座の数値計算は必ず電卓などで手計算してみることをお勧めする。 思考の過程で腕力が往々にして重要な働きをする!)。

この人たちの血液について、さらに抗N血清を用いて調べたところ、(M+)の人のうち3,332人が(N+)で、(M-)の人はすべて(N+)であった。 すなわち、観察された3種類の表現型、(M+N-),(M+N+),(M-N+)の人の数はそれぞれ 2,021、3,332、 1,429である。

このデータを、共優性の対立遺伝子、MとNによると考えると、3種の表現型はそれぞれMM,MN,NNの遺伝子型に相当する。 したがって、それぞれの遺伝子型頻度は0.298, 0.491, 0.211 となる。 これらを合計すると1になることは明らかであろう。

MおよびN対立遺伝子の数をかぞえてみよう。 遺伝子型がMMの個体には2つ、MNの個体には1つ、NNの個体にはないから、この集団でのM遺伝子の数は2*2,021+1*3,332+0*1,429=7,374となる。 N遺伝子の数は 0*2,021+1*3,332+2*1,429=6,190となる。 各個体には2つの遺伝子があるから、集団全体では総個体数の2倍、すなわち、2*6,782=13,564個の遺伝子がある。 これはM遺伝子の数7,374とN遺伝子の数6,190と加えた値である。 したがって、この集団(遺伝子プール)での遺伝子頻度は次のようになる。

M遺伝子頻度:
(2*2,021+1*3,332+0*1,429)/(2*6,782)=0.544
N遺伝子頻度:
(0*2,021+1*3,332+2*1,429)/(2*6,782)=0.456
2つの遺伝子頻度の合計が1であることは自明であろう。

遺伝の基本単位である遺伝子の集合として交配可能な集団を考えるといろいろな面で都合がよい。 これを遺伝子プールと呼ぶことはすでに第3回の講座でのべた。 遺伝子頻度は遺伝子プールの構成を量的に表現したものである。

集団遺伝学で、遺伝子型頻度でなく遺伝子頻度を基本の数量とする根拠は、進化の基本が親から子へと伝わる遺伝子の連続性にあるためである。

  1. 遺伝子型は親から子へ伝わる連続性が必ずしもない。 例えば親がMMなら、子はMMかMNである(突然変異などまれなことは起こらないとする)。 親子がMM-MMなら遺伝子型に連続性があるが、MM-MNなら不連続である。
  2. 遺伝子そのものは自己増殖作用を通して親から子に伝えられるので、集団中の各遺伝子の割合(頻度)は世代とともに比較的ゆるやかにしか変化しない。 このことからも遺伝子頻度の方が、それが組み合わさってできた遺伝子型頻度よりもモデルを考えるのにずっと分かりやすい数量であると言えよう(木村資生,1988「生物進化を考える」岩波親書、165-166頁)。 遺伝子型あるいは表現型は個体の一生と共に終る。

4. 遺伝子型の対合:交配頻度

MN式血液型を調べた6,782人が東京在住者の代表であるかどうかは、サンプリングの方法を検討しなければ分からない。 もし得られた遺伝子型の結果が東京在住者を代表していると考えられるなら、次の(子の)世代の3遺伝子型頻度を予測することができるかを考えてみよう。
親世代の3遺伝子型頻度は次の値で表されるとしよう。