安田徳一{YASUDA, Norikazu}
遺伝子プールを記述するもっとも基本的な量は、そこに含まれる各種遺伝子の相対頻度である。この意味で進化におけるもっとも基本的な過程は集団における遺伝子頻度の変化であるといえる。これを考えるには親の世代から子どもの世代が形成される過程を集団レベルで考えるとよく理解できる。この数量的なモデル化を試みてみよう。
遺伝子頻度の変化を起こさせる要因として、次の世代への遺伝子を伝える個体間に選択による違いのない場合とある場合とに分けてみよう。
A)個体間に選択による違いのない場合
A1.遺伝的浮動(集団の有効な大きさが有限であることによる
A2.突然変異
A3.いくつかの集団があり、それらの間で個体の交換(移動)があるB)個体間に選択による違いのある場合
B1.選択
遺伝的浮動は繁殖の際に配偶子の機会的抽出で生じる現象で、遺伝子頻度の継代的変化を考える上で最も基本的な過程である。突然変異はその生じる確率が非常に小さい(古典的には一遺伝子座あたり10万から100万個の遺伝子に一つほどの確率)なので、短い世代の間での遺伝子頻度にはほとんど変化はみられない。むしろ他の要因による変化に呑みこまれてしまうことが多いが、集団に新たな遺伝的変異を供給するという点で生物にとって重要である。個体の移動が意味をもつのは1つの種が多数の隣接する分集団を構成する場合で、それぞれの分集団での遺伝子頻度の変化を考察する上で重要である。自然選択natural selectionは異なる遺伝子間で増殖率に差を生ぜしめるもろもろの要因であるが、遺伝的変異のない均質な集団では作用しない。
ダーウィンの自然選択説が個体の繁殖率の相違が進化の原動力であるとする(Darwin 1859)のに対して、木村の中立説は遺伝子DNAの変化が前出Aの諸要因による(Kimura 1983)とするものである
親世代についての記述は次のようであるとしよう。
1)親の数は現実には有限であるからその集団の有効な大きさをNとしよう。
2)ある遺伝子座の対立遺伝子G1,G2の頻度をx,1-xとする。t世代でのG1の頻度をxtで表わす。
3)遺伝子頻度がt世代(t=0,1,2,..)でxである確率をf(x,t)とする。
親世代から子ども世代を形成する過程は
4)任意交配が行われているとする。
すなわちN個の雄配偶子とN個の雌配偶子が集団からランダムに取り出される。通常のヒト男子は一回の射精で何億もの精子を放出するから一生の間にそれはもう数えきれないほどの配偶子を産生する。女子の一生に放出する卵子の数は男子と比べてはるかに少ないが、それでも数百から千のオーダーである。生まれる子どもが2,3人とすると、それぞれの配偶子が受精する確率はたからくじにあたる以上にまれなことであろう。その結果が子ども世代を構成する。この過程は遺伝的構成の異なる配偶子間の競争といううよりはむしろ統計学の標本抽出でいうランダム・サンプリングである。
xの値は次のどれかの値になる。
(0,1/2N,2/2N,..,1-{1/2N},1)
子ども世代の遺伝子頻度については次の数量を考えることにする。
5)配偶子のランダム抽出によるxtの一世代当たりの変化をδxtと表わす。
すなわち
xt=xt-1+δxt-1
ここでt世代は子どもの世代をあらわす。
以上の考察から、t世代の遺伝子頻度の分布はt-1世代までの遺伝子頻度の分布の累積(統計学でいう重畳 convolution)と生殖のさいの配偶子の機会的結合のゆらぎで決まるといえる。
集団の遺伝子型頻度、交配型頻度などをより一般的に記述するため、第15回講座で用いた遺伝子頻度のべき乗和(Sk)を考察することにする。
St(t) =Σxtkf(x,t) =Ef(xtk)
ここにEf(・)は統計学でいう分布についての期待値をとる演算子をあらわす。
6)δxtの分布は二項分布(対立遺伝子数が3つ以上の場合は多項分布)にしたがう
と考えるのが妥当であろう。遺伝子頻度は親世代でxt、子の値はi/2Nであるから、子世代での期待値{Eδ(・)}は
Eδ(δxt)n=Σi=0,2N{i/(2N)-xt}n2NCixti(1-xt)2N-i
2NCiは二項係数で、これから次の結果が得られる。
Eδ(δxt) =0 (平均) Eδ(δxt)2 =xt(1-xt)/2N (=Vx) (分散) Eδ(δxt)3 =xt(1-xt)(1-2xt)/(2N)2 Eδ(δxt)4 =3xt2(1-xt)2/(2N)2+xt(1-xt)(1-6xt+6xt2)/(2N)3 ...
遺伝子頻度のべき乗和は次のようになる。
S0(t) =1 : 異なる対立遺伝子頻度の合計は常に1 S1(t) =S1(t-1) =...S1(0)=p : t世代前の集団のG1遺伝子頻度は変わらない S2(t) =Ef(xt2) =Ef{xt-1+Eδ(δxt-1)}2 =Ef{xt-12+2xt-1Eδ(δxt-1)+Eδ(δxt-1)2} =Ef{xt-12+xt-1(1-xt-1)/(2N)} S2(t) ={1/(2N)}S1(t-1)+{1-1/(2N)}S2(t-1) S2(t)-p ={1-1/(2N)}{S2(t-1)-p} (∵ S1(t-1)=p) S2(t)-p ={1-1/(2N)}t{S2(0)-p} ∴ S2(t) = p-p(1-p){1-1/(2N)}t-1 (∵ S2(0)=p2) = p2+p(1-p)[1-{1-1/(2N)}t-1]
S0(t)はt世代のホモ接合体G1G1の頻度であるが、
Ft=1-{1-1/(2N)}t-1
は第10回講座で述べたFSTに相当する。すなわち、t世代におけるG1遺伝子頻度の分散Vtは統計的には次のように定義されるから、
Vt =S2(t)-{S1(t)}2 ={1-1/(2N)}(t-1)(S2(0)-S1(0))+S1(0)-{S1(0)}2 =p(1-p)[1-{1-1/(2N)}(t-1)] ∴ Vt =p(1-p)Ft
したがって、
Ft=Vt/{p(1-p)} (=FST)
となる。
遺伝子型の頻度は次のようになる。
遺伝子型 | 予測頻度 | ||
---|---|---|---|
G1G1 | S2(t) | =p2 | +p(1-p)Ft |
G1G2 | 2(S1(t)-S2(t)) | = | 2p(1-p)Ft |
G2G2 | 1-2S1(t)+S2(t) | =(1-p)2 | +p(1-p)Ft |
以上の考察からG2対立遺伝子の継世代的な変化をまとめることができる。
1)予測される平均値は考察を開始した最初の世代での値(初期値)と変わらない。
2)世代を経過するに伴い、Ft (=FST)は次第に1に近づくから、十分時間が経つと分散はp(1-p)となる。この状態ではすべての対立遺伝子が G1となるか、あるいはすべてが G2となるか、いづれかである。このときG1(あるいはG2)が固定 fixationする、あるいは G2(あるいは G1)が消失lossするという。
3)任意のt世代において予測される遺伝子頻度xtはp±√{Vt}である。この値はx0=pからスタートして集団の大きさNに応じてゆらぐ。 Nが小さいほどゆらぎは大きく、大きいほど初期値pからのゆらぎは少ない。この現象を遺伝子頻度の機会的浮動random drift of gene frequency, random genetic driftといい、基本的には有限集団からの配偶子のランダム抽出により生じる。
ここで述べた遺伝子頻度の変化を観察する方法は前向き法 prospective studyである。実験室ではある世代から将来に向かっての観察が行われることがしばしばである。あらかじめ特定の遺伝子構成のショウジョウバエ集団を用意して、複数の集団ケージのレプリカを作り遺伝子頻度の継代的変化をそれぞれのレプリカで調べることで遺伝子頻度の機会的浮動を観察することができる(Buri, 1956)。集団としての平均値は常に一定であるが、実際に観察される遺伝子頻度は集団のレプリカごとに異なることが予測される。すべてのレプリカを考察したとき、それらの遺伝子頻度の平均値が一定ということである。一つの集団を観察しただけではこの現象はみえてこない。個々のレプリカの遺伝子頻度と全体の平均値とのずれの程度は±√{Vt}で、この値は集団の有効な大きさが小さいほど大きい。
ここに述べた分布の積率 momentに基づく方法は Kimura(1955)による。Kimuraはk次の積率を与える式を見出し、このことから分布関数を求めるに至った。通常、分布関数が与えられればその積率は比較的容易に求められるが、積率から分布関数を求めることはごく一般的な条件で可能なことは数学的には知られている。しかし、この遺伝子頻度の機会的浮動のような具体的な例が示されたのは少ないのではなかろうか。ここで得られた結果の一部はすでにWright(1942)によって求められていた。
任意のk次の積率は次の公式の解である。ただし集団の大きさNは1/N2,1/N3のオーダーが無視できる程度とする。
Sk(t)=[1-{k(k-1)/(4N)}]Sk(t-1)+{k(k-1)/(4N)}Sk-1(t-1)}
ただし Sk(0)=pk、(k=0,1,2,..,t=0,1,2,...)である。
一世代あたりの積率の変化に着目して集団の大きさNがある程度大きいとその変化は連続的とみなせる。そのような状態では
dSk(t)/dt = -{k(k-1)/(4N)}{Sk(t)-Sk-1(t)}
この式の解は1/2Nが1より十分小さければ (1-1/2N)t≒e-(1/2N)tと近似できるから
Ft≒1-e-(1/2N)(t-1)
と表わすことができる。
S1(t) =p S2(t) =p-pq(1-Ft) (p+q=1) S3(t) =p-(3/2)pq(1-Ft)-(1/2)pq(p-q)(1-Ft)3 S4(t) =p-(9/5)pq(1-Ft)-pq(p-q)(1-Ft)3-(1/5)pq(1-5pq)(1-Ft)6 ......
S3(t)とS4(t)は交配型の頻度を予測する際に用いられる(Yasuda,1968,1973)
たとえば相互優性の対立遺伝子座についての交配型頻度はSk(t)を用いて次のように表わされる。
交配型 | 予測頻度 |
---|---|
G1G1xG1G1 | S4(t) |
G1G1xG1G2 | 4(S3(t)-S4(t)) |
G1G2xG1G2 | 4(S2(t)-2S3(t)+S4(t)) |
G1G1xG2G2 | 2(S2(t)-2S3(t)+S4(t)) |
G1G2xG2G2 | 4(S1(t)-3S2(t)+3S3(t)-S4(t)) |
G2G2xG2G2 | 1-4S1(t)+6S2(t)-4S3(t)+S4(t) |
ヒトを含めて生物の自然集団を観察する際にはその集団の世代tが不明である。したがってFtそのものを直接もとめることは困難である。仮に集団の有効な大きさを知ることができればFSTで代用することが可能である。しかし実際に観察される遺伝子型頻度や交配型頻度にはデータの取り方の偏りや集団間の個体交換(移動)、突然変異、それに選択などが関与していることは拭い去ることはできない。
そこでここに示したモデルはそれらによる偏りすべてをまとめてαとあらためて表わすことにする。そして作業仮説(統計学では帰無仮説という)として
H0:α=0
を取り上げて当面する要因が作用しているかどうかについての判断を下すことになる。多くの場合は遺伝子型頻度についてこの統計的検定が行なわれるが、それがいわゆるハーデイ・ワインベルグの法則検定である。交配型頻度には配偶者を選ぶことによる偏りがさらに加わることがあり、観察されたαの解釈をより複雑にする。
例。ブラジル東北地方から南部に移動する人達から、1068核家族からなる合計11,977人について主として血液型、血清型の16遺伝子座を調査した。近交係数αを家系調査3通りの方法で調べたところ次の結果を得た(Yasuda,1969)。
調査方法 | 推定された近交係数(α) | |
---|---|---|
親世代 | 子ども世代 | |
家系図 | 0.0036 | 0.0059 |
遺伝子型 | 0.0170 | 0.0121 |
交配型 | - | 0.0133 |
これから子ども世代の近交係数αの値は遺伝子型、交配型でほぼ同じであるのに対して、家系図からはそれらの44%〜49%であることがわかる。この集団はインデイオ、黒人、白人の混血が11:30:59の割合であり、これによる近交係数αへの寄与は0.0029、すなわち全体の22%であることもわかった。ここで注意しておきたいのは個々の値そのものにはさまざまな要因が関与しているから、数値を比較することでみえてくる結果を議論していることである。