第17回集団遺伝学講座

安田徳一{YASUDA,Norikazu}

6.1.1 集団の大きさのゆらぎによる効果

自然集団では毎世代の集団の大きさは一定というよりは絶えず変化している。そのような場合には集団の有効な大きさ(5.2、第10回講座参照)を全世代での調和平均として求めた。たとえば実際の個体数が、1000,10,1000と変動すると集団の有効な大きさは1/[(1/3){(1/1000)+(1/10)+(1/1000)}]=29.4とたいへん小さい。2世代で集団の大きさが急激に減少しているためで、これをびん首bottleneckという。びん首は観察集団の遺伝的多型が予測より非常に少ない減少を説明するために考案された(Bonnell and Selander 1974)。このような現象は自然でもよく起こり、定着した集団から小数の個体が別の小グループとして隔離されて繁殖する例がそれである。そのような場合隔離集団の集団の有効な大きさが小さいのが常で、遺伝的浮動の効果が顕著である。びん首のあとに続くこのような効果を創始者効果founder effectといい、集団のFSTが大きくなり、ヘテロ接合体頻度が減ることが予測される。

小さな隔離集団には定性的な側面がある。10個体の創始者が隔離集団を形成するとどの対立遺伝子も消失しないかぎり、その頻度は1/20=0.05より低くはならない。たとえ頻度がいくぶんか変動したとしても、世代が経過しているほど大集団ではまれな対立遺伝子でも隔離集団ではホモ接合体がいないか、相対的に日常的になる。このような理由で遺伝疫学者は地理的、文化的あるいは宗教的理由で形成されたとみられる隔離集団を調査して、通常はまれな遺伝性疾患が比較的多く観察される。一つ一つの隔離集団で独特の種類の突然変異遺伝子がみつかる。それは創始者の一個体にあったもので、生成された隔離集団は特異的な突然変異遺伝子のクローンを形成している。隔離集団の特異的な突然変異遺伝子は創始者集団の一個体に由来するとよくいわれる。ベネズエラのカリプ海沿岸のマラカイボ湖岸のハンチントン病の大家系の祖はポルトガルの一水夫にたどりつくという。太平洋のピンゲラップ環礁には日中の太陽光の下ではまぶしくて事物がよくみえない先天性も劣性全色盲 achromatopsia が日常的である。この突然変異遺伝子は過去数世代前に台風被害からかろうじて生き残った1人にまでさかのぼることができる(Hussels and Morton 1972)。このような家系の生存者からDNAを採取して、特異的な突然変異遺伝子のマップをすることができる。ハンチントン病遺伝子はそのようにして4p16.3に位置することがとわかった(HDCRG,1993)。

6.2 突然変異による遺伝子頻度の変化

6.2.1 非可逆的突然変異の場合

簡単なモデルを考えてみよう。遺伝子G1は毎世代一定の割合 uでその対立遺伝子G2へ変化する(非可逆的)突然変異(irreversible) mutationとしよう。G1の頻度を xとして、次の世代における頻度を xtとすれば、G1の頻度は uの割合で減るから

xt=x(1-u)

G1遺伝子の一世代あたりの変化 x’-xをΔ xと書けば

Δx=-ux

以上をt世代について考察すると

xt=(1-u)xt-1=(1-u)2xt-2=…=(1-u)tx0~ x0e-ut

ここでuの値が1に比べて非常に小さいので 1-u~e-uの近似を用いた。また x0は考察を始めた世代のG1の祖先遺伝子頻度である。世代あたりの遺伝子頻度の変化(Δ x)は突然変異率のオーダーで非常にゆるやかであるから、連続な変化としてのモデルで十分記述することができる。すなわち数学的には

Δx≒ dx/dt

と微係数で代用する。すると

dx/dt=-ux

は容易に答えがえられて、

x =x0e-ut

前の近似で得た答えと一致する。Gの頻度は毎世代 uの割合で指数的に減少し、半減するのに約 0.7/u世代を要する。たとえば u=10-5であれば半減するのに約70,000年を要することになる。さらに世代が経過するとG遺伝子は消失する。

現実には消失までの時間が長くて、この過程が進行していく間に個体の移動や機会的浮動などのより大きな力が突然変異で消失することを妨げることになる。

 

6.2.2 可逆的突然変異の場合

つぎに逆の突然変異も起こるとする、いわゆる可逆的突然変異(reversible mutation)の場合を考えよう。GからGへの突然変異率をvとすると、これによるGの頻度の1世代あたりの増加は v(1-x)となるから、

   Δx =-ux+v(1-x)
=U(pe-x)

ただしu+v=UはG遺伝子座のネットとしての突然変異率、 pe=v/(u+v)は両方向の突然変異がバランスしたときの遺伝子頻度(平衡値)である。

世代あたりのG1の頻度変化は

   x’-x =(u+v)(p-x)
   x’-pe ={1-(u+v)}(x-pe)

これから

   xt-pe ={1-(u+v)}t(x0-pe)
~e-(u+v)t(x0-pe)

が得られる。十分世代が経過すると上式の右辺は0に限りなく近づく。それと同時に x -peも0に近づくから、 x ->peで平衡値に落ち着く。たとえばu=3×10-5,

v=10-5であればGの平衡頻度は p =0.25である。しかしこのような突然変異のみによる平衡はまず考え難い。それはふつう遺伝子頻度に変化を起こす機会的浮動、移動など突然変異よりはるかに強力な要因が介入するとみられるからである。

 

6.2.3 突然変異と機会的浮動

より現実に近いモデルとして遺伝子頻度の変化に機会的浮動と突然変異の二つの要因がはたらく場合を考えよう。t-1世代のG遺伝子頻度をxt-1とすると子どものt世代でのそれとの差は

x -xt-1=U(pe-x -1)+δ xt -1

右辺の第一項は突然変異による変化で、第二項は機会的浮動による変化である。両辺の期待値をとり、左辺を微係数で近似すると、

dS1(t)/dt=-US1(t)+Upe

これから

S1(t)=pe+(p-pe)e-Ut

ここで p=x0。最初の世代での遺伝子頻度が平衡値( p=pe)なら、当然ながら突然変異が起きても予測される遺伝子頻度はどの世代も同じでその効果はみられない。 p≠pならば観察した集団の遺伝子頻度は平衡値に近づく途上にあるといえるが、 pとUの値を別途求めないかぎり、このモデルで現実を記述するのは難しい。

2次のモーメントについては

   xt2 ={xt-1+U(pe-xt-1)+δ xt-1}2
=xt-12+(xt-1)2+2Upext-1-2Uxt-12    ( U2,1/N2,…の項は無視)

両辺の期待値をとり、連続近似をすると次の式が得られる。

dS2(t)/dt=-2{U+1/(4N)}S2(t)+2{Upe+1/(4N)}S1(t)

S2(0)=p2とともにこの式から解析的に S2(t)を求めることができる。

   S2(t) =(1-α )pe2+α pe
+[2(p-pe){(1-α )pe+α }/(1+α )]e-Ut
+[p2-{(1-α )pe2+α pe}-{2(p-pe){(1-α )pe+α }/(1+α )}]e-t/(2Nα )

ここに α=1/(1+4NU) である。

この式は祖先集団でのホモ接合GGの頻度 p2が、突然変異と遺伝的浮動の影響で十分な世代を経過して (1-α)pe2+α peの頻度に至るまでの変化をあらわしている。最初の世代では遺伝的浮動の効果が突然変異のそれに比して大きいから、ホモ接合の頻度は

S2(t)~ p2(1-Ft)+{(1-α )pe2+α pe}Ft

とあらわせる。ここにFt=1-e-t/(2Nα )は突然変異と遺伝的浮動により決まる数量である。

ここで特にp=peであると

S2(t)= p2+p(1-p)αFt

このことは遺伝子頻度の分散 Vが定義により

   Vt =S2(t)-{S1(t)}2
=p(1-p)α {1-e-t/(2Nα )}

したがって

αt=Vt/{S1(t)(1-S1(t))}=α{1-e-t/(2Nα)}=αFt

からも求まることからも言える。

一般にはp≠ pであるからこのように簡単にはならない。遺伝子頻度の変化の過程は浮動による影響のほうがはるかに強いインパクトを生じるのに対して、突然変異のそれはまったくゆるやかである。突然変異の本質は生物に新しい可能性をうみ出すことであり、遺伝子頻度の変化への要因としてはむしろ遺伝的浮動のような他要因の影響を受けて二次的な役割をしていると言えよう。このような過程は解析的なモデルでも複雑な式になるので、電算機を利用しての数値的な検討を行うことが必要であろう。

 

6.2.4 無限対立遺伝子模型

ここで非可逆的突然変異と機会的浮動の釣り合いについて考察してみよう。 v=0だから U=uであるから、α =1/(1+4Nu)となる。この式は次の考察からも求めることができる。遺伝的浮動だけなら2世代間のFSTの関係は次のように表わせる(第10回講座)。

ft=[1/(2N)+{1-1/(2N)}ft-1]

ここで新しい突然変異はこれまでに存在しない対立遺伝子が生じると仮定すると、集団で観察される複数個のある対立遺伝子はすべて一個の突然変異遺伝子から由来したことになる。つまりすべて同祖的 identical by descent である。それではこの仮定を妥当なものか検討してみよう。

典型的な遺伝子のコード領域が 1000以上の塩基からなり、各塩基に3通りの変化があり得ることを考えると、この仮定は妥当である。1塩基が置換する場合の数は 3000通りあり、2塩基以上が置換する場合の数を考えると非常に大きな数になる。したがってどの新しい突然変異もすでに集団中にある対立遺伝子の複製となることはなく、この無限対立遺伝子模型は分子レベルでの事実をよく近似しているものと言える。

同祖的である確率fは配偶子が各親から子に伝わるとき突然変異したものはもはや同祖的ではないからそれを除いて

ft=[1/(2N)+{1-1/(2N)}ft-1](1-u)2

となる。突然変異によるこのような補正は進化的に長い世代を経過したときにはじめて効果があらわれる。したがって遺伝的浮動と突然変異が釣り合った状態では ft=ft-1となるから、その値をGを求めると

G=1/(1+4Nu)

が得られる。Gはホモ接合体の絶対頻度で、H=1-Gはヘテロ接合の絶対頻度である。

Hの値は

H=4Nu/(1+4Nu)

であらわされる。ここで重要な数量は

   4Nu =(1-G)/G
=H/G

である。4Nuが0に近いと個体はほとんどの座位についてホモ接合となり、集団は単型 monomorphic となる。4Nuが大きいと、たとえば10以上ならば、集団はほとんど完全にヘテロ接合となり、各座位で多くの対立遺伝子が分離している(多型 polymorphic )。

集団の有効な大きさを成熟個体の半分という仮定は多くの種に当てはまる仮定である。そうするとこれは 4Nu=1~ 2を意味する。すなわち座位あたりの突然変異の数が世代あたり2個以上なら、大部分の集団はヘテロ接合となる。

 

以上の議論は対立遺伝子が選択的に中立で、各突然変異は既存のものでなく新しいと仮定する無限対立遺伝子模型による。ヘテロ接合の割合についての自然集団から電気泳動法で検出したタンパク質の割合は次の通りである(Nevo 1984)。

生物種 種の数 ヘテロ頻度の平均
(±標準偏差)
ショウジョウバエ 34 0.123±0.053
他の昆虫 122 0.089±0.060
甲殻類 122 0.082±0.082
軟体類 46 0.148±0.170
魚 類 183 0.051±0.035
両棲類 61 0.067±0.058
爬虫類 75 0.055±0.058
鳥 類 46 0.051±0.029
哺乳類 184 0.041±0.035
双子葉植物 40 0.052±0.049

脊椎動物のイソ酵素の平均的なヘテロ接合の頻度はおよそ0.05で、無脊椎動物ではたぶんこの2倍であろう。この程度のヘテロ接合の頻度は種の多い少ないにあまり関係なくほぼ同じである。どの種もヘテロ接合の頻度は1に達していないから、中立模型は厳密には正しくないことが示唆される。

 

6.2.5 中立進化の速度

ヘテロ接合の絶対頻度Hは新しい突然変異が機会的浮動による消失と釣り合うとき中立突然変異で生じるヘテロ接合の頻度がどのくらいかをあらわしている。それでは個々の突然変異はどうなるのであろうか。大部分は最初の数世代の間に単なる偶然により失われる。しかしときおり、高い頻度へと動いていく。さらに極めてまれだが、ある突然変異遺伝子の頻度が高くなり、それまであった突然変異遺伝子と置換する。どの位のチャンスでそのような固定が生じるのであろうか。

進化的な非常に長い時間が経過すると、ある遺伝子座の遺伝子はすべてが一つの祖先遺伝子から由来する結果となる。次のように考えれば理解できるであろう。最初の遺伝子プールにn個の対立遺伝子があったとしよう。対立遺伝子が次の世代に伝えられる数が平均して一つであったとしても、あるものは伝わらないし別のものは二つ以上伝わるかも知れない。伝わらなかった対立遺伝子は永久に集団から消失する。この過程が何世代も非常に長く続くと一つを除いてその他のすべての対立遺伝子が消失して、その一つの対立遺伝子が遺伝子プールを構成することになる。

遺伝子座あたりの中立突然変異率を uとすると、大きさ Nの二倍体の集団で毎世代生じる突然変異の数は 2Nuである。集団を構成する 2N個の遺伝子のうちの1個の遺伝子、すなわち全体の 1/2Nが究極には固定する。固定した遺伝子がある突然変異遺伝子である確率は

2Nu(1/2N)=u

世代あたりのその突然変異率に等しい。固定確率に集団の大きさが影響しないのは意外かもしれないが、これは機会的変動が小集団では大きく、したがって新しい突然変異遺伝子の数が小さいためで、この二つの効果がたがいに打ち消し合うからである。一つの固定が起きるのに要する世代数は平均して 4N世代を要する(Kimura and Ohta 1969)。ここにNは集団の有効な大きさである。有害な突然変異は最初の数世代で消失する。

ヒトと魚の祖先は400万年昔に分かれた。したがってそれぞれ独立な進化が800万年続いたことになる。ヒトとコイでαヘモグロビンのアミノ酸あたりの平均の相違は0.66である。したがって進化速度は0.66/(8×108)で、これは0.8×10-9である。この値はコドンあたり10億年あたり1アミノ酸の変化すなわち置換である。

この期間での突然変異率はわからないが、ヒトヘモグロビンの突然変異率の断片的な知見によると、固定率はおそらく突然変異の1/10ぐらいであろう。突然変異遺伝子の1/10が中立で残りの有害突然変異は早々に消失したと考えると、観察されたアミノ酸の変化は説明できる。

1960年代の後半、何人かの人々、特に木村資生先生は進化における大部分の分子変化は本質的に中立で、突然変異と機会的浮動の累積であることを精力的に示唆した。この仮説は大旋風を引き起こし、証拠は混沌としているが、提唱されてからこの理論の支持者が次第にふえている。

 

6.3.1 移動のモデル

個体の移動様式は千差万別であるので、ここでは遺伝子の流れという観点からも実用上からもいわゆるライトの島模型 island model について考察することにする。

種がいくつかの分集団に分かれている状態であるで、そのうちの一つの分集団における対立遺伝子G,Gの頻度をそれぞれx,1-xとする。この分集団がその他の分集団と毎世代一定の割合mで個体を交換し、移住してくる個体の間におけるGの頻度をpとすれば、

xt =xt-1(1-m)+mpI
=xt-1+m(pI-xt-1)
   ∴Δ xt =m(pI-xt-1)

と書ける。これは形式的に可逆突然変異の場合の式と比べると、

u <-> m(1-pi),   v <-> mpI

の対応をつければ全く同じ形をしていることがわかる。したがって移動してくる個体における遺伝子頻度 pIが毎世代一定であれば、すでに示した公式はここですべて使えることがわかる。移動してくる個体が種全体から無作為的に取り出した標本とみなしうるような場合には、pIは種全体におけるG1の頻度にあたる。大洋の群島に分布している種についてはこのような条件が近似的に満たされると考えられるため、これを最初に工夫した人の名をとりライトの島模型 Wright’s island model という。

一般には移動と突然変異は共に生じていると考えられる。そのような状況で遺伝子頻度の一世代あたりの変化は

   Δxt =m(pI-x)+v(1-xt-1)-uxt-1
=(mpI+v)-(m+u+v)xt-1
=-

となるから、あらためて

mpI <-> mpI+v,   m <-> m+u+v

の対応で形式的にまったく同じ公式が得られる。

あらためて移動、突然変異それに遺伝的浮動が遺伝子頻度の要因である状況での遺伝子頻度およびホモ接合体頻度を予測する公式は次のようになる。

   S1(t) =pe+(p-pe)e-(m+u+v)t
   S2(t) = (1-α )pe2+α pe
+[2(p-pe){(1-α )pe+α }/(1+α )]e-(m+u+v)t
+[p2-{(1-α )pe2+α pe}-{2(p-pe){(1-α )pe+α }/(1+α )}]e-t/(2Nα )

ここに pe=(mpI+v)/(m+u+v), α=1/{1+4N(u+v+m)} である。

また移動の効果が突然変異のそれよりインパクトが大きい状況では FSTに相当する近交係数の世代による変化を予測する公式は

αt=α {1-e-t/(2Nα )}

である。ここではm>u+vであるから、α =1/(1+4Nm)は十分よい近似となる。

 

例1。モートン(Morton他, 1971)はミクロネシアのピンゲラップ島住民の調査を行った。近くにはモキール島など幾つかの島々が点在しており、ピンゲラップ島は島模型の格好の例としてとりあげた。1775年ごろにレングカイカイ台風に襲われてピンゲラップ島は冠水し、その生存者数名が現在の住民の創始者となった。現住民約3000人についての聞き取り調査を行い、近交係数αを用いてNおよびmの値をもとめた。このデータについては突然変異のインパクトは無視した。

mの推定値は0.00584であるが Nの値は293~2926とその範囲は大きい。これからα=0.0127~0.1274となる。一方、家系調査による近交係数は0.0425である。

これらの値が単に理論の記述なのか、ピンゲラップ島住民の遺伝的構造を本質的に把握しているのかは推測の域を脱し得ない。ピンゲラップ島へ移動した人々が他の島々すべてから無作為に抽出されたとする理論の前提については遺伝的多型の調査で確かめる必要があろう。

 

例2:混血。もしある集団から別の集団へ一方的に移動が起きて、その逆方向の移動がない場合には

S1(t)=pe+(p-pe)e-mt

ここでpeを移住者を提供する集団の遺伝子頻度、 pを移住者を受けいれる集団の遺伝子頻度とする。 S1(t)は両者の混血集団の遺伝子頻度である。なお突然変異のインパクトは移住のそれに比して十分小さいので無視した。

たとえばアメリカ合衆国での白人と黒人の間の遺伝子の移動は主として白人から黒人の方向に起こっている。混血者を黒人とみなしているからである。血液型での調査データを用いて混血の割合を求めてみよう。計算例としてMN血液型のM遺伝子をとりあげよう。黒人は西アフリカに由来するとみられるから、そこの現住民を調査して遺伝子頻度pe=0.474を得た。現在Claxton, Georgiaの黒人についての遺伝子頻度はp=(S1(t))=0.484、白人のそれはp=0.507である。黒人はおよそ300年前に西アフリカからアメリカへ大勢が連れてこられたので、世代数tを100としよう。これらの値から

   0.484 =0.507+(0.474-0.507)e-10m
m =-ln[{0.484-0.507}/{0.474-0.507}]/10
=0.036

ただしln(*)は(*)の自然対数である。

すなわち、毎世代MN式血液型のM遺伝子の約3.6%が白人から黒人に入ったことになる。この他にもいくつかの遺伝子について同様な計算を行った結果が次の通りであった。

遺伝子 黒人
(西アフリカ)
黒人
(Claxton)
白人
(Claxton)
混血
(mの推定値)
(MN)M 0.474 0.484 0.507 0.035
(SS)S 0.172 0.157 0.279 -0.013
(Duffy)Fya 0. 0.045 0.422 0.011
(Kidd)Jka 0.693 0.743 0.536 -0.028
(Kell)Jsa 0.117 0.123 0.002 -0.005
G6PD 0.176 0.118 0. 0.039
βs 0.090 0.043 0. 0.071

この結果は混血の割合を推定することの難しさを示している。mの正の値は大きくばらついているし、負の値はモデルの仮定が成立しないことを示している。大きな難点はアメリカ黒人の先祖がはっきりしないことである。それは西アフリカのかっての奴隷市場での遺伝子プールの構成、つまり遺伝子頻度が不安定で絶えず変動していたと考えられる。つれてこられた黒人の遺伝子はグループごとに違っていたとも十分考えられるので、かれらの本来の遺伝子頻度を反映していなかったかも知れない。混血の起こり方、それに要した世代数もグループによってはば広くばらついたのであろう。これらのうちでFya遺伝子から求めたmの値が代表値といえるかもしれない。この遺伝子は事実上西アフリカに存在しないし、1%とういう値は調査した遺伝子全体からの平均値とほぼ一致する。

一般的な問題としてk次のモーメントの公式がCrow and Kimura(1956)によって得られている。突然変異や島模型の移動のモデルでは遺伝子頻度の期待値の毎世代での変化を遺伝子頻度の一次関数で表わせることから、線形圧linear pressureということがある。

 

6.3.2 移動の他のモデル

島模型では移住個体がどこから来るのか全くチャンスに依存し、遠く離れた分集団より隣接する分集団からの方がとくに来やすいということはない。これと対照的なのはライトWright(1943)の連続分布の模型で、種を構成する個体が一様に、しかも連続的に分布しているものと仮定したものである。これには直線上の配列(一次元)と平面上の配列(二次元)の場合があり、いずれも近くにいる個体ほど互いに交配する可能性が高く、距離が離れるにしたがって徐々に隔離作用が働くことになる。木村(Kimura 1963)はこれらの二つの模型の中間ともいえる飛石状模型stepping stone modelを考案している。これは種が島模型の場合のように多数の分集団に分かれているが、各分集団についての移住個体は隣接する分集団からのみ来ると仮定したものである。このモデルのさらなる工夫について関心のある方はMalecot(1948)、Maruyama(1977)を参照されたい。

いずれにせよ移動は分集団の間に遺伝子頻度について差があればこれを打ち消し、均質化する作用をもっている。

 

文献

  • Bonnell ML and Selander RK 1974. Elephant seals: Genetic variation and near extinction. Science 184: 908-909.
  • Crow JF and Kimura M. 1956. Some genetic problems in natural population. Proc 3rd Berkeley Symp on Math Stat and Prob 4:1-22.
  • HDCRG 1993. A novel gene containing a trinucleotide repeat that is expanded and unstable on Huntington’s disease chromosome. Cell 72: 971-983.
  • Hussels IE and Morton NE 1972. Pingelap and Mokills: Achromatopsia. Amer J Hum Genet 24: 304-309.
  • Kimura M. 1963. Stepping-Stone Model of Population. An Rep Nat Inst Genet.
  • Kimura M and Ohta T. 1969. The average number of generations until fixation of a mutant gene in a finite population. Genetics 61:763-771.
  • Malecot G. 1948. Les mathematiques de l’heredite. Paris: Masson et Cie. (英訳 Mathematicis ofheredity. San Francisco: Freeman).
  • Maruyama T. 1977. Stochastic problems in population genetics. Lecture notes in biomathematics 17. chapter 9: 130-155.
  • Nevo E 1984. p.13.in Evolutionary dynamics of genetic diversity, Proceedings,1983. Edited by G.S.Main.Lecture notes in biomathematics 53:13.
  • Wright S. 1943. Isolation by distance. Genetics 28: 114-138.