安田徳一{YASUDA,Norikazu}
疾患や異常に関る原因遺伝子の多くはその発現が生殖に影響する、すなわち自然選択が働くとみられるから、機会的浮動の過程に定方向的な自然選択が加わった場合の確率密度がどのようになるかは興味深いものがある。
取り扱いが一番簡単な場合として、対立遺伝子Gとgとの間に適応度に対して優劣関係のない、遺伝子選択genic selection、の場合を考える。集団でのGとgの遺伝子頻度をそれぞれx, 1-xとする。任意交配で三種類の遺伝子型の頻度および適応度は次のようになる。
遺伝子型 頻度 適応度 GG x2 a11 Gg 2x(1-x) a12 gg (1-x)2 a22
ただし、a12=(a11+a22)/2、あるいは|a11-a12|=|a12-a22|=sである。このとき
Mx=sx(1-x)、Vx=x(1-x)/(2N)
となるから、前向き方程式は
∂φ/∂t=(1/4N)∂2{x(1-x)}φ/∂x2-s∂{x(1-x)φ}/∂x (0<x<1)
である。突然変異も移住もないと仮定しているから、自然選択の作用と共に遺伝子の機会的な固定あるいは消失が進む。ライトはショウジョウバエの実験小集団で自然選択の過程を解析するにあたり、この式を用いており、とくに定常状態の分布式を巧みな数値解法で求めた(Ns=1.7;Wright & Kerr 1954)。Kimura(1955)は数学的に厳密な解を求めることに成功して、遺伝子頻度の確率密度の時間的経過の全過程を明らかにした。
φ(p,x;t)=ΣCkVkexp(-λk+2Nsx) (k=0,1,2,...)
ここにΣはk=0,1,2,...についてであり、Ckは初期の遺伝子頻度pに依存し、Vkはt世代の遺伝子頻度xで決まる多項式(特殊関数Gegenbauer polynomials)で表わされる(Abramovitz & Stegum 1972)。λkは遺伝子頻度0<x<1のクラスが毎世代で減少していく速度をあらわし、Ns=0(N>0)ではλ0=1/2Nである。Ns≪1なら、次の関係式が得られる。
2Nλ0 =1 +(4/10)(Ns)2-(16/7,000)(Ns)4-(64/1,050,000)(Ns)6 -1051.648x10-8(Ns)8-8057.856x10-11(Ns)10-... =1 +0.4(Ns)2-0.002265714(Ns)4-0.000060952(Ns)6 -1051.648x10-8(Ns)8 -8057.856x10-11(Ns)10-...
この式は2Nλ0の正確な値についてNs=3でも三桁の有効数字が得られる。いくつかの正確な値は次の通りである。
Ns 2Nλ0 Ns 2Nλ0 0.0 1.00000 3.5 5.43183 0.5 1.09985 4.0 6.54540 1.0 1.39765 4.5 7.66121 1.5 1.88771 5.0 8.75330 2.0 2.55297 6.0 10.85728 2.5 3.39445 7.0 12.89983 3.0 4.36529 8.0 14.91989
2Nλ0の値はNs>3の値に対して直線的に増加するようであるが、数学的な証明はない。Wright & Kerr のデータはNs=1.7であるから、上のテーブルからおよそ2Nλ0=2.1という結果が得られる。
定常状態で確率密度の分布曲線の高さが低下する速度は、問題の遺伝子が固定あるいは消失する過程を特徴づける最も重要な数量である。数学的にいうと偏微分方程式の最小固有値に相当する。すなわち
-∂{∫φdx}/∂t={φ(1,p;t)+φ(0,p;t)}/(4N)
左辺は時間tにおける2対立遺伝子が共存するクラスの頻度の減少率で、積分は
0<x<1の範囲である。右辺の第一項は対立遺伝子Gが固定する確率であり、第二項はGが消失する確率である。詳しい導き方はKimura(1995;49-50)を参照されたい。
対立遺伝子Gがgに対して完全優性とする。遺伝子型GG、Ggはホモ接合ggに対してsだけ選択有利とする。Gの遺伝子頻度をxとすると、世代あたりのxの変化の平均と分散は
Mx=sx(1-x)2、 Vx=x(1-x)/(2N)
となる。確率密度φ(p,x;t)を満たす前向きの方程式は次の形となる。
∂φ/∂t=(1/4N)∂2{x(1-x)}φ/∂x2-s∂{x(1-x)2φ}/∂x (0<x<1)
この解は
φ=e-λte2Nsx(1-x/2)w
の形で表わせる。wはz=1-2xで展開されるGegenbauer polynomialの和で表わされる。固有値λおよび多項式の係数はNsの級数として求めることができる(Kimura 1957)。たとえば、定常状態での最小の固有値は
2Nλ0 =1 -(1/5)(Ns)+{199/(2x53x7)}(Ns)2+{17/(2x55x7)}(Ns)3 -{(23x41x29599)/(23x33x56x73x11)}(Ns)4-... =1 -(0.2)(Ns)+(0.1137142857)(Ns)2-(0.000388518)(Ns)3 -(0.002191937)(Ns)4-...
となる。
定常状態における遺伝子頻度の分布は
φ(x)=exp{2Nsx(1-x/2)}w0
ただし、
w0= d0{T0(z)-0.0058T1(z)-0.0028T2(z)+0.0004T3(z)+0.00006T4(z)+...} T0(z)=1, T1(z)=3z, T2(z)=(3/2)(5z2-1), T3(z)=(5/2)(7z3-3z),... z=1-2x
である。
この状態でのG遺伝子の世代あたりの固定率および消失率はそれぞれφ(1)/(4N)、φ(0)/(4N)であるから、
4Nλ0=φ(1)+φ(0)
となる。
たとえば優性個体にわずかに有利な選択がはたらく場合(2Ns=1)とわずかに不利な選択がはたらく場合(2Ns=-1)を選択のない(Ns=0)を基準にして考えてみよう。最小固有値(λ0)から求めた定常状態における0<x<1クラスの世代あたりの減少率は有利な選択では0.928/(2N),選択なしで1/(2N)、不利な選択で1.128/(2N)となる。定常状態での各クラスの頻度分布は確率密度の式から得られる。Ns=1とNs=-1の場合での数値を以下に示した。なお比較のためNs=0の場合の頻度も掲げた。固定したクラスと消失したクラスの頻度の合計φ(1)+φ(0)が固有値から求めた値(4Nλ0)とよく一致していることがわかる。
2Ns=1 2Ns=-1 2Ns=0 2Nλ0 0.928 1.128 1. 4Nλ0 1.856 2.256 φ(1)+φ(0) 1.855 2.254
定常状態のφ(x)の頻度x=0.0 0.688 1.389 1.000 0.1 0.764 1.251 1.000 0.2 0.838 1.142 1.000 0.3 0.910 1.056 1.000 0.4 0.977 0.990 1.000 0.5 1.037 0.940 1.000 0.6 1.088 0.903 1.000 0.7 1.128 0.879 1.000 0.8 1.155 0.865 1.000 0.9 1.168 0.860 1.000 1.0 1.166 0.866 1.000
この例でたいへん興味深い事実は、遺伝子頻度の変動に機会的浮動のみが働き選択のない中立の状況と比較して、優性遺伝子に有利な選択(s>0)があると定常状態での減小率(λ0)は遅くなり、不利な選択(s<0)があると加速されるとみられることである。もっともこのことは2Nλ0のNsでの級数展開の第2項{-(1/5)Ns}からわかることでもある。微弱な選択では-1<Ns<1であるから
2Nλ0〜1-(Ns/5)
と近似される。2Nλ0のNsでの級数展開の式から、s>0のとき2Ns=0.9で2Nλ0は最小値となり、その後Nsの増大とともに2Nλ0は増加することが示される。
遺伝子頻度がx=0.4のクラスでは選択が優性個体に有利(2Nλ0=0.977)でも不利(2Nλ0=0.990)でも減小率にはほとんど差がみられない上、中立の場合(2Nλ0=1)ともほとんど差がない。
十分大きな2Nsでの2Nλ0は次の公式から求められることをMiller(1962)が示した。
2Nλ0=0.718√(Ns/2)
彼は0≦Ns≦60に対する厳密な2Nλ0を数値的に求めた。
Ns 2Nλ0 Ns 2Nλ0 Ns 2Nλ0 0 1.0000 12 3.2542 32 5.7142 1 0.9120 14 3.5676 36 6.0972 2 1.0244 16 3.8586 40 6.4594 3 1.2688 18 4.1312 44 6.8038 4 1.5586 20 4.3886 48 7.1326 6 2.0900 22 4.6332 52 7.4480 8 2.5300 24 4.8668 56 7.7512 10 2.9118 28 5.3058 60 8.0438
集団の大きさが小さいと、連続模型でなく離散型のマルコフ連鎖の考えで直接数値的に遷移確率を計算することになる。たとえばN=4、2Ns=1ならば、固定あるいは消失していないクラスの頻度分布は次のようになる。
クラス 頻度(%) 7G+1g 14.80 6G+2g 16.48 5G+3g 16.32 4G+4g 15.51 3G+5g 14.28 2G+6g 12.64 1G+7g 9.97
このときの減小率はλ0=0.11875であるから、2Nλ0=2x4x0.11875=0.95。中立(s=0)ではλ0=1/(2N)=1/(2x4)=0.125だから2Nλ0=1で、優性個体に対するこの程度の選択では減小率は中立の場合にくらべて遅い。この結果は連続模型での結果と一致する。
対立遺伝子G,gの大きさNの集団での頻度をx、1-xとし、任意交配のもとでの3つの遺伝子型の適応度をマルサス径数で測るものとする。すなわち
遺伝子型 頻度 適応度 GG x2 s Gg 2x(1-x) sh gg (1-x)2 0
このとき遺伝子頻度Gの世代あたりの平均変化率は
Mx=sx(1-x){h+(1-2h)x}
となるから、前向きの方程式は次のようになる。
∂φ/∂t=(1/4N)∂2{x(1-x)}φ/∂x2-s∂[x(1-x){h+(1-2h)x}φ]/∂x (0<x<1)
これから定常状態での確率密度は
φ(p.x;t)=exp[-λ0t+Nsx{2h+(1-2h)x}]・w0
の形で表わされる。ここで弱い選択(-1<Ns<1)なら、最小の固有値は(Ns)のべき級数で次のように表わすことができる。
2Nλ0 =1 -(1/5)D(Ns)+{1/10+(12/875)D2}(Ns)2+{(1/1750)D-(4/175)D2}(Ns)3+... =1 -0.2D(Ns)+(0.1+0.0137142857D2)(Ns)2 +(0.0005714285D-0.0228571428D2)(Ns)3+...
ただし、D=2h-1。優劣関係がなければh=1/2だから、D=0;完全優性ならh=1だから、D=1、完全劣性ならh=0だから、D=-1である。この結果はすでに述べた遺伝子選択の場合(h=1/2)でのsを2sとし、完全優性の場合(h=1)を包含する結果となっている。w0は1-2xのべきでGegenbauger polynomialであらわされる。その係数はやはりNsのべき級数の形で求めることができる。
11.2.3.3節でGG、Gg、ggの適応度がそれぞれ-s1、0、-s2と、いわゆる超優性の場合には
s1=s(h-1)、 s2=sh、 sd=s2-s1
と対応する。 これから
D=2h-1=(s1+s2)/(s2-s1)。
ここで両ホモの適応度が同じである(s2=s1=ss)場合について考察してみよう。
この場合Nsd=0、NsdD=N(s1+s2)=2Nssであるから、弱い超優性(-1<Nss<1)では定常状態における 0<x<1クラスの減小率は、前節の結果から次のように表わすことができる。
2Nλ0 =1 -(2/5)(Nss)+(48/875)(Nss)2-(32/21875)(Nss)3 -(15552/58953125)(Nss)4-... =1 -0.4(Nss)+(0.0548571428)(Nss)2-(0.0014628571)(Nss)3 -(0.0002638028)(Nss)4-...
しかしながら、超優性の場合はN(s1+s2)=2Nssの値が比較的大きい。この点については Miller(1962)、Robertson(1962)の研究がある。
超優性での世代あたりの遺伝子頻度の定方向的変化率は
Mx ={s2-(s1+s2)x}x(1-x) =(s1+s2)(xe-x)x(1-x)
ここにxe=s2/(s1+s2)は対立遺伝子Gの平衡頻度である。したがって前向きの方程式は、対立遺伝子間の対称性から2xe-1=zeと書き直すと、次のように表わされる。
∂φ/∂t=(1/4N)∂2{x(1-x)}φ/∂x2-ss∂{(2x-1-ze)x(1-x)φ}/∂x
ここで ss=(s1+s2)/2である。
対立遺伝子間の対称性から、xe≧0.5、すなわち、ze≧0の範囲を考察することで十分である。ミラーによると、Nssの値が大きく、1>ze≧0の範囲での最小の固有値は次のようになる。
2Nλ0=(A+B){(Nss)/T(Nss,ze)}
ここで
A=[(1-ze)exp{-(Ns)(1-ze)2}]/S{(Nss)(1-ze)2}
B=[(1+ze)exp{-(Ns)(1+ze)2}]/S{(Nss)(1+ze)2}
S(X)=1+(1/2)(1/X)+{(1x3)/22}(1/X)2+...
T(Nss,ze) =Σ[C2iΓ{i+(1/2)}/(Nss)i+(1/2) (i=0,1,2,...∞) =C0√{π/(Nss)}+(C2/2)√{1/(Nss)}+...
ここにΓ(X)はXのガンマ関数で、たとえばΓ(1/2)=√(π)、Γ(i+1)=iΓ(i)である。iが正の正数ならΓ(i)=1・2・…・(i-1)。ただしΓ(1)=1(例えばAbramowitz & Stegun 1972参照)。
Ciは
C0=1/(1-ze2), C1=2ze/((1-ze2)2
から始めて、 (1-ze2)Ci+1=2zeCi+Ci+1 なる漸化式で順次計算する。
特に、ze=0、すなわち、s1=s2の場合には
2Nλ0=2√(Nss)e-Ns/√[π{S(Nss)}2]
となる。
Miller(1962)は0≦Nss≦12の値についての2Nλ0を数値計算をした。
Nss\xe 0.5 0.6 0.7 0.75 0.8 0.9 0.0 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 0.5 0.8136 0.8174 0.8292 0.8382 0.8490 0.8766 1.0 0.6532 0.6682 0.7130 0.7466 0.7876 0.8916 1.5 0.5172 0.5482 0.6408 0.7096 0.7932 1.0038 2.0 0.4038 0.4528 0.5982 0.7060 0.8360 1.1590 3.0 0.2358 0.3154 0.5516 0.7258 0.9352 1.4532 4.0 0.12984 0.2230 0.5082 0.7256 0.9930 1.6730 5.0 0.06770 0.15656 0.4550 0.6990 1.0110 1.8374 6.0 0.03362 0.10780 0.3964 0.6558 1.0032 1.9648 7.0 0.016004 0.07242 0.3384 0.6044 0.9790 2.0656 8.0 0.007362 0.04750 0.2840 0.5498 0.9444 2.1460 9.0 0.003294 0.03046 0.2352 0.4948 0.9030 2.2106 10. 0.0014410 0.01918 0.19230 0.4414 0.8578 2.2622 11. 0.0006192 0.01186 0.15562 0.3910 0.8100 2.3032 12. 0.0002622 0.00722 0.12472 0.3440 0.7614 2.3352
この数値表からわかることは次の通りである。遺伝子頻度の平衡値xeが0.8より大きく、あるいは0.2より小さい、すなわち4s1<s2あるいは4s2<s1ならば、超優性は中立の場合(2Nλ0=1)と比べて固定、あるいは消失を減速する(2Nλ0<1)というよりもむしろ加速する(2Nλ0>1)。この事実はRobertson(1962)が最初に報告したのである。平衡の遺伝子頻度が0.2<xe<0.8の範囲内では2Nλ0<1と固定率は減速するが、それ以外の範囲ではヘテロが有利なことで固定が加速するとことを示した。ロバートソンは減速因子retardation factorを1/2Nλ0としてその過程を図で示した。いずれにせよxeは0あるいは1を除いたどんな値でもN(s1+s2)が大きくなると固定率は減速する。たとえばいくつかの遺伝子頻度の平衡値xeで2Nλ0=0.01(減速因子=100)であるときのN(s1+s2)の値は次のようになる。
xe 0.05 0.1 0.2 0.3 0.4 0.5 N(s1+s2) 2100 490 110 45 22 15
ここでは十分大きな集団で任意交配が行われ、優性のない遺伝子選択の状況でのモデルを考えることにする。選択強度のゆらぎは集団が大きいかろうが小さかろうが環境の変動を反映するものである(Fisher & Ford 1947, Wright 1948)。したがって配偶子の機会的抽出による効果は無視し得るものとする。2対立遺伝子G,gの頻度をx,1-xとする。
G遺伝子の一世代あたりの頻度変化は
Δx=sx(1-x)
であるが、ここでsを世代毎にゆらぐ平均sm、分散Vs確率変数とみることにする。
そうすると
Mx=smx(1-x)、 Vx=Vsx2(1-x)2
であるから、前向きの方程式は次のようになる。
∂φ/∂t=(Vs/2)∂2{x2(1-x)2}φ/∂x2-sm∂{x(1-x)φ}/∂x (0<x<1)
この方程式の一般解は木村(Kimura 1954)によって得られているが、特にsm=0、平均的に中立の場合の確率密度が詳しく調べられている。すなわち、
φ(x,t)= {1/√(2πVst)}・exp{-(Vst)/8}/{√(x(1-x)3)}・ ∫exp[(log{-(x(1-y))/((1-x)y)})2/(2Vst)]・{y(1-y)}φ(y,0)dy
ここに積分の範囲は0<y<1(yはt=0での遺伝子頻度を表わす)で、φ(y,0)は時間t=0での確率密度(初期分布)である。
初期分布が連続型でなく、t=0のときy=pと一定の値(離散型)であれば、確率密度は次のようになる。
φ(x,p,t)= {1/√(2πVst)}・exp[-(Vst)/(8)-(log{-(x(1-p))/((1-x)p)})2/(2Vst)]・ √[{p(1-p)}/{x(1-x)3}]
この確率密度の性質について少し調べてみよう。
分布の積率。遺伝子頻度の平均値と分散は次のようになる。
平均値: ∫xφ(x,p,t)dx=p 分散: ∫(x-p)2φ(x,p,t)dx〜p(1-p)-√{πp(1-p)/(2Vst)}・exp(-Vst/8)
これから、
FST〜(分散)/{p(1-p)}=1-√{π/(2Vst・p(1-p))}・exp(-Vst/8)
であるから、各遺伝子型の頻度は次のようにあらわされる。
GG: p2+p(1-p)FST Gg: 2p(1-p)(1-FST) gg: (1-p)2+p(1-p)FST
このような遺伝子型頻度はかなり世代数が経過したときに実現する。
分布の形
(1).遺伝子頻度が0、あるいは1の確率密度は世代を通じて常に0である。
(2).世代数tが4/(3Vs)未満では一峰型である。たとえば、p=0.5, Vs=0.0483なら、t=27世代までは一峰型である。その後の世代では二峰型である。
(3).x=0の近くの確率密度の峰とその遺伝子頻度は次の性質がある。
x(max1) 〜p/(1-p)・exp{-3Vst/2)} →0 (t→∞) φ(max1) 〜1/√(2πVst)・{(1-p)2/p}・exp(Vst) →∞ (t→∞)
右辺矢印は世代tが十分経過したときのそれぞれの値の大きさを表わしている。すなわち、確率密度の最大値φ(max1)を与える遺伝子頻度x(max1)は限りなく0に近づくが、その確率密度は限りなく大きくなる。x=1の近くでも同じ現象が見られる。上式でpの代りに1-pとすれば第2のmax2について、それぞれの式が得られる。(2)の例ではt=100では
x(max1)=0.0007 φ(max1)=11.37 x(max2)=0.9993 φ(max2)=11.37
(4).t=4/(3Vs)世代以後で最小となる遺伝子頻度と確率密度の極値(x=0と1を除いての最小値)はつぎのようになる。
x(min)〜 1/2-log{p/(1-p)} φ(min)〜 1/√{p(1-p)/(2πVst)}・[(1/4)-{logp(1-p)/(2Vst-4)}2]-(3/2) ・exp[-Vst{(1/8)+(9/8){log(p/(1-p))/(2Vst-4)}2}]→0 (t→∞)
以上の考察から、十分大きな集団での選択強度の偶然によるゆらぎによる遺伝子の完全な固定あるいは消失は起こらない。これは小集団での機会的浮動が遺伝子の固定あるいは消失を起こすのとまったく違う現象である。
しかしながら、世代の経過とともに遺伝子頻度は単型monomolophicに近い状況になり、ほとんど固定almost fixedあるいはほとんど消失almost lostの状態になる。この状態を機会的浮動の場合と対比させて擬似固定quasi-fixation,擬似消失quasi-lossという。そしてこの状態に近づく速度はVst/8である。
実際には突然変異が起こるからでこの状態となることは妨げられることになる。
もし選択についてVs≪smなる条件が成立すると、十分大きな集団における遺伝子選択を決定論的過程として考察することになる。この場合の確率密度は漸近的に次のようになる。
φ(x,p,t)= {1/{x(1-x)√(2πVst)} ・exp[-log{(x(1-p))/((1-x)p)-smt}2)/(2Vst)]
ここでξ=log{x/(1-x)},η=log{p/(1-p)}とおけば (ロジット変換)
φ(ξ,η,t)={1/√(2πVst)}・exp[-(ξ-η-smt)2/(2Vst)]
これは平均η+smt、分散Vstの正規確率密度である。すなわち遺伝子頻度をロジット尺度logit scaleではかると、一次元ランダムウォークrandom walkの過程となる。この結果は非常に有用である。たとえばsm=0.1,Vs=0.0025では各世代tでの正規分布の平均、分散、標準偏差は次のようになる。
世代
t平均
η+smt分散
Vst標準偏差
√(Vst)0 0.0 0.0 0.0 1 0.1 0.0025 0.05 2 0.2 0.0050 0.07 3 0.3 0.0075 0.08 4 0.4 0.0100 0.10 5 0.5 0.0125 0.11 6 0.6 0.0150 0.12 7 0.7 0.0175 0.13 8 0.8 0.0200 0.14 9 0.9 0.0225 0.15 10 1.0 0.0250 0.16
この問題を世代の離散型モデルで考察すると次のようになる。第t世代におけるG遺伝子の頻度をx(t)とし、GG,Gg,ggの選択値をそれぞれ1,1-st,(1-st)2とすると、
x(t+1)=x(t)/{1-st(1-x(t))}。
したがって
x(t+1)/(1-x(t+1))={x(t)/(1-x(t))}・{1/(1-st)}
両辺の対数をとり、ロジットzt
zt=log{x(t)/(1-x(t))}
を考えると
z(t+1)=z(t)-log(1-st)
と簡単になる。遺伝子頻度xが0から1の範囲の値をとるのに対して、zは-∞から+∞の値をとる。これから
z(t)=z(0)-Σlog(1-si) (z(0)=log{p/(1-p)})
ここにΣはiについて世代0からtまでの和をあらわす。-log(1-si)〜si(近似は0<si≪1のとき)は世代とともにゆらぐ確率変数で、その平均は0,分散をVsで表わせば、z(t)は平均z(0)、分散Vstの確率分布をし、tの大きいところでは統計学でいう中心極限定理により正規分布に近づく。
したがってz(0)、Vsが有限の値であればt=∞でない限りz(t)は-∞または+∞となる確率は0で、したがって遺伝子の固定または消失の確率は0である。