安田徳一{YASUDA,Norikazu}
第6回講座4.3.2.3節(2遺伝子座:配偶子頻度)で2座位の連鎖と組換えの説明をし、選択のない任意交配の無限大集団では、2遺伝子座での配偶子頻度が乗換率が50%でも1世代で平衡頻度にならないことを示した。1座位での遺伝子頻度はハーディ・ワインベルグ法則により1世代で平衡頻度になる。この章では選択作用のあるときの配偶子頻度の世代にわたる変化の様子を連鎖不平衡の考えと共に考察することにする。
この問題についての最初の研究はHaldane(1931)で、適応度が相加的でないエピスタシスepistasisのあるとき、2座位の遺伝子頻度の世代にわたる変化について考察している。2座位の遺伝子の連鎖効果は検討しなかったが、連鎖がゆるくlooseでエピスタシスによる相互作用が弱い選択weak selectionと突然変異の効果を調べている。一方、Wright(1945)は同一染色体上の2座位についての適応度にに交互作用がある単純な模型で、遺伝子の無作為組合わせとの相違を検討している。ただし、乗換率と弱い選択により得られる平衡点の安定性については検討していない。Fisher(1930)も適応度における遺伝子間の相互作用による乗換率の減少の進化について論じたが、その状態維持の安定性については触れていない。
2遺伝子座それぞれで2対立遺伝子が分離しているモデルで、それぞれの染色体頻度の変化を連続模型を用いて最初に示したのはKimura(1956)である。そして、第1の座位が超優性による平衡多型で第2の座位と適応度の上での相互作用epistasisがあると、連鎖が十分密であるなら第2の座位の多型が安定であることを示した。なお離散模型を用いて染色体頻度の変化公式を最初に求めたのはLewontin and Kojima(1960)である。
世代が離散的な2倍体の十分大きな任意交配集団を考えることにする。第1の座位にA1とA2の対立遺伝子が、第2の座位でB1とB2が分離しているものとする。考えられる4種類の染色体A1B1、A1B2、A2B1、A2B2(ハプロタイプということがある)の受精直後の頻度をX1,X2,X3,X4とする。この順序で染色体を1,2,3,4と呼ぶことにすると以下数学的な取り扱いが容易になる。Xiはi番目の染色体頻度を表わし、相同染色体が対合した遺伝子型の適応度はwijと表わすことができる。ΣXi=1である。
2座位間の乗換率をc (0≦c≦1/2)とすると、これらの染色体の世代あたりの変化率は次のようになる。
ΔX1={X1(w1.-w)-cDw}/w
ΔX2={X2(w2.-w)-cDw}/w
ΔX3={X3(w3.-w)-cDw}/w
ΔX4={X4(w4.-w)-cDw}/w
ただし
wi. = wi1X1+wi2X2+wi3X3+wi4X4 (i=1,2,3,4) w = w1.X1+w2.X2+w3.X3+w4.X4 = w11X12+w22X22+w33X32+w44X42 +2(w12X1X2+w13X1X3+w14X1X4+w23X2X3+w24X2X4+w34X3X4) Dw = w14X1X4-w23X2X3
ここでwi.は第i番染色体の平均選択値、wは集団の平均淘汰値、Dwは選択が働いた後の連鎖不平衡linkage disequilibriumの大きさである。連鎖不平衡は異なる座位の遺伝子間の関連のことである。
この結果は次のようにして求めることができる。たとえば第1の染色体について考えてみよう。個体の染色体A1B1はこれと同じ染色体のある親から組換えなしに、あるいはA1B2/A2B1の親から組換えを起こして子に伝わる。
もし親がホモ接合A1B1/A1B1ならば、子に伝えられる染色体は常にA1B1であるから、その伝えられる確率は1である。もしA1B1/A1B2あるいはA1B1/A2B1ならば、A1B1染色体が子に伝えられる確率は1/2である。もしA1B1/A2B2なら、減数分裂の際に組換えが起こらないときA1B1が子に伝わる。その確率は(1-c)/2である。さらにA1B2/A2B1ならば、組換が起きればA1B1は子に伝わるから、その確率はc/2である。
これらの確率に選択が作用した後のそれぞれの染色体頻度を乗じて、それらの合計が子の世代での第1の染色体の頻度X1'が得られる。
X1'= [X12w11+(1/2)(2X1X2w12+2X1X3w13) +{(1-c)/2}(2X1X4w14)+(c/2)(2X2X3w23)]/w
右辺の分母wは子の世代での4種類の染色体頻度の合計が1となるようにする補正である。
ここでw1.=w11X1+w12X2+w13X3+w14X4、Dw=w14X1X4-w23X2X3を用いて整理すると
X1'=(X1w1.-cDw)/w
したがって
ΔX1=X1'-X1={X1(w1.-w)-cDw}/w
他のΔX2,ΔX3,ΔX4についても同様な考え方で導くことができる。
二重ヘテロの個体の遺伝子型はA1B1/A2B2あるいはA1B2/A2B1のいずれかである。この違いを相phaseといい、前者を相引couplingあるいはシスcis、後者を相反repulsionあるいはトランスtransと呼ぶことがある。
この方法は第1の座にn個の複対立遺伝子があり、第2の座にm個の複対立遺伝子がある場合にも容易に適用することができる。ただし染色体頻度を表わす添字はそれぞれの座位の対立遺伝子の番号で表わすと都合がよい。その結果は例えばΔX11は次のようになる。
ΔX11={X1(w1.-w)-cΣDw(11,ij)}/w
Σはi=2,3,...,n、j=2,3,...,mについての和をあらわす。
もし二重ヘテロの相引、相反の適応度が同じ、w11,ij=wi1,1j、ならば
Dw(11,ij)=w11,ij(X11Xij-Xi1X1j)
二重ヘテロの相引、相反の適応度が同じという仮定は2座位の遺伝子が違うことがはっきりしている場合は適切なものである。しかしあるシストロン内の二つのヌクレオチド部位(この場合はn≦4、m≦4)であるならこのモデルは必ずしも適用できない。シス・トランスの位置効果position effectが考えられることがある。
2座位それぞれに2対立遺伝子の場合に戻り、集団の大きさが十分大きい集団での「連鎖不平衡」について考えることにしよう。任意交配、各遺伝子型の適応度は一定(定数)、適応度にシス・トランス効果はない、と仮定する。このような単純化模型としても、この2座位問題は難しく、「準連鎖平衡quasi-linkage disequilibrium」以外の現象についての一般的なことはわかっていない。
ここで、いくつか特別な場合の平衡状態についての報告をまとめることにする。
さて
D=X1X4-X2X3=X11-p1ql
と置くと連鎖不平衡値は
Dw=w4D
と表わされる。X11はA1B1染色体の頻度、p1,q1は集団のA1,B1それぞれの遺伝子頻度である。このDの値は集団中の2重ヘテロ染色体で相引、相反の染色体の頻度の相違の半分であり、また、A1B1染色体の頻度と遺伝子相互作用のないときの頻度p1qlとの差でもある。これらのことから、相引及び相反染色体の頻度が同じ(X1X4=X2X3)場合、あるいは染色体頻度が2座位それぞれの遺伝子頻度の積、すなわち、X11=p1q1のとき連鎖平衡linkage equilibrium(D=0)であるという。
適応度が相加的であるとエピスタシス作用はないから、平衡状態ではD=0となる。エピスタシスがあると、染色体の平衡頻度はエピスタシスによる相互作用と組換えのバランスで決まる。これは組換えにより都合のよい組合わせが失われることと、それに対する高度に密に連鎖した状態をその組合わせについて維持しようとする作用の両者が拮抗するからと考えられる。
エピスタシスがあってD≠0となるとき、ΔX1=ΔX2=ΔX3=ΔX4となる平衡点があるのだろうか、またその平衡点が安定であるかどうか、について研究が行われた。その結果、D≠0の平衡点が安定であるには、エピスタシス作用が大きく乗換率が小さくなければならないことがわかった。いいかえれば、エピスタシスによってある組合わせのハプロタイプは選抜によって多くなりDは大きくなるが、組換えによりDは小さくなる。換言すれば両者の力をくらべたとき、エピスタシス作用が大きいほど連鎖不平衡は保たれることになる。
模型1(Kimura 1956)
第1座位は対立遺伝子A1,A2が超優性による平衡多型で維持されているとし、第2の座位で対立遺伝子B1,B2はA1,A2と次のような相互作用があるものとする。A1はB1との組合わせで有利になるものとし、B2との組合わせで不利になる。一方A2については状況が逆になるとする。ここで、A座位の超優性によってB座位での平衡多型があり得るのだろうか。各染色体の組合わせの選択値は次のようになる。
A1A1 A1A2 A2A2 B1B1 1+s 1+t 1-s B1B2 1 1+t 1 B2B2 1-s 1+t 1+s
ここで 0<s<tとする。
この系において平衡点の染色体頻度と連鎖不平衡値は次のようになる。
X1=X4=(1/4)-D
X2=X3=(1/4)+D
D=(1/2)[√{(1/4) +β2}-β]
ここで
β=(1+t)c/s
この平衡状態では各座位の遺伝子頻度は1/2である。乗換率c=0ならβ=0で、D=1/4となる。この状態ではA1B1とA2B2の2種類の染色体のみが集団に存続する。二遺伝子座はあたかも一座位のごとく行動する。組換え(c>0)があると、連鎖不平衡値Dは小さくなり、A1とB1、A2とB2の関連は弱くなる。A1A2ヘテロ接合の選択係数tがわかると、平衡点はc/sの値、すなわち乗換率と選択係数sの比で決まる。この平衡状態はcが十分小さいときでのみ安定である。その条件は次のようである。
c<{(t-s)(t+s)}/{4t(1+t)}
模型2.(Bodmer & Felsenstein 1967)
9遺伝子型の選択値(適応度)は次の通りである。
A1A1 A1A2 A2A2 B1B1 (1-s)(1-t) 1-t (1-s)(1-t) B1B2 1-s 1 1-s B2B2 (1-s)(1-t) 1-t (1-s)(1-t)
これは乗法的(対称)超優性モデルmodel of multiplicative symmetric overdominanceという。sとtはそれぞれ第一の座位、第二の座位でのホモ接合に対する選択係数である。2座位間のエピスタシス作用は相加的でないことを意味するが、この場合st (1>s,t>0) がそれに相当する。このエピスタシス作用と乗換率cとの間に均衡が生じて、連鎖平衡が生じる。換言すれば、2座位が適応度に関して相加的であるなら、個体の適応度は二つの座位のそれぞれの適応度だけで定まるから、連鎖平衡を生じるため組換に拮抗するエピスタシス作用による選択はない。
乗法的超優性モデルで、集団適応度の最大値は(A1B1,A2B2)あるいは(A1B2,A2B1)の相補的な染色体が存在する集団でのみ存在する。そして平衡点はエピスタシス作用と乗換率の釣合いで定まる。3つの平衡点が存在する。
X1=X4=1/4±D, X2=X3=1/2-X1, D=-(1/4)√[1-{4c/(st)} X1=X2=X3=X4=1/4, D=0
すなわち、各座位の対立遺伝子の頻度はいずれも1/2である。また平衡頻度X1、X4はc<st/4なら、安定であるが、そうでないとD=0(連鎖平衡)のときの頻度、1/4に近づく。
Bodmer and Felsenstein (1967)は乗法的(非対称)超優性モデルで、連鎖平衡D=0が安定平衡であるには次の条件が成り立つ必要があることを示した。
c>{(s1s2)/(s1+s2)}{(t1t2)/(t1+t2)}
ここにs1,s2は第1の座位でホモ接合A1A1,A2A2に対する選択係数、t1,t2は第2の座位でホモ接合B1B1,B2B2に対する選択係数である。また(s1s2)/(s1+s2)、(t1t2)/(t1+t2)はそれぞれ第1、第2座位の分離による(遺伝的)荷重である。すなわち、二つの乗法的超優性座位は連鎖平衡であると同時に多型であるには乗換率(c)がそれぞれの座位の分離による荷重の積より小さくなければならない。
模型3(Lewontin and Kojima 1960; Ewens 1968)
9遺伝子型の選択値(適応度)は次の通りである。
A1A1 A1A2 A2A2 B1B1 1-s 1-t 1-s B1B2 1-u 1 1-u B2B2 1-s 1-t 1-s
t+u-s≠0なら適応度についての2座位間のエピスタシス作用がある。モデルの対称性から各座位の対立遺伝子頻度は1/2である。エピスタシス作用と十分密な連鎖との間にD≠0なる安定平衡が存在し、それは
X1=X4=1/4±D, X2=X3=1/2-X1 ,D=-(1/4)√[1-{(4c)/(t+u-s)}
このとき c<(1/4)(t+u-s)なら、連鎖不平衡(D≠0)で安定な平衡状態が存在する。そうでなければ4種類のハプロタイプ頻度は等しく1/4で連鎖平衡(D=0)となるが、そのときs>|t-u|である。
一般に2座位が非常に密に連鎖(c≒0)していると連鎖不平衡(D≠0)は安定である。しかし、Ewens(1968,1969)はある特定の選択係数に対して、連鎖不平衡が安定であるcの領域がc<(1/4)(t+u-s)の領域と比較的大きな値をとる領域の離れた2領域のあることを示した。たとえば、t=0.78、u=0.82, s=0.1の値で、連鎖不平衡が安定であるcの領域は(0,0.1005)と(0.3731,0.375)である。
模型4(Bodmer and Felsenstein 1967; Karlin and Feldman 1969; 1970)
選択値をより一般的に表わしたモデルとして、次が考えられている。
A1A1 A1A2 A2A2 B1B1 1-δ 1-β 1-α B1B2 1-γ 1 1-γ B2B2 1-α 1-β 1-δ
ここでα、β、γ、δはすべて正の値である。模型3はこの模型4のα=δの場合になるから、以下α≠δとして考察する。
一般に連鎖が高度に密(c≒0)であると、局在的に安定な対称的連鎖不平衡(D≒0)が常に存在する。ここで対称的とはハプロタイプの平衡頻度がX1=X4, X2=X3であることを意味する。一方、連鎖がかなりゆるいとD〜0で安定な平衡状態になることがある。前者の場合は2遺伝子座が高度に密に連鎖していると2座位は「超遺伝子」super-geneを形成し、座位数がさらに多くても、高度に密な連鎖と強いエピスタシス作用が釣り合う状態である。後者の場合は2座位はあたかも独立に個々の座位で超優性による多型が保たれる。しかし乗換率がその中間の値で、選択係数の値によってはまったく平衡点がないか、あるいは非対称的な平衡点(ハプロタイプの平衡頻度がX1=X4, X2=X3とならない)があることがある。
非対称的な平衡点の存在は意外な結果である。生物学的な意味はあきらかではないが、新たに生じた突然変異の動向と何らかの関りがあるのかもしれない(Kimura and Ohta 1971)。たとえば(Karlin and Feldman 1969; 1970)によると、選択係数α=0.03,β=γ=0.004, δ=0.005と乗換率c=0.05(5%の乗換率)で、局在的に安定な非対称的な平衡点は2つあり、それらは
(X1,X2,X3,X4)=(0.8878,0.0542,0.0542,0.0038)
(X1,X2,X3,X4)=(0.0038,0.0542,0.0542,0.8878)
である。
前節(§14)では、2座位が非常に密に連鎖してあたかも1座位であるかのように集団で行動する場合と、連鎖がかなりゆるく2座位間にエピスタシス作用があってもそれが強力でなければあたかも2座位が独立なように行動する場合について考察を加えた。任意交配が行なわれる自然集団においては無作為に選んだ2座位間の連鎖はゆるく、関与する選択係数はエピスタシス作用を含めて小さいのがごく普通であろう。そのような状況での集団のハプロタイプ頻度の変化を考察してみよう。
ゆるい連鎖と比較的弱いエピスタシス作用のあるとき、自然選択による遺伝子頻度の変化は染色体頻度については、乗換率がエピスタシス作用の大きさに比べて大きいなら、次の比は比較的早い世代でほぼ一定となる。集団のこのような状態を準連鎖平衡という。
R=(X1X4)/(X2X3)
なおRと連鎖不平衡値Dとには次の関係がある。
D=(X2X3)(R-1)
したがってR値が一定であってもD値は必ずしも一定とは限らない。またD値が小さいことと|R-1|値が小さいこととは必ずしも対応しない(Kimura 1965)。例えば、場合によってD→0でR→∞となることがある。一般にRはDより、連鎖平衡に依存しやすく、個々の座位の遺伝子頻度にあまり依らないパラメータである。
ハプロイドの集団で、w1,w2,w3,w4をそれぞれA1B1,A1B2,A2B1,A2B2遺伝子型の相対適応度とすると、準連鎖平衡において近似的に
R=1+(ε/c) ただし、|ε|≪c
が得られる。ここにε=w1-w2-w3+w4は適応度にみられるエピスタシス作用を計るパラメータである。この平衡点は安定で、その近傍では平衡点からのずれは毎世代おおよそcの割合で減少する。
たとえばw1=1.0,w2=w3=0.98,w4=1.06,c=0.5、すなわち2座位は独立でA2とB2染色体は適応度を2%下げるが、両染色体があると適応度が6%上がる場合を調べてみよう(Kimura 1965,表1、878頁)。最初のA2とB2染色体の頻度を30%、4種類の染色体が連鎖平衡にある(D=0)とすると、最初の0世代ではX1=49%,X2=X3=23%,X4=9% (すなわち、最初の世代ではr=1.0、rは選択が作用する以前、すなわち受精時のRの値)となる。その後の世代では次のようになる。
世代(t) 選択前の染色体頻度(%) 連鎖不平衡値 X1x102 X2(=X3)x102 X4x102 R Dx102 0 49.0000 21.0000 9.0000 1.10371 0.4419 5 47.8124 21.0096 10.1683 1.21565 0.9184 10 45.9617 21.4762 11.0860 1.21930 0.9752 20 41.5594 22.496 13.4485 1.21895 1.0662 40 29.5776 24.2446 21.9332 1.21811 1.2228 80 3.1992 14.0789 68.6430 1.22280 0.3955 100 0.2827 4.7859 90.1454 1.22814 0.0453 200 0.0000 0.0022 99.9955 1.23141 0.0000
この表から準連鎖平衡が任意交配が始まって5世代ほどの短い期間で、ほぼ平衡値(R=1.23141)に近い1.21565となり、その後非常にゆっくりと平衡値に近づく。前出の近似式からの値は、ε=1.0-0.98-0.98+1.06=0.1、c=0.5だから、R=1+ε/c=1.20となる。
自由組換えでない(c<0.5)と、準連鎖平衡への接近は自由組換の場合(c=0.5)と比べて世代数はより多く要するが、最初の10世代ほどですでにほぼ平衡値に近い値になる。詳細についてはKimura 1965を参照されたい。
集団が準連鎖平衡の状態にあると、集団の平均適応度の変化は近似的に遺伝子分散に等しく、フィシャーの自然選択の基本定理(Fisher 1930)が近似的に成り立つ。これは連鎖不平衡とエピスタシス分散の寄与が互いに打ち消し合うからである(Kimura 1965)。
二倍体の集団ではより複雑な様相を呈するが、準連鎖不平衡に到達する過程はハプロイドの場合とほぼ同様である。ただし、エピスタシス作用は
ε=w1.-w2.-w3.+w4.
で測る。
エピスタシス作用は絶えず乗換率を小さくする傾向があり、有利な突然変異遺伝子が広がるには乗換率がより大きい方が都合がよいことを、フィシャーがかなり前に指摘した(Fisher 1930)。連鎖はこれら二つの相反する作用で調整されているのかも知れない。根井は適応度が関与する座位間でエピスタシス作用があるときにのみ、変異染色体および乗換率を低くする遺伝子が選択に対して有利なことを示した(Nei 1967)。そのような選択により連鎖の緊密性は修正されていくが、その際に乗換率は常に小さくなることが予測された。このことは強い相互作用のある遺伝子は互いに近くに密に位置する傾向があり、一度集積すると長い間それを維持することになる。これによりウイルスからヒトまで多くの生物で、オペロン、遺伝子集積、遺伝子複合体が存続する進化的な機構を説明することができる。
ウイルスからマウスまでのいくつかの生物について調べたところ、単位DNAあたりの乗換率は高等生物の方が下等生物より小さいことがわかった(Nei 1968)。すなわち
生物 マップ全長(a) ヌクレオチド対
全長(b)(b)/(a) 連鎖
のタイプウイルス ファージT4 350 2x105 6x102 環状 ファージT5 110 1x105 9x102 線状 ファージP22 90 6x104 6.7x102 環状 ファージλ 28 1x105 3.6x103 線状 バクテリア 大腸菌 1,780 4x106 2.2x103 線状 ストレプトマイシン菌 260 4x106 1.5x104 環状 真菌類 酵母 3,600 2x107 5.6x103 線状 赤パンカビ 1,000 4x107 4x104 線状 コウジカビ 600 4x107 6.2x104 線状 高等生物 ショウジョウバエ 280 8x107 2.8x105 線状 マウス 1,954 5x109 2.6x106 線状 トウモロコシ 1,350 7x109 5.2x106 線状
ヌクレオチド対全長/マップ全長{(b)/(a)}の比はマップユニットあたりのヌクレオチド対の数を表わし、この値が大きいほど組換が少ないと考えられる。