基礎の遺伝疫学講座   安田 徳一 (20/12/20)


 

6. 関連

健常と罹患あるいは罹患の尺度となる量的形質は、家族あるいは集団で遺伝性であろうと非遺伝性であろうとも表現型間で関連を表すことがある。そのような関連には多くの原因が考えられるが、そのなかでも重要なものは、遺伝子の対立性allelism、連鎖linkage、連鎖不平衡linkage disequilibrium、多面発現、pleiotropy、相互作用interaction、その他に遺伝子と環境の相互作用による変動などが挙げられる。その他、標本の偏りや集団構造の異質性はむしろ生物学的な原因究明の前に吟味して取り除かねばならない。これらについては後の章に譲る。

 

6.1.遺伝子の対立性

複対立遺伝子の頻度には互いに負の相関がある。複対立遺伝子型による形質の頻度は互いに正負いずれの相関を示す。表6.1.1.は2つの形質の観察値、関連を表わすよく使われる尺度とその有意性の検定をまとめたものである。 

                  表6.1.1. 因子の関連

                  因子1〵因子2     +     +                                

                 +         a     b     a+b

      -                  c     d     c+d  

                                      計               a+c   b+d  a+b+c+d=n                    

   関連の尺度:積率                r=(ad-bc)/{(a+b)(c+d)(a+c)(b+d)}= (χ2/n)

 Yatesの補正χ2検定(自由度=1)    χ12={ n(|ad-bc|-n/2)2}/{(a+b)(c+d)(a+c)(b+d)}      

 

多くの対の対立遺伝子形質の関連は弱く、統計的に有意な結果を得るには非常に大きな標本が必要である。ブラジル東北地方で調べた対立遺伝子形質の相関係数66のうち11-0.05から+0.05であった(Mi & Morton, 1966)。 1パーセント水準で、相関係数±0.05の有意性を得るにはχ2=6.635が必要で、それには標本の大きさは少なくともn=6.635/(0.05)2=2,654を要する。対立遺伝子形質の関連を検出するのに必要な検定力は大標本でも十分ではない。

 関連がないとする帰無仮説での関連についての情報は 

                     K=p1(1-p1)p2(1-p2)n 

である。

ここにp1p2は対立遺伝子(因子)の頻度である。これから関連を検出する検定力は頻度が0.5に近いときに最大となることがわかる。両方の頻度がまれか高い頻度の場合では、情報が大きく減ることがわかる。たとえば、p1(1-p1)p2(1-p2)=0.01ならば観察値あたりの情報は最大値の1/625に過ぎない。ブラジルのデータからも、これは明らかである。 

p(1-p)               <0.05     0.050.15    0.15

1%水準で有意/組数      5/25     29/37      46/48

(割合)                        (0.20)      (0.78)              (0.96)

 

また1パーセント水準で対立遺伝子形質の相関が得られる割合27パーセントが有意であるには標本数はn=100を要する。割合が73パーセントならn=1,00085パーセントでn=10,000となる。

 標本の大きさが適度の大きさでも対立形質に関連がみられるが、そうでない組もある。新しい形質が関連検定で運よく推定できても、有意でない結果をあまり重視するべきではない。ある表現型が全くない方が役に立つことがある。Kell式血液型のk0k0型やハプトグロブリンHp2-1個体でのHp 1F-1S型はそのような例である。しかし、ある形質がある複対立遺伝子座位に属するか否かの判断は連鎖検定の方が強力で確かである。

 

6.2.連鎖

遺伝子座が染色体に線状に並んでいるという物理的構造は、2組の座位の対立遺伝子の分離にお互いにある種の制約が伴うことを示す。同一染色体の2つの遺伝子が共に伝達する傾向を連鎖linkageという。互いに近くに位置する2座位のそれぞれの対立遺伝子の組み合わせ(ハプロタプhaplotypeということがある)は遠くに離れた位置にある2座位のハプロタイプに比べて組換えにより対立遺伝子の組み合わせが変わることは少ない。この事実に基づいて座位の順位を染色体上で決めることができる。すなわち組換え率を用いて座位を線状に並べた染色体マップmapを作製することができる。接合体の一つの配偶子(染色分体chromatid)に2座位の特定の対立遺伝子の組合せを相引couplingと呼ぶなら、その特定の対立遺伝子が別々の配偶子にある組合せを相反repulsionという。この2つの状態をまとめて相phaseという。連鎖した遺伝子が相引であるということは一対の相同遺伝子が物理的に同じ染色体にあることを意味する。2座位GTの組換え率をθとするとθ<1/2のとき関連が生じるであろう(表6.2.1)。しかし、相引と相反の頻度が等しくないときにしか集団で関連はみつからない。既に3.6.節で触れたように、等しくなる状態に近づくのはθが 

                    6.2.1. 二重ヘテロ接合GgTtの配偶子形成

                          GT        Gt          gT         gt                

                              GT相引      (1-θ)/2   θ/2     θ/2   (1-θ)/2

                              GT相反    θ/2   (1-θ)/2   (1-θ)/2   θ/2

                              観察値           a             b              c             d

P(a,b,c,d)=Const{(1-θ)a+dθb+c+θa+d (1-θ)b+c

小さいときを除いてかなり速い。このことから、混血集団では密に連鎖した対の遺伝子を例外として関連は実質的に崩れる。

 ところで上の式でa+db+cを入れ替えても同じである。あるいはθと1-θを入れ替えても同じことである。このとき尤度関数は相引と相反の各頻度が等しいことが必要十分である(Edward 2006)

 連鎖の検出には2つの問題がある。第一に連鎖の情報がある家系が通常あまりにも少なく、大標本理論による検定法に信頼がおけない。第二に2つの無作為に選んだ座位が連鎖している確率はおよそ0.054と小さく、わずかに“有意”な連鎖を示す大部分は見せかけに過ぎない。これら二つの難点はロッド得点法lod score methodで克服することができる。i番目の家系の組換え率θのロッド得点zi(θ)は次のように表わされる。Pi(θ|θ<1/2)は組換え率θのときのi番目の家系の(連鎖がある)確率、Pi(1/2|θ=1/2)は連鎖がないとき(帰無仮説:H0)の確率である。 

                zi(θ)=log10{Pi(θ)/Pi(1/2)} 

中括弧の中はある家系の連鎖がある場合と連鎖がない場合の確率比で、ロッド値は確率比の常用対数で表わす。対数をとることで、複数の家系から得られたロッド値を加算することが可能である。

したがって帰無仮説:H0の下で、次の不等式が成り立つ。 

                P{ zi(θ)>log10 A| H0}<1/A 

この式は標本の大きさが小さくても厳密に成り立ち、Aが十分大きければ連鎖の強力な証拠となる。慣例としてA=1,000あるいはlog10 A=3が使われている。一般に座位間の組換え率はヒト男子では女子よりも小さい。したがって男子のθm と女子のθf とは区別する必要がある。

 連鎖地図は組換えの事実だけでなく、精子形成でのキアズマの分布、や細胞遺伝学や体細胞遺伝学のアプローチで物理的位置付けも表わしている。それぞれの方法によるマップへの変換法も開発されており、さらに多くのマーカーが染色体の連鎖地図に追加されている。

 遺伝性疾患の連鎖地図上の位置は位置の分かっているマーカーを同時に調べて、連鎖があるかないかで形質の座位を二群に分けることを可能とした。たとえば、ある家系で楕円赤血球症 (EL1)1番染色体のRh式血液型と連鎖していた。しかし別の家系では連鎖が見つからなかった。これは楕円赤血球症の原因遺伝子は2つ以上あることを示している。大家系と密な連鎖により、この異質性はロッド得点のグラフから明らかである。これはn個の家系での異質性検定の大標本理論から確かめられた(Morton 1956) 

                   χ2n-1=2 ln 10{zi(θ)-Z} 

ここでzi(θ)は@番目の家系のロッド値の最大、Zは家系全体をプールして得たロッド値の最大である。また、2 ln 10=4.605。より強力な検定として、@番目の家系の確率を 

               Pi(θ,m)=m Pi(θ)+(1-m)Pi(1/2) 

として得られる。個々にmはマーカーと連鎖している家系の割合で、θとmは同時推定をする。大家系、ドミナンス、完全浸透、それに密な連鎖が連鎖の異質性を明らかにする条件である。

 連鎖の異質性を検定するには、一方の性の組換え率を他方の性の組換え率の関数として表すことにより、より簡単で効果的である。男子と女子の地図距離をそれぞれwmwfとし、k= wf /wmとする。kの平均値はおよそ1.8であるが、動原体の近傍ではより大きく、末端になるほどに小さくなる。ある染色体断片のkの値が分かれば、それを定数としてθmを変量に用いてロッド値を計算する。これによってθm=θfという仮定をする必要はなくなる。これは小家系で低浸透率のときに特に有用である。

 

6.2.1. マップ関数

この章では染色体の長さに配慮したモデルについては触れない。関心のある読者は例えばSturt(1976)を参照されたい。 

 遺伝子座の染色体上の位置を定めるには連鎖という現象を利用する。連鎖の尺度は組換え価recombination frequenncyθである。組換え価は2つの座位が近ければ小さな値となるが、互いに遠くなるか別の染色体に位置すれば1/2となる。さらにそれらの順序をしらべるには3つの座位ABCについてABACBC3つのθAB、θAC、θCBを用いてお互いの順序を求める。このときヒトを含めた哺乳類ではこれら組換え価の間に加法性がなく、たとえば順序がA-C-Bなら 

                     θAB<θAC+θCB                    

となる。すなわちAB区間の乗換えはACCBの両区間の、二重組換えのため相殺されて組換えが観察できない。すなわち 

                   θAB=θAC (1-θCB)+ θCB(1-θAC)

                             =θAC+θCB-2θACθCB            {Trow(1913)} 

ここでθAC<<1、θCB<<1ならば θAB≒θAC+θCB となる。すなはち、加法性がほぼ成立する。加法性がないのは染色分体の多重乗換えのためである。

 乗換え価は距離の公準を満たす。すなわち

  @) 組換え価は負にならない: θ≧0

  A) 地図上のA点からBまでの距離はB点からAまでの距離のに等しい:θAB=θBA

  B) A点からAまでの距離はゼロである:θAA=0

  C) A点からBまでの距離はA点からC(CA)まで距離とC(CB)からの距離までを足した距離を超えるこことは無い: θAB≦θAC+θCB

 相同染色体上の2座位区間で平均して乗換えが染色分体あたりx回生じるとき、その2座位間のの距離をxで表し、これを地図距離map distanceという。その単位はモルガン(M)、あるいはセンチモルガン(cM)で測る。たとえば平均して1.5回乗り換えが生じる距離は1.5Mあるいは150cMと呼ぶ。組換と違い、乗換えは多重乗換えが生じてもそれらをすべてカウントするので加法性が成り立つ。そこで連鎖地図上の距離は乗換え価である遺伝距離で表すことになった。問題は乗換え数を実験で計測することができないことである。そのため組換え価を乗換え価に変換する必要が生じて、このため地図関数map functionが工夫された。なお地図距離は染色分体あたりの平均乗り換え数であるが、キアズマは対合した相同染色体あたりで数える。したがってキアズマが乗換えと1:1に対応しているときには地図距離xでは2xのキアズマが生じると予測される。

例題 6.2.1. ごく短い区間での地図距離xと組換え価θの関係。同一染色体上に近接した2つの遺伝子座MDがあるとしよう。M座位のマーカー(対立)遺伝子をM1M2、疾患D座位の(対立)遺伝子をDdとする。M1M1DD×M2M2ddに由来するF1(M1M2Dd)の卵母細胞での減数分裂を考えてみよう。M-D区間が小さいから、この区間で2回以上の乗換えが生じることは無視できる。この区間の遺伝距離をxとする。これは減数分裂で相同染色体を構成する2本の姉妹染色分体の任意の1本で乗換えが生じる確率がxであることを意味する。換言すれば減数分裂で相同染色体に乗換えが生じる確率が2xである。そうすると1-2xは乗換えを起こさない確率である。減数分裂で生じる4種類の配偶子のうち乗換え型M1DM2d と非乗換え型M1d M2Dの割合はそれぞれ(2x)/4 : (2x)/4(2x)/4+(1-2x)/2 : (2x)/4+(1-2x)/2となる。その結果は表6.2.1.1.で示した。一方組換え価をθとすると、F1個体M1D/ M2dから生じる配偶子における組換え型M1DM2d と組換え型M1d M2Dの割合はそれぞれθ/2 :θ/2(1-θ)/2 : (1-θ)/2となる。

 この両者を比べることにより 

                        x=θ 

が得られる。この関係は多重乗換えが起こるような大きさの区間では成立しない。 

     表6.2.1.1. M-D区間で多重乗換えが起きないときの乗換え頻度と組換え              

         配偶子のハプロタイプ   M1D     M1d    M2D    M2d                          

             乗換え頻度            (1-x)/2    x/2    x/2   (1-x)/2

           組換え価                  (1-θ)/2   θ/2    θ/2   (1-θ)/2                       

 

6.2.1.1. ホールデンの地図関数Haldane’Map function

 Trowの公式を再掲する。 

                θAB=θAC+θCB-2θACθCB 

 この公式は次のように書き改めることができる。 

            1-2θAB=1-2θAC2θCB+4θACθCB

                                    =(1-2θAC)( 1-2θCB

ここで両辺の(自然)対数をとると、ln(1-2θ)について加法性が成り立つことがわかる。 

                x=k ln (1-2θ)     kは定数 

とおくと 

                xAB=xAC+xCB 

xが地図距離であるためには、θ→0のとき、θ≒xであることが必要十分である。すなわち 

                x=k ln (1-2θ)-2kθ   (θ→0) 

であるから k=-1/2でなければならない。 すなわち 

                x=-(1/2) ln (1-2θ)         Haldane(1919) 

これをホールデンの地図関数という。この逆関数は 

                θ=(1/2){1-exp(-2x)} 

と解析的に表せる。θの分散はθ(1-θ)/{n(1-2θ)2}である。ここにnは個体数である。

例題6.2.1.1. ホールデンの地図関数の別の導き方@:乗換えが染色体上でまれに無作為に生じるとしてポアソン確率で記述する。ポアソン分布の平均値を染色体のAB区間あたりで乗換え数2xとすると、1回も乗り換えの生じない確率はe-2xで表すことができる。このときの組換え率はθ=0である。すくなくとも1回以上乗換えがある確率は(1- e-2x)で組換え価の最大値は1/2であるから、組み換え価はθ=(1/2){1-exp(-2x)}となる。

例題6.2.1.2. ホールデンの地図関数の別の導き方A:乗換えが染色体単位xで生じるとみなして組換え型の染色体が生じる確率を計算する。すなわち、組換え価は奇数回の乗換えが起きた時の累積確率として地図関数を求める方法がある。AB区間で乗換えはポアソン確率で記述するなら

θ=1-e-xx/1!+x3/3!+x5/5!+…= e-x1+x2/2!+x4/4!+x6/6!+…= e-xsinh(x)= e-x{(ex-e-x)/2}={(1-e2x)/2が得られる。これは数学的にはよいかもしれないが、生物学的モデルとしては妥当でない。実際に乗換えは染色分体あたりに生じるし、また偶数回の乗換えでも組換えの起きることがある。

 

 ホールデンの地図関数は組換えと乗換えについて観察される事柄から予測できるいくつかの条件を説明できる。

 @) 乗換え率xが十分小さいと、近似的にx=θ(組換え価)である。

 A) xが増加するとθは単調増加する。

 B) x→∞ならば、θ→1/2である。

 ホールデンの地図関数は多重乗換えの場合も配慮している。しかし乗換えは各亜区間で互いに独立であり、また干渉はないとしている。また乗換えの生じる確率をポアソン分布で記述している。実際のデータに合わない例も多いという(Lalouel 1977)。 しかしモデリングが簡明で計算が容易であるため、しばしば用いられている。

 

6.2.1.2.  コサンビの地図関数Kosambis Map Function

 3つの遺伝子座がACBの順に染色体上にあるとし、ACCBABの各区間の組換え価をそれぞれθ1、θ2、θ12とする。AC区間とCB区間の組換えが独立に生じるなら、θ12=θ1θ2となる。正の干渉があると、二重組換え価は隣接する2区間の組換え価の積より小さくなる:θ12<θ1θ2となる。

そこで一致係数coefficient of coincidence 

                        C=θ12/(θ1θ2

を定義して干渉の強さを表す(Muller 1916)。 乗換えで干渉がなければC=1、正の干渉があればC<1となる。バクテリアなどでは不の干渉(C>1)も見つかっている。

 最初に述べたAB区間での組換え価θ1+2AC区間で組換えが生じ、かつCBで生じない、あるいはAC区間で組換えが生じないが、かつCBで生じることであるから、 

                   θ1+2=(θ1-θ2)+(θ2-θ12)

                                          =θ1+θ2-2θ12

                      =θ1+θ2-2Cθθ 

隣接2区間で組換えが独立に生じるなら、C=1Trowの公式と一致する。Cは一定でなく、対象とする染色体区間によって相違があることが知られている。

 ここでホールデンの地図関数を一般化したものを考えてみよう。組換え価θを乗換え頻度xの関数と仮定する。CB区間がごく微小であるとすると、θ1=θ(x)、θ2=刄ニ、θ1+2=θ(x+x)と表すことができる。このような状況では刄ニ≒xが成り立つ。

 このとき次の関係式が成り立つ。 

                θ(x+x)=θ(x)+x-2Cm(θ)θ(x)

ここでCm(θ)はホールデンの周辺一致係数marginal coincidenceと云い、ごく微小な区間に隣接した有限区間でその組換え価θである区間について定義される周辺一致係数である。

 ここでx0に近づけた極限状態を考えると 

                   lim (θ/x)=lim{(x+x)-(x)}/x=1-2Cm(θ)θ 

すなわち 

                dx /dθ=1/{1-2Cm(θ)θ

積分して次の地図関数が得られる。 

                     x(θ)=1/{1-2Cm(θ)θ}dθ 

ここで積分範囲は(0、θ)である。ここでCm(θ){Cm(x)}は区間の地図距離に比例してxと共に単調に増加する。非常に長い区間ではθ=0.5と独立の場合に相当してCm(θ=0.5)=1となり、一方非常に短い区間ではθ→0で、干渉は強くなりCm(θ→0.5)=0となる。そこで干渉の強さをCm(θ)= (2θ)kで表したときの地図関数を調べてみよう。このときの地図関数を一括してコサンビの一般化地図関数Generalized Kosambi’s Map Functionと呼ぶことにする。これはパラメータkの取り方で文献にみられる4種類の地図関数がこの一般化関数の特別の場合として扱うことができるからであり、この積分表示はコサンビ(Kosambi 1944)に負う。

          Cm(θ)=0:    x=θ                              モルガンの地図関数(Morgan 1912)

k=0Cm(θ)=1:    x=-(1/2)ln(1-2θ)              ホールデンの地図関数(Haldane 1919)

k=1 Cm(θ)=2θ:    x=(1/4)ln{(1+2r)/(1-2r)}     コサンビの地図関数(Kosambi 1944)

k=3 Cm(θ)=(2θ)3: x=(1/4)tanh-1(2r)+2tan-1(2r)  カーター・フォークナーの地図関数

                                                                     (Carter & Falconer 1951)

任意の整数kについて偶数と奇数の別々について解析解が求められている。またabcを整数としてk=a+(b/c)についても解析的な解が得られるが、いずれも干渉の強さを2θの有理数べき乗で表すことの生物学的解釈がデータに適合するか否かであるので、これは単に数学的モデルに過ぎない(Yasuda 1996) 

例題6.2.1.2.1. 干渉の強さをCm(θ)=2θで表すと、 dx/dθ=1/(1-4θ2)=1/(1-2θ)+1/(1+2θ)

区間(0、θ)について定積分すると 

                 x=(1/4)ln{(1+2θ)/ (1-2θ)}

                                     θ=(1/2){(e2x-e-2x)/( e2x+e-2x)} =(1/2)tanh(2x) 

となる。これをコサンビの地図関数といい、xの分散はθ(1-θ)/{n(1-4θ2) 2}となる。ここにnは調査個体数である。コサンビ地図関数の加法性は次の通りである。 

θ1+2=(1/2)tanh(2x1+2)=(1/2)tanh(2x1+2x2)

={(1/2t)anh(2x1)+(1/2)tanh(2x2)}/{1+ anh(2x1)+(1/2)tanh(2x2)}=(θ1+θ2)/(1+4θ1θ2) 

 コサンビ地図関数が成立するときは 

           θ12=(θ1+θ2-θ1+2)/2={θ1+2(1+4θ1θ2)-θ1+2}/2=2θ1θ2θ1+2 

となる。ここで 

                K=C(2θ1+2)=θ12/(2θ1θ2θ1+2

を定義して、これをコサンビ係数Kosambi coefficientと言い、乗換え干渉の強さを表す指数である(Owen 1950)。たとえばK=1のとき、コサンビレベルの干渉が作用しているという。

 コサンビの地図関数は多重乗り換えと干渉の両方に配慮している。経験的にはデータへの適合がホールデンの地図関数より良い(Lalouel 1977)のでよく使用、特にヒトで用いられている。

例題6.2.1.2.2. 乗換えの干渉の比較的強いマウスのデータにカーター・フォークナーの地図関数がよく適合する(Carter & Falconer 1951)

例題6.2.1.2.3. コサンビ係数Kは組換え価の観測値から推定することができる。実験生物では3点マーカーで戻し交配backcrossの子ども達から求めることができる。組換え価と距離の関係は4点、さらには多点マーカーを利用する(詳細についてはBaily 1961Owen 1953を参照)。これにより地図距離と干渉の関数関係を調べることができる。

例題6.2.1.2.4. スツルトの地図関数は染色体の長さを考慮にいれ、必ず1回の乗換えが生じるとして求めた地図関数である。必須の乗換え以外の乗換えが起きる確率が平均2L-1のポアソン分布に従い、乗換え点の位置の分布は染色体の長さに沿って一様分布をするものとする。すると、地図関数は 

             θ=(1/2){1-(1-(x/L)exp{-x(2L-1)/L}} 

となる(Sturt 1976)。 この式でL=1/2とすると、θ=x、またx0のときθ→x(θ≒x)である。さらにLが十分長く、x/L1/L1に比べて無視できるときはホールデンの地図関数で表すことができる。 

 

6.2.1.3. 経験的な地図関数

例題6.2.1.3.1. ラオの一般化地図関数は、 (干渉の強さを表す) 助変数pを用いて、いくつかの関数形が分かった地図関数を包含した(Rao 1977)

x=(1/6){p(2p-1)(1-4p)ln(1-2θ)+16pp-1)(2p-1tan-1(2θ)+4p(1-p)(1+2p)tanh-1(2θ)

+6(1-p)(1-2p)(1-4p)θ}

   p=1   ⇒ ホールデンの地図関数                                    

   p=1/2 ⇒ コサンビの地図関数

   p=1/4 ⇒ カーター・フォークナーの地図関数

   p=0   ⇒ 完全干渉の地図関数

逆関数は数値的に求めることになる。

例題6.2.1.3.2. ラロエルは組換え価と地図関数の関数関係を解析的に表すことをしないで、ガットマンGuttmaqn(1968)のノンパラメトリック多次元尺度解析法を用いて地図距離を求める方法を開発した(Lalouel 1977)。キイロショウジョウバエの第3染色体についての実験データに適用して、組換え価と地図距離との関係を示す2次元グラフを描いた。そのグラフ上の点をラオの一般化地図関数に当てはめたところ、干渉の強さをあらわすp値は0.56であった。ホールデンよりコサンビ地図関数の方が適合がよいという。

 

 

6.2.2. 連鎖不平衡 (配偶子不平衡)

3.6節で述べた連鎖不平衡が関連の一原因のとして取り上げられており、その強さを測るパラメータが二つあるが、どちらも一つのパラメータDであらわされる。

@2座位それぞれに対立遺伝子Aa、およびBbがあるとする。このときはプロタイプABD

            DAB=PAB-ApB 

である。ここにPABはハプロタイプABの頻度、pAは第1座位での対立遺伝子Aの頻度、pBは第2座位での対立遺伝子Bの頻度である。これは共分散の形である。

 A一方、考えられる4種類の配偶子(xABxAbxaBxab)Dを表すと(読者は確かめてみよ!)、 

             DAB= xABxab- xAbxaB、            

ここでpA=xAB+xAbpa=xaB+xab、pB=xAB+xaBpb=xAb+xabxAB+xAb+xaB+xab=1である。

DAB値の2倍は統計学でいう二重ヘテロにおける相引と相反の遺伝子型頻度の差となっている。

例題6.2.2.1. 2座位はプロタイプで各座位に2対立遺伝子の場合ではDAB=-DAb=-DaB=Dab

例題6.2.2.2. DAB=0のとき連鎖平衡linkage equilibriumという。これはAB座位のそれぞれの対立遺伝子頻度が他の座位の対立遺伝子頻度に依存しないことを意味する一方、相引、相反の遺伝子型頻度が等しくなることを意味する。

例題6.2.2.3.連鎖不平衡は相関係数の自乗(決定係数coefficient of determination)で表せる。

 r2= DAB 2/ pA(1-pA)(pB(1-pB)

例題6.2.2.4. maxDAB=minpA(1-pA)(pB(1-pB))minDABmax{-pApB-(1-pA)(pB(1-pB) }とすれば、D’=D/ maxDAB  ( -1D’≦1)D’=±1のとき連鎖不平衡は完全perfectであるという。xABxab=0xAbxaB0あるいはxABxab0xAbxaB=0ならば連鎖不平衡は完全である。完全でない連鎖不平衡を完全でないと呼ぶことにする。

例題6.2.2.5. 特定のマーカー遺伝子が疾患と関連することを表す条件付き確率δAがある。

δA=pA+DAB/pA (Bengtsson & Thomson 1981) 

連鎖不平衡を利用して疾患遺伝子のマッピングができることがある。染色体上に突然変異遺伝子Mが現れたときの最初の頻度はpM=1/(2N)である。ここにNは集団の実際の大きさである。それまで正常遺伝子ホモで密に連鎖したマーカーと連鎖平衡にあった所へ、新しいハプロタイプが出現して完全な連鎖不平衡が生じる(3種類のハプロタイプから成る)。この状態は長く続き、組み換えが生じて完全でない連鎖平衡の(4種類のハプロタイプから成る)状態が続く。すなわち新しく生じた突然変異遺伝子のあるハプロタイプは十分多くの世代(時間)に亘って完全な連鎖不平衡を存続し、さらには完全に近い不平衡の世代を継続する。単一遺伝子疾患と密に連鎖したまれなマーカー遺伝子との完全な(あるいは完全に近い)強い連鎖不平衡が見つかれば、マーカーの地図位置からその疾患遺伝子の地図にマップされよう。これを連鎖不平衡マッピングLD mappingという。フィンランドで優性突然変異によるdiastrophic dysplasiaはこの仮説により5q31-5q34の位置にマップされた(Hastbacka 1992)

この考えは複合疾患complex diseasesの関連解析にも適用できる。密に連鎖した多型である塩基対SNP’sは互いに強い連鎖不平衡LDを示す。ヒトのLDのきめ細かい調査により、殆どすべてのSNP’sが強いLDを示すハプロタイプ塊haplotype block’s(International HapMap Consortium 2007)でヒトゲノムが構成されていることが分かった。高レベルLDを示すハプロタイプ塊のSNP’sが遺伝性複合疾患のリスクを高めていると考えてもよいのであろう。多くのSNP’sの有効な調査法の開発に伴い、この考えで最近全ゲノム領域関連GWA調査が乳がん、大腸がん、2型糖尿病、心疾患などで有意なSNP’sを検出している。しかし、連鎖不平衡は未確認の集団の分割構造などでも生じているかもしれないという重大な懸念がある(Pritchard JK & Donnelly 2001)。またGAW調査は原因遺伝子として比較的頻度の高い頻度を示す対立遺伝子に対して効果的であるため、問題の疾患原因遺伝子のごく一部を検出しているに過ぎない(Easton 2007)。頻度の低い原因遺伝子を探索する方法の開発が残されている。

連鎖不平衡への自然選択の効果はゲノムのごくわずかな座位でみられるにすぎないが、集団の細分化、集団の大きさの変化や集団間の個体の交換はゲノム全体にその影響を及ぼす。したがって、集団の大きさや遺伝子交換の歴史を知ることでゲノム全体の連鎖不平衡パターンを理解することができよう。違う遺伝子頻度の亜集団が互いに混ざると、連鎖不平衡が生じる(Nei & Li 1973)。極端なモデルでその効果は明らかである。十分世代を経た(連鎖平衡の)ある亜集団で密に連鎖した2つの座位が固定しており、その対立遺伝子がそれぞれABで、別の亜集団ではabが固定しているとしよう。この2集団が混ざれば、子の世代にはABab2種類のハプロタイプしか存在しない。すなわち完全連鎖不平衡(|D’|=1)の状態である。(まれに組換えが生じるかもしれないが、子どもの集団に高だか3種類のハプロタイプしか存在しないからやはり|D’|=1である)。これは遺伝子頻度の違う2集団が混ざったときのワールンド効果Wahlund effectと同じような現象である。これは近交係数がある座位の対立遺伝子間の相関係数であるのに、連鎖不平衡は異なる座位の対立遺伝子間の相関の尺度である。亜集団間の対立遺伝子頻度の違いはどちらの場合でも共分散をさらに加えることになる。

対立遺伝子頻度の違う亜集団間を移動する個体あるいは配偶子により遺伝子の流れは、連鎖不平衡を生じる。その結果、世代毎に組換え率によって起こす連鎖不平衡の減少がかなり少なくなる(Nei & Li 1973)。亜集団間で2座位以上の遺伝子頻度の違いが選択で保たれていると、各亜集団での連鎖不平衡は存続することになろう(Li  1974)

集団の大きさの変化、特に極端に小さくなる瓶くび効果bottleneck effectが起こると、連鎖不平衡が強くなる。何度も瓶くび効果を繰り返すと、連鎖不平衡が続くことになる。少数の現代人が最初にアフリカを離れたときに瓶くび効果が起きたという人類の歴史モデルがある(Zhang EH et al 2004)。瓶くび効果が起こると、一般に一部のハプロタイプが失われ連鎖不平衡が強くなる。その後小集団の状態が続くと、遺伝的浮動の作用による連鎖不平衡が追加されることになる。いくつかのヒト集団の調査で、長い距離に亘る連鎖不平衡はヒト歴史の早期の瓶くび効果によるのだという議論がある。二つの集団を比べて長い距離に亘る連鎖不平衡の見つかった集団の方がより早い世代に瓶くび効果が生じたと考えることができる。

 

6.3. 多面発現

ある特定の遺伝子が複数の表現型を示すことがある。これを多面発現pleiotrophyという。これは配偶子不平衡と区別することが難しい。多面発現の一例として、細胞膜に影響して抗体産生を調節して細胞膜を透過する遺伝子がある。

 ABO式血液型のA対立遺伝子は弱いながら一定して胃がんや消化系の新生物と関連を示すことが知られている。これらのがんはForssman抗原を産生するが、これは抗体A と交差反応する。抗体Aを産生しないA型とAB型の人はForssman抗原で標識された細胞を認識することはあまりなく、抗体抗原反応も起こりにくい。O型は十二指腸潰瘍と関連がある。Rheumatic carditisに罹り易さはA型、B型とAB型の人で一番高く、これらの血液型では水溶性抗原は分泌できないが細胞膜上のアルコール溶性の特異的抗原を調節している。遺伝子型O/O SE/-の人はH物質を分泌するが、どうやらStreptococcus bacilli抵抗性の模様である。この病原菌に濃厚感染をするとRheumatic carditisのリスクが高くなる原因となる。

 6番染色体のHLA複合体系は外部抗原の認識を調節する遺伝子座のクラスターにある補体成分や酵素を調節するがある。これと相同な系が哺乳類にもある。HLA系と疾患の関連のあるものはABO式血液型のそれと同じほどの弱い程度であるが、ナルコレプシーのように強い関連があるものもある。

 疾患との関連の強さは相対リスクで測るのが一番良い。これは疾患の頻度(pあるいはq)に関して不変である。低リスク遺伝子型のオッズoddp/(1-p)、高リスク遺伝子型のオッズをq/(1-q)とすると、相対リスクrelative risk x 

                  x={p/(1-p)}/{q/(1-q)} = {p(1-q)}/{q(1-p)} 

 

                       表6.3.1 疾患関連の統計的方法

                        遺伝           疾患

                        マーカー        +   −                                                     

                                                 a       b

                                                 c       d

 

                相対リスク               x={(a+1/2)(d+1/2)}/{(b+1/2)(c+1/2)}        

                                                y=ln x                                     

                                                v=V(y)=1/(a+1)+1/(b+1)+1/(c+1)+1/(d+1)        

                統合した相対リスク      x=exp{((y/v))/ ((1/v))}                    

                関連の統合テスト      χ21={(y2/v)}/{(1/v)}  自由度:df=1          

                m標本間の異質性テスト χ2m-1={(y2/v)}/{(1/v)}- χ21   df=m-1      

 

               小標本での帰無仮説 E(x)=1 最尤テスト                              

                                                u=(ad-bc)/n                                

                                                k=(a+b)(c+d)(a+c)(b+d)/n3                                  

               統合した相対リスク         x=u/k                                 

               統合した関連テスト        χ21=u2/自由度=df=1                  

               m標本間の異質性テスト χ2m-1=(u2/k)} -χ21   df=m-1                

               Fisherのテスト(Fテスト)   F=(m-1) χ21/χ2m-1    df=(1, m-1)             

  6.3.1abcdはそれぞれの観測値である。この観測値のいずれかが0であると、相対リスクの推定値は求められないから、若干の偏りがあるので補正(+1/2)が必要である。関連の最尤検定は不偏で、小標本でも適用できる。相対リスクの推定には周辺観察値a+bc+da+cb+dがいずれも0でないことが要請される。

通常疾患群の遺伝要因の頻度と健常群の遺伝要因の頻度を調べて疾患関連を調査する。実際問題として対照群は症例群と人種など他の関係がある要因を付き合わせるmatchことは困難なことが多い。症例の選抜に厳密性が要請されると共に相対リスクは増加するのが通常であり、症例の選抜は調査ごとに違いを生じる。そのため相対リスクの異質性がしばしば観察されることになる。

 多面発現があると、連鎖検定は間違った結論を導くことがある。それは遺伝様式の判定に誤りがあると組換えが生じた場合をシミュレートする傾向を示すからである。通常の連鎖分析はポリジーン、文化伝達、遺伝子の異質性に配慮しないから、遺伝様式をよく間違え易い。

 疾患関連は配偶子不平衡でも説明できるが、完全混合集団に近いと組換え率0.01以上では難しいであろう。疾患関連に関してある民族内で大きく有意な値が得られたなら、それは病因の異質性による多面発現かその他は遺伝様式の誤判定を示唆する。決してマーカーと連鎖不平衡による遺伝的感受性とゆるい連鎖による証拠としてはならない。解釈を適切に行うことで、連鎖分析は疾患関連の同質性についての貴重な検定法と言える。

 

6.4.  相互作用

表現型で相互作用を示す(エピスタシス)古典的な例として、ルイス・分泌型Lewis-secretor systemがある(6.4.1.)LE型は細胞膜で吸収される水溶性抗原を調節している。唾液を調べると、ABH分泌型を調節する連鎖してない分泌型secretorとでは相互関係がない。ところが赤血球膜のABH抗原を検査をすると、ルイス抗原はABH分泌型ではLe(b)ABH非分泌型ではLe(a)であった。ルイス型とSE型は同一のムコ多糖類の特異的炭水化物に作用する酵素を調節している。これらの活性は溶液の中では独立に振舞うが、細胞膜に付着することで、抗原間で相互作用を惹起する。この系の認識はLE型とABO式血液型の抗体特異性によって決まる。赤血球膜上のルイス血液型の遺伝様式を理解する試みはABH分泌型の特異的効果がわかり、分泌型でのルイス型の主効果に注意が向けられるまで不成功に終わった。 この例でわかることは分離比分析のモデルにエピスタシスの効果を取り込む必要のないことである。

 

6.5.  年齢、性、環境による関連

実験遺伝学者は各世代の観察を一定の年齢で行うのが普通であるが、遺伝疫学ではそうではないことがしばしばである。実際には、違う年齢で観察する「同じ」形質は異なる遺伝子と環境の効果による一連の相関のある時系列的形質である。これを通常の家族類似性の経路分析で記述するには不完全である。しかし異なる年齢での相関を比較することで分かることがある。親子相関は子どもの年齢と共にしばしば大きくなり、測定形質は成人の値に収束する。同胞の類似性は年齢差とともに減少する。ふたごで最大で長子と末子で小さくなる。 同一の個体について年齢と共に測定しない限り、時系列的傾向から遺伝子と環境の作用を明らかにすることは難しいであろう。完全な近交系でも同様な傾向が観察されるから、時系列的傾向から遺伝子と環境の相互作用を明らかにすることもできない。

 遺伝子と環境の相互作用は関与する遺伝子と環境が同定できる場合に限っていえよう。原理的に言ってこれは体細胞のポリジーン形質でみられることだが、遺伝子と環境の相互作用は主遺伝子座の遺伝子型への薬品感受性に限られる。抗マラリア剤プリマキンは大部分の人に副作用はないが、グルコース6燐酸脱水素酵素の伴性座位のgpd対立遺伝子の保因者男子で溶血反応を惹起する。筋肉緩和剤サクサメチオニンは多くの患者に無害であるが、偽コリンエステラーゼ座位のまれな対立遺伝子SFRの保因者は重篤な呼吸困難に陥るかもしれない。薬品感受性の特異体質は薬理遺伝学pharmacogeneticsの領域で、これは遺伝疫学にの1分野である。

 年齢、性や疾患の関連は遺伝と環境の成分が正確に特定し得ない限り理解することが難しい。

 

6.6.  参考文献

Bailey NTJ 1961. Introducestimation of tion to the Mathematical Theory of Genetic Linkage. Oxford, Clarendon Press. Pp. 154-163 .

Bengtsson BO & Thomson C 1981. Measuring the Strength of Associations between HLA Antigens and Diseases. Tissue Antigens 18: 356-363.

Carter TC & Falconer 1951. Stocks for detecting linkage in the mouse and the theory of their design. J Genet 50: 307-323.

Easton DF et al 2007. Genome-wide Association Study Identifies Novel Brest Cancer Susceptability Loci. Nature 177: 1087-1093.

Edwards AWF 2006. The Estimation of Linkage in the Absence of Parental Phase Information. Ann Human Genet 70: 971-973.

Guttman L 1968. A General Nonparametric technique for Finding the Smallest Coordinate Space for a Configutation of Points. Psychometrika 33: 469-506.

Haldane JBS 1919. The combination of linkage values and the calculation of distances between the loci of linked factors. J Genet 8: 29-309.

Hastbacka J, la Chapelle A, Kaitila I, Sistonen P, Weaver A & Labder E 1992. Linkage Disequilibrium Mapping in Isolated Founder Populations: Diastrophic Dysplasia in Finland. Nature Genetics 2: 204-211.

International HapMap Consortium 2007. A Second Generation Human Haplotype Map over 3.1 Million SNP’s. Nature 449: 851-861.

Kosambi DD 1944. The Estimation of Map Distance from Recombination Value. Ann Eugenics. 12: 172-175.

Lalouel JM 1977. Linkage Mapping from Pair-wise Recombination Data. Heredity 38: 61-77.

Li WH 1974. Stable Linkage Disequilibrium without Epistasis in Subdivided Populations. Theor Popul Biol 6: 173-183.

Mi MP, Morton NE 1966. Blood Factor Association. Vox Sanguinis 11: 434-449.

Morgan TH 1912. Complete Linkage in the Second Chromosome of the Male Drosophila. Science 36: 719-720.

Morton NE 1956. The Detection and Estimation of Linkage between the Genes for Elliptocytosis and the Rh Blood Type. Amer J Human Genet 8: 80-96.

Muller HJ 1916The Mechanism of Crossing-over. Amer Nat 50 193-221, 284-305, 350-366, 421-434.

Nei M, Li W. Linkage Disequilibrium in Subdivided Population. Genetics 75: 213-219.

Ott J 1999. Analysis of Human Genetic Linkage 3rd ed. The Johns Hopkins University Press.  

(安田徳一、2002.ヒトゲノムの連鎖分析-疾患遺伝子の探求。講談社サイエンティフック、東京)

Owen AGR 1950. The Theory of General Recombination. Adv in Genet 3: 117-157.

Owen AGR 1953. The Analysis of Multiple Linkage Data. Heredity 7: 247-264.

Priychard JK & Donnelly 2001. Case-control Studies of Association in Structured or Admixed Populations. Ther Pop Biol 60: 227-237.

Rao DC, Morton NE, Lindsten J, Hulten M & Yee S 1977. A Mapping Function for Man. Hum Hered 27: 99-104.

Sturt E 1976. A Mapping Function for Human Chromosome. Ann Hum Genet 40: 147-163.

Trow AH 1913. Forms of replication: primary and secondary. J Genet 2: 313-324.

Yasuda N 1996. Analytical solutions of Generalized Kosambi Map Function in Integral form

 (unpublished).

Zhang WH et al. 2004. Impact of Population Structure, Effective Bottleneck Time, and Allele Frequency on Linkage Disequilibrium Maps. Proc Natl Acad Sci USA 101: 18075-18080.