基礎の遺伝疫学講座   安田 徳一 (2009/1/24)


 

7.   集団構造

集団構造population structureに関する諸問題は交配の頻度を決めるすべての要因にある。したがって、歴史家、社会学者、人口動態学者、それに人間行動に関わるあらゆる研究者に様々な問題を投じる。しかしその根本にあるのは新しい遺伝子の組み合わせを生じて、多様な遺伝子型が生じる過程を量的に明らかにすることである。

遺伝疫学と関連のあるのは2つの分野である。遺伝子頻度と遺伝子型頻度の関係と集団構造の遺伝子頻度への影響である。前者は発現という個体の表現型(疾患)の発生に関わり、後者は世代という後代での個体発現に関わるので、それらは疫学の問題として昔からいろいろと両面から検討されている。

 

7.1.親縁係数

2個体が生物学的に血縁relativeであるとは、そのうちの1個体が別個体の祖先であるか、2個体に共通祖先common ancestorがいることである。同じ両親の子ども達を同胞(きょうだい)sibssiblingsという。同胞の子ども達は「いとこ」first cousinという。その孫たちは「またいとこ」2nd cousinである。片親を同じくする子ども達は半同胞half sibsといい、その子ども達は「半いとこ」half 1st cousinという。

 血縁者間の類似性を調べる基本的な考えに同祖的identical by descentという考えがある。二つの遺伝子が同祖的であるとは、共通祖先の一遺伝子が突然変異をせずに由来することである。個体IJの親縁係数the coefficient of kinshipφIJは個体Iから無作為に選んだ遺伝子と個体Jから無作為に選んだ遺伝子が同祖的である確率である。共通祖先とIJのつなぐ経路がi=1通りあるなら、突然変異を無視して、 

                φIJ=(1/2) mi+1 

と表せる。mii番目の経路に関与する個体数で、狽ヘiについて経路の総和をとることを表す。共通祖先を経由してさらに世代を遡った共通祖先からのループもあればその経路も計算に入れる。親縁度degree of kinship kはφ=(1/2)k+1で定義する。実務において(1/2)k+1.5から(1/2)k+0.5の範囲を親縁度kで表わすと有用である(7.1.)

親縁係数は遺伝的類似度を測るのに最も有用である。一般に親縁係数は6つの恒等係数に分類することができるが、IJが近交inbredでなければ(IJも両親が血縁者でない)3つである。このときIJは正則なregular血縁者であるという。Cn(n=0,1,2)2人の正則な血縁者がn個の遺伝子が同祖的であるなら 

            7.1.1 親縁係数φと親縁度k

  親縁度k    代表値(1/2)k+1       親縁係数の範囲      代表的な血縁関係        

                   φ           (1/2)k+1.5(1/2)k+0.5                               

        0       1/2=0.5000       0.35360.7071      一卵性ふたご  

        1       1/4=0.2500       0.17680.3536      親子、きょうだい

        2       1/8=0.1250       0.08840.1768      おじ−めい、半きょうだい

        3      1/16=0.0625       0.04420.0884      いとこ first cousins

        4      1/32=0.0312       0.02210.0442      いとこ半

        5      1/64=0.0125       0.01100.0221      またいとこ second cousins

        6     1/128=0.0078       0.00550.0110      またいとこ半

        7     1/256=0.0039       0.00280.0055      third cousins

        8     1/512=0.0020       0.00140.0028      3rd cousins once removed

        9    1/1024=0.0010       0.00070.0014      4th cousins            

 

                  7.1.3. 正則な血縁者間の同祖係数(Ci)

       血縁関係                      親縁係数            同祖係数         親縁度

       (代表例)                          φ               C2    C1     C0        k          

    一卵性ふたご                                 1/2      1     0        0          0

    きょうだい                                      1/4    1/4    1/2    1/4        1

    親子                                             1/4      0      1        0          1

    二重いとこ                                     1/8    1/16   6/16  9/16       2

   祖父()−孫、おじめい、半きょうだい  1/8      0      1/2   1/2         2

   いとこ、曾祖父()−曾孫                  1/16     0      1/4   3/4        3

   いとこ半                                         1/32      0     1/8   7/8        4

   またいとこ                                      1/64      0     1/16  15/16     5

   一側性                                         (1/2)k+1   0      4φ  14φ       k

                                 C2=(1/2)mi+mj-2        

                                C1=(1/2)mi-1{1-(1/2)mj-1}

                                C0=1- C1- C2

                                φIJC2/2+C1/4 

ここに(ij)である。

少なくとも2つの遺伝経路genetic pathがあるときIJは二側性bilineal血縁者という。そうでないときは一側性unilineal血縁者という。一側性ならばC2=0である。まれな劣性ホモ接合の二側性血縁者の罹患するリスクは比較的に目立つく。同胞と二卵性ふたごはよくある二側性血縁者である(7.1.3)。優性偏差はC2で表れるから、親縁係数が同じであるにも拘わらず、同胞は親子より類似性が強いことがある。同胞はより類似した環境で育つ傾向があるから、優性分散の推定は実際上不向きである。特定の遺伝子座についての同胞は1/4は一卵性ふたご、1/2は親子、1/4は他人の血縁関係にあると解釈することができる。俗にきょうだいは他人の始まりとか、よく似ているきょうだいとかいう。同祖係数でこのような相矛盾した現象を理解することができる。

 コッターマンによれば、血縁者の遺伝子型がわかっているとき、ある個体がその遺伝子型である確率は容易に求めることができる。たとえば 

           P(aa|aa)= C2+ C1q+ C0q2

           P(Aa|Aa)= C2+ C1/2+ C0{2q(1-q)} 

ここにqは対立遺伝子aの頻度である。様々な血縁関係の二個体についてこのような条件確率を計算するリー・サックス(Li&Sacks 1954)によるITO法が開発されている。またインプリンテングの効果がある場合のモデルも最近工夫された(Dai & Weeks 2006)

 親縁係数は集団の遺伝子頻度に依存しないパラメータの一つである。遺伝子頻度と親縁係数を用いて、ある個体(発端者)について親縁度のわかった血縁者がいるとき、発端者が特定の遺伝子型である確率を求めることができる。この確率は遺伝相談genetic counselingでのリスク推定に活用されている(Murphy & Chase 1975)

 

7.2 近交係数

前章で両親が血縁関係であればその子どもは近交inbredであるとした。進化学的にいうと一つの生物種の全構成員は「血縁」であるから、この言い方は逆説的だともいえよう。近交についての考えをより精確にする必要があるが、その中でもハーディ・ワインベルグの法則で表わされる遺伝子型頻度が近交によりどのようになるかは特に関心がある。親縁係数は確率で定義されたが、近交係数coefficient of inbreeding Fは、2つの対立遺伝子Aaの効果をそれぞれa1a2、頻度をそれぞれpqとすると、結合する配偶子間の相関係数rとしても定義されている(Wright 1922)。相関係数は[-1,1]の範囲の値を取ることに留意されたい。

 結合する配偶子が同じで正の相関があれば生じるホモ接合の頻度はハーディ・ワインベルグ法則から期待される頻度より高くなる。頻度の合計は一定であるから、その高くなった分だけヘテロ接合の頻度は下がる。負の相関があれば逆のことが起こる。ここで遺伝子型頻度の変化を生じる割合を近交係数Fと遺伝子頻度に比例する量pqFで表わす。ここで遺伝子効果の相関係数rFに等しいことを示しておこう。表7.2.1は結合する配偶子間の相関表で、これからr=Fであることは容易に分かる。

例題7.2. 遺伝子座の平均効果は(1-q)[A]+q[a]、効果の分散は([A][a])2q(1-q)、共分散が

([A][a])2q(1-q)Fであることから、相関係数rFとなる。 

 したがって

                           P(AA)=(1-q)2(1-F)+pqF

                           P(Aa)=2q(1-q)(1-F)

                           P(aa)=q2(1-F)+pqF 

                     7.2.1 結合する配偶子間の相関表

              卵子\精子       効果[A]          効果[a]                      

                効果[A]    (1-q)2+(1-q)qF      (1-q)qF         1-q

                効果[a]       q(1-q)F         q2+q(1-q)F         q                

                                1-q                    q              1

 

相関が0ならば、遺伝子型頻度はハーディ・ワインベルグ法則の期待値と一致する。したがって、Fの値は 

                  P(Aa)0 から F1

                  P(aa)P(AA)0 からそれぞれ F>-q/(1-q)-(1-q)/q 

の範囲をとる。周知のように確率は[0,1]、相関係数は[-1,1]の範囲の値をそれぞれとり得る。Fの値は負であることもありうるが、確率としての定義はむしろ特別の場合になる。集団構造のモデルはいろいろと考えられるが、遺伝子型頻度が負とならないモデルを取り上げることにする。そのいずれのモデルも遺伝子型頻度が上に示した形で表わすことができるのは驚異的であるが大変有用でもある。したがって、集団遺伝学で遺伝子型頻度あるいは交配頻度に関する諸問題は遺伝子頻度と近交係数で記述することができる。

 現実的なモデルとして一集団がいくつかの部分集団で構成されているとし、それぞれの相対的な大きさwk、近交係数がFkであるとする。このとき 

                     α=wkFk 

を集団(平均)近交係数mean inbreeding coefficientという。

 メンデルの交雑実験では遺伝子頻度が世代に亘って一定であるので、完全混合からの偏りは血縁者間の交配のみにその原因がある。これはFについてライトの家系genealogicalモデルに相当して、このときFは負値をとらない(0F1)。事実、このF値は片親から無作為に取り出した対立遺伝子ともう一方の片親から無作為に取り出した対立遺伝子とが同祖的である確率でもある。したがって子どもの近交係数はその両親の親縁係数に相当する。詳しくは、両親をIJとして減数分裂での突然変異率μを考慮するとF=(1-μ)2φIJとなる。進化の場合では十分長い世代を考慮しなければならないときには突然変異は無視できないが、遺伝疫学のように比較的短い世代についての問題を扱うときは突然変異を無視しても差し支えない。

 ワールンドの分割モデルpartition model (抽象的な意味である。具体的には地理的、社会的なんでもよい。後述するライトの階層モデルもこのモデルの一例である)ではある集団が分割されて各グループ内で完全混合であるときのF 

               F=V/{q(1-q)} 

で表わされる。ここで分子はグループ間での遺伝子頻度の分散、qは隔壁がないとした時の集団全体の遺伝子頻度を表わす。ここでq(1-q)=max Vであるから、0F1である。したがってFは確率として考えることができる。

 ライトの階層モデルheirarchial modelはダーウィンの進化樹に類似する。たとえばある集団を地理的な階層について調査をするとしよう。例えば、最小の地区S、いくつかの地区の集合R、それに全体Tとしよう。階層はいくつあってもよい。地区Sでの個体の近交係数FIS、地区の集合Rに対する地区Sでの親縁係数FSR、全体Tに対する地区の集合Rの親縁係数をFRTとする。経路分析とその後の分散分析でライトはTに対する個体の近交係数が次のように表わせることを示した。 

             1-FIT=(1-FIS)( 1-FSR)( 1-FRT)

                     FIT=1-(1-FIS)( 1-FSR)( 1-FRT)

これから

              FIT= FIS+(1-FIS) FST 

ここで FST= FSR+(1-FSR)FRTである。

このモデルでFISは相関係数として負の値もとり得る。FSRFRTは標準化した分散成分で非負である。FSRSで無作為に選抜した対立遺伝子がRから無作為選抜の対立遺伝子と同祖的である確率を表わしている。Fが確率であれば、最後の式は各階層における1-Fの独立事象の入れ子になっている。

 マレコーの地理モデルisolation model by distanceSの分布が地理的距離で測れる状況に適用される。これまでに述べたモデルは離散型であるが、これは連続型である。理論的には任意の次元についてのモデルが提唱されているが、データが得られ、検定が可能なのは一次元の場合である。すなわち親縁係数が距離の関数として表わされる(Malecot 1955;1975)。そのうち個体の移動が1次元的のときにはφ(d) =φ(0)exp{-(2μ/σ)2d}と指数関数で表される。ここでμは突然変異率、σ2は個体の比較的短い距離dの移動のばらつきを表す分散である。φ(0)は非常に近い(単位)距離あたりの2個体間の親縁係数である。

例題7.2.1. ブラジルの東北地方の血液型、酵素多型などの遺伝子頻度から2個体間の相関係数rIJを計算して、上述のマレコーの式で集団構造を記述することを試みた(Yasuda & Morton 1967) 経験式としてrIJ(d)=ae-bd を取り上げた。ここにa=FSTに相当し、bは距離による相関係数の減少率として予測した。データから最小自乗法でパラメータの推定値を求めたところ、ほぼ10kmあたりからrIJ(d)は負値をとり、ある値(-L)に落ち着くことが分かった。その後モートン等のデータでも同様な結果が得られた(Morton 1982)

 そこでモートンは次の公式を工夫した: rIJ(d)=(1-L) ae-bd+L  (Morton 1973)。すなわち、rIJ(0)=a (1-L)+L。またφ() =0(1-L)φR+Lと解釈すると、φR =-L/(1-L)と表される。Lはデータを図にプロットすることで求められる。また、φRは集団から2個体を無作為に選んだときの親縁係数である。後述するが、このモデルは遺伝子頻度、姓氏などのデータで検討されている。特に最近ではこのモデルを用いて疾患とSNPsの関連を測る工夫がなされている(Morton 1982;Morton 2001) 

  これまで近交係数の定義は遺伝子頻度から独立であるとして考えてきたが、実際に近交係数は遺伝子頻度から求めることになる。特定の地域で求めた Sでの遺伝子頻度がqSならば、aaホモ接合の期待頻度はパラメータFISを用いて 

            E{P(aa)}=qs2+qs(1-qs)FIS 

と表される。遺伝子頻度qRを地域Rで求めれば 

            E{P(aa)}=qR2+qR(1-qR)FIR 

で、ここにFIR= FIS+(1-FIS) FSR である。さらに、全集団について求めれば 

            E{P(aa)}=qT2+qT(1-qT)FIT 

となる。完全混合で予測されるホモ接合の頻度からの偏りでFの値を推定するやり方をバイオアッセイbioassayという。

 統計遺伝学では近交係数の関数である近縁係数rIJが用いられる。k番目の対立遺伝子の相加効果をxk、優性効果がないとすると、遺伝子型値間の相関係数は次のように表わすことができる。 

            rIJ=2φIJ/{(1+FI)(1+FJ)} 

ヒトではFは小さいのが普通であるから 

            rIJ2φIJ 

と近似できることが多い。

 

 

7.2.1. 固定指数、分化係数

 Fの値が遺伝子頻度に依存するらしいことはヘテロ接合の観測頻度P(Aa)=2q(1-q)(1-F)

から 

          F={2q(1-q)- P(Aa)}/{ 2q(1-q)} 

を用いて求めることから考えられる。ここで2q(1-q)は完全混合のときのヘテロ接合の頻度(h)であり、P(Aa)は集団のヘテロ接合の観測頻度(h0)であるから 

          F=(h-h0)/h 

と表わすことができる。これはh0>hならばF>0h0<hならばF<0であることを示している。近親交配があるとヘテロ接合の観察頻度は減少してF>0となる。

 一つの集団がいくつかの分集団で構成されていて、各分集団内で完全混合が成り立つとする。分集団内でのAAAaaa遺伝子型の頻度はそれぞれ(1-qi)22qi (1-qi)qi2であるから、集団全体でのそれぞれの遺伝子型頻度は 

        P(AA)=wi(1-qi)2=(1-q)2+V     =(1-q)2+q(1-q)F

             P(Aa)=wi 2qi (1-qi)=2q(1-q)-2V =2q(1-q)F

             P(AA)=wi qi2=q2+V           =q2+q(1-q)F 

と表わすことができる。ここに狽ヘ各分集団の大きさの相対的割合wiで重みをつけた合計をあらわし、qVはそれぞれ集団全体の対立遺伝子aの頻度と分集団間の分散である。分集団の大きさは分からないのが普通で、ここで分割の効果が遺伝子型頻度にみられることが重要な点である。F=V/{q(1-q)}をライトの固定指数fixation indexという。分集団のa対立遺伝子頻度がすべて同じなら、V=0となるからF=0、すなわち集団は完全混合の状態になる。またすべての分集団がAAaaのいずれかのホモ接合になった状態(固定)ではV=p(1-p)となるから、F=1である。このとき対立遺伝子は固定fixationあるいは消失lossしたという。

 HLA座位やマイクロサテライトのように1座位に2つ以上の複対立遺伝子(Ai)が存在する場合はFの代わりにGであらわす(Nei 1977) 

         P(AiAi)=pi2+Vii    = (1-Gii)pi2+Giipi

         P(AiAj)=2pi pj +2Vij =2(1-Gij)pipj 

ここでViiは対立遺伝子(Ai)の頻度の分集団間の分散、VijAiAj の頻度の共分散を表わしている。また 

             Gii=Vii/{pi(1-pi)}

             Gij=Vij{/pipj

である。分集団間で分化が無作為に起きているならGii=Gijであることが期待されるから、分集団間で対立遺伝子頻度が無作為に分化したかどうかは、帰無仮説: Gii=Gij=Fで調べることができる。

 根井(1977)は結合する配偶子間の相関という考えを用いずに固定指数を階層レベルについてのヘテロ接合性を用いて1-FIT=(1-FIS)(1-FST) の関係が系統関係、移住パターン、対立遺伝子数、自然選択の有無に関係なく成立することを示した。この考えでは、固定指数FISFSTFIT3種類のヘテロ接合性、集団内へテロ接合性の観察値(h0)、集団内へテロ接合性の期待値(hs)と全体のヘテロ接合性の期待値(hT)の期待値で定義される。これから 

    FIS=(hs-h0)/hs、  FIT=(hT-h0)/hT、   FST=(hT-hs)/hT 

が得られる(Nei 1987)

  ここでもしFITが高い値をとると、FISFITが負になることもある。ただしhT>hsであるので、常にFST0である。このFSTは複対立遺伝子のとき、遺伝子分化係数coefficient of gene differentiationと呼び、GSTで表わす。根井の固定指数は遺伝子頻度と遺伝子型頻度で定義されているもので、ライトの結合する配偶子間の相関とは一線を画する。自然選択の有無に拘わらずどのような状況にも適用する。FST(GST)は分集団の遺伝的分化の程度を測る量なので、生物種の保全などの問題を扱う際に重要である(Frankham R, Ballou JD & Briscoe DA  2002)

 

 

7.3 遺伝的荷重

 まれな劣性遺伝子は選択と再帰突然変異のバランスで集団に保有されている。表7.3.1 に、そのときの遺伝子型頻度とその非罹患者確率としてホモ接合1-s、ヘテロ接合1-hsを示したモデルを掲げた。ここでqは劣性遺伝子頻度を表わす。 

                        7.3.1. 突然変異荷重                                    

        遺伝子型          GG                    Gg             gg                   

       非罹患確率          1                    1-hs           1-s

        頻度        (1-q)2(1-F)+(1-q)F   2q(1-q)(1-F)    q2(1-F)+qF                

           集団での非罹患者の頻度は 1-qFs-q2(1-F)s-2q(1-q)(1-F)shである。ここにqFsは近交によるホモ接合による罹患者の割合、q2(1-F)sは近交によらないホモ接合による罹患者の割合、そして2q(1-q)(1-F)shはヘテロ接合性による罹患者の割合である。さらに遺伝とは独立にある環境因子による罹患(表現模写)の割合xをとすると、非罹患者である確率S 

                    S=Π(1-x){ 1-qFs-q2(1-F)s-2q(1-q)(1-F)sh }

e-(A+BF) 

ここで A=x+q2s+2q(1-q)shB=qs-q2s-2q(1-q)sh である。

Aを完全混合荷重panmictic loadBを近交荷重inbredという。qsを全荷重total loadといい、B<qs <A+Bで、配偶子あたりの致死lethal、不妊sterilおよび有害detrimental相当量equivalentである。A+BFを発現荷重expressed loadという。狽ヘ関与する座位についての合計を表わす。

 ヘテロ接合が有利なことで生じる分離荷重segregation loadでも同様な結果が得られる

(7.3.2)。この場合 A=x+{ (1-q)2si+q2sj}B=[{ (1-q) si+qsj}-{ (1-q)2si+q2sj}]である。 

 7.3.2. 突然変異荷重

        遺伝子型          GiGi                    GiGj               GjGj                       

       非罹患確率          1-si                    1                  1-sj

        頻度        (1-q)2(1-F)+(1-q)F   2q(1-q)(1-F)       q2(1-F)+qF             

 発現荷重は関与する座位間の相互作用エピスタシスがあって、非罹患確率が近交と相互作用があると 

            S= exp{-(A+BF+CF2+)} 

となる(CFに因らない定数)が、ヒトではFが小さいのでexp{-(CF2+・・・)}の項は多くの場合無視しても差し支えない。

 ABの不偏推定値を求めるには近交レベルでの環境による相違を制御する必要がある。近くの住人や同胞で他人婚は対照として適している。また集団を易罹病性などの指標として層別化するのもよい。古い文献の多くではこのような注意を前もって払っていないものがある。標本数の小さいこと、それに罹患率の定義がまちまちなことから、近交荷重 (7.3.3) には“雑音”が入る。生殖年齢までの死亡率として発現する荷重Bは当今のヒト集団でおよそ1致死相当量と罹患率から約1有害相当量である。開発途上国の集団では多くの有害相当量が致死相当量として観察される傾向にあるから、近交荷重おそらく2致死相当量/配偶子と推定される。

 

       表7.3.3ヒトの近親婚データによる遺伝的荷重の推定値*)

            データの種類   地域          A         B         A+B            

              死亡率         米国        0.161     1.734       2.056

              出生前         米国        0.130     1.032       1.162

              出産           米国        0.174     1.309       1.483

              成熟          イタリー      0.228     1.907       2.135

                              イタリー      0.213     0.918       1.131

                              フランス      0.127     2.362       2.489

                             ブラジル      0.434     0.930       1.364

                                日本        0.155     0.800       0.955

 

             有病率          米国        0.107     5.792       5.899

                                 米国        0.103     1.164       1.267

                               イタリー      0.024     2.880       2.904

                               イタリー      0.029     0.560       0.589

                               イタリー      0.047     0.879       0.926

                            スエーデン     0.082     2.020       2.102

                               フランス      0.044     2.196       2.240

                               ブラジル      0.042     0.443       0.485

*)実際の遺伝的荷重はAA+B の間と推定される。 

これら近親婚の影響のほとんどは効果の大きいmegaphenic遺伝子によることが多くの調査から分かってきた。筋ジストロフィーmuscular dystrophy、聾唖deaf mutism、重症知的障害severe mental defect、先天性奇形congenital malformationなどの近交荷重は浸透率の高い劣性遺伝子に限られる。その根拠は、分離比分析において近交の影響を受けない弧発例と主遺伝子による偶発的な単離例の混ざったもの(単発例)で、単離例の割合は近親婚率に比例しているからである。この結果は他の生物種からも予測されたことである。ヨーロッパ野牛での近交の効果、死亡率は劣性致死遺伝子の作用による。ショウジョウバエでしらべたF=1/2で測った近交荷重は70パーセントが致死染色体によるもので18パーセントが重度の有害染色体、12パーセントが軽度な有害染色体よるものであった。したがって近交荷重の88パーセントがmegaphenic遺伝子の作用である。

 F=1/2F=1で計算した致死と重度有害による近交荷重は同じであった。しかし軽度の障害による近交荷重はFとともに増加した。これは一部の障害は重複ホモ接合による相乗効果synergismによるものと考えられる。重複ホモ接合による異常ホモ接合をフェノデビエントphenodevientsという。これは近交が高いとはっきりと認識できるのであるが、進化的意義についてははっきりしていない。おそらく構成要素である遺伝子の頻度が第一義的な効果を示すのであろうが、これらが中立、有害あるいは有利なのかは分からない。経度に有害な相乗効果について、近交荷重へのこれらの寄与は、ヒトのように低いレベルの近交で求めても、小さいのではなかろうか。

 重複ホモ接合の相乗効果が自然集団の罹患率の重要な原因であるなら、近交荷重はかなりが軽度の障害によることになるが、実際はそうではない。Synthetic lethalは時折報告されるが、詳しく解析されたわずかな報告では有害遺伝子が関与したものであるが、主効果を表わす遺伝子が稀な相互作用よりも重要であるに違いない。相乗作用は事実上軽度の障害の一部にかぎられているため、小さいFで測る近交荷重のほんの一部分をせいぜい説明できるに過ぎない。

 近交荷重への相乗作用が小さいことを理由に、相互作用の研究では実りがないとされていた。あるものは5.6節で述べたポリジーンの優性とエピスタシスと同じ根拠である。そのほかに(i)適応度の重要な成分である遺伝率が通常低く、数理的にもモンテカロル法でも相当検討されたこの種の切端モデルは自然集団にはあまり関係がなさそうである。(ii)近交度の高いレベルで見つかる極端な表現型phenodevientsはヒトのように低レベルの近交では重要ではない。(B)よくある遺伝子common geneの相互作用は事実上近交荷重に影響がみられない。たとえば、重複ホモ接合のphenodevients に少なくとも一つ頻度(r)のまれな遺伝子が関与し、他のよくある遺伝子k個の頻度がQであるとする。この系の発現荷重への寄与は 

                srQk{r+(1-r)F}[Q+(-Q)F] k=A+BF+o(F2

と表わせる。ここに、A=sr2Q2kB= srQ2k-1{(1-r)Q+rk(1-Q)}である。これは1個の頻度がまれな遺伝子と選択係数sQ2kの混合荷重と近交荷重のモデルと同等となっている。(H)2個以上のまれな遺伝子があるphenodevientsは、より頻度の高い組合せに対する選択があれば、確率的に無視しできる。(D)ホモ接合の適応度が低くなると有害遺伝子は相加的になるので、有害遺伝子が集団中に存続する世代数は軽度の障害と劣性致死で同じようになる。

 これらの説明は近交荷重への相乗作用の役割はほとんど無視でき、相乗作用がほぼ混合集団でさほど重要でないことを示している。このことから、近交効果から主要な劣性遺伝子の頻度を推定することが可能である。

 完全浸透の劣性遺伝子が遺伝的荷重に寄与するモデルを取り上げよう。そのとき 

                    A*=q2    A*+B*=

であるから、近交のデータからBを推定することができる。qは平均近交係数αの集団から分離比分析で求められるが、その値は√(A*+B*α)である。QとΔ2をそれぞれqの平均と分散とし、nを関与する劣性遺伝子座の数とする。そうすると 

                   A*=n(Q2+Δ2)、  A*+B*=nQ 

であるから 

           QA*/( A*+B*)±σB/n、   n(A*+B*)2/ A*±2σB/Q 

すなわち、劣性遺伝子の平均値の最小値および関与する座位の最小数が得ることができる。表7.3.4いくつかの疾患について得られた結果を示す。

 

      表7.3.4 遺伝子型による発生率のデータからの突然変異率の推定

               混合荷重 近交荷重 選択係数 */配偶子 座位数     */座位 

    疾患                   A=q2   B=qq2     m    u×106  n(A+B)2/A   u×106    

聾唖 (米国)               .000180     .080            .68      545            36           15

先天性聾(日本)$        .000126     .0198          .69        97             6            16 

肢帯筋ジストロフィー   .000033     .008            .75        60             2            31

重度の精神障害        .000324     .192           1.00    1923          114            17

精神障害一般           .001964     .830             .75    6240          352            18

網膜変性                 .00021       .047             .15       70            10             7

網膜色素変性症        .00022      .022             .15       34              2            15

# Morton 1982aを若干変更、 *突然変異率、 $ Furusho & Yasuda 1973.  

 精神遅滞の推定値を確かめるために、IQへの近交の影響を調べた。単一座位がヘテロ接合の頻度はFの一次関数であるから、量的形質の平均値への近交の影響は座位間に相互作用がなければ線形であることが期待される。平均の回帰は-44.0±12.3であった。これを全てまれな劣性遺伝子で偏差t、座位あたりの頻度をQとしよう。分離比分析からt=-3.5、近交分析からQ=0.0025だから 

               n-b/(tQ)=335 

が得られる。表7.3.4の数値352とはオーダーの上では合っているので、近交によるIQの減少は完全にまれな劣性遺伝子によると言えよう。

 近交荷重Bの推定値は無作為標本で式S=e-(A+BF)に適合にさせて求めるのだが、罹患者からの選抜群からも推定することができる。ciを一般集団における近交係数Fiの頻度とする。Fiのグルーピングは表7.3.4に従う。平均値はα=ciFi、分散はσ2=ciFi2-α2。まれな形質でFi値が小さいと、罹患者の頻度はI=1-S=1- e-(A+BF)=A+BFiと近似できる。そうすると発端者での平均近交係数は 

             F=ciFi(A+BFi)/ci(A+BFi)

                  ={Aα+B(σ2+α2)}/I 

IFは観測値であるから、これから 

             B=I(F-α)/σ2、  A=I-Bα 

より有効な推定値はFiの発端者mi人ついての尤度から求める。対数尤度は 

             ln L={mi(A+BFi)/(A+Bα)} 

である。これからABの最尤推定値を求めることができる。

 

 

7A . 参考文献

Dai F & Weeks DE 2006. Ordered Genotypes: An Extended ITO Method and a General For Genetic Covariance. Amer J Human Genet 78: 1035-1045.

Frankham R, Ballou JD & Briscoe DA 2002. Introduction to Conservation Genetics. Sumithonian Institution. (監訳 西田睦、訳 高橋洋、山崎祐治、渡辺勝敏 「保全遺伝学」2007、文一総合出版)。

Furusho T & Yasuda N 1973. Genetic Studies of Inbreeding in Some Japanese Populations ]V. A Genetic Study of Congenital Deafness. Japanese  Journal of Human Genetics 18: 47-65.

Li CC & Sacks L 1954. The derivation of joint distribution and correlation between relatives by the use of stochastic matrices. Biometrics 10:347-360.

Li CC 1976. First course in Population Genetics. Pacific Grove, California.

Malecot G 1948. Les Mathemaiques de L’Heredite. Masson & Cie. (English Trans; Malecot G. 1969. The Mathematics of Heredity. Freeman, Cooper and Co., San Fransisco.)

Malecot G 1955. Decrease of relationship with Distance. Cold Spring Harbor Symp 22: 52-53.

Malecot G 1975 Heterozygosity and Relationship in Regularly Subdivided Populations. Theoretical Population Biology 8: 214-241.

Morton N.E(ed). 1973. Genetic Structure of Population. University Of Press of Hawaii. Honolulu.

Morton NE 1973. Isolation by Distance. Genetic Structure of Population. Pp 76-79, University Of Press of Hawaii. Honolulu.

Morton NE 1982. Estimation of Demographic Parameters from Isolation by Distance. Human Heredity 32: 37-41.

Morton NE 1982a. Outline of Genetic Epidemiology. P117. Karger.

Murphy EA & Chase GA 1975. Principles of Genetic Counseling. Chicago, Year Book Medical Publishers.

根井正利、S. クマー 2006. (根井正利監訳・改訂 大田竜也・竹崎直子共訳) 分子進化と分子系統学. 培風館、東京

Wright S. 1969. Evolution and the Genetics of Populations II. The Theory of Gene Frequencies. University of Chicago Press, Chicago.

Yasuda N 1966. Genetical Structure of North Eastern Brazil. Ph D Thesis. University of Hawaii.

Yasuda N & Morton 1967. Studies on Human Population Structure. Proceedings of the 3rd International Congress of Human Genetics. Pp. 249-265. Edited by Crow JF & Neel JV. John Hopkins Press.