基礎の遺伝疫学講座   安田 徳一 (2009/5/18)


 

7.4B  親縁係数の進化

個体はある小さな地域グループのメンバーであると同時にそれより大きな集団に属する。したがって遺伝子頻度と親縁係数は集団の定義次第によって決まる。これに伴い近交という現象は経過世代が複雑な問題ともにかかわっていることが示唆される。

 そこで何らかの単純化をせざるを得ない。最も早くから提唱されているのはWright(1940)の島模型island modelを取り上げる。集団の有効な大きさをN、遺伝子頻度の変化の要因としての突然変異と移動をまとめた線型圧linear pressuremとすると、世代の経過とともに親縁係数はある値までに変化して後、一定の値に落ち着く。これは集団遺伝学でいう世代毎に生じる遺伝子頻度の機会的変動と組織圧の相反する作用が何世代かの後にある平衡状態に落ち着く過程である。

 島集団モデルの有効な大きさは各世代の遺伝子頻度とその変動を表す分散σq2で定義される。 

              N=q(1-q)/(2σq2

いろいろな場合での数学的な結果が得られる直観的な結果として、ヒトの場合ほぼ人口の調和平均のほぼ1/3である。

 島集団での組織圧は世代あたりに予測される遺伝子頻度の変化で定義される。 

              m=E{(qt-qt-1)(Q-qt-1)} 

ここでE(qt)=(1-m)qt-1+mQである。この定義は特定の島集団の第t世代の配偶子は第t-1世代から由来するか確率が(1-m)で、その島集団以外から由来する確率がmである。そしてqは取り上げた島集団の遺伝子頻度、Qはそれ以外の島集団における遺伝子頻度で世代に関わらず一定であるとする。

 系図モデルでの第t世代の親縁係数φ(t)2つの無作為に選んだ遺伝子が同祖的である確率で表される。すなわち 

          φ(t)=(1-m)2[1/(2N)+{1-1/(2N)}φ(t-1)]     t=1, 2, … 

若干の計算から 

         φ(t)-φ(t-1)= (1-m)2t{1-1(2N)}t-1/(2N)

               (1/2N)exp[-{2m+1/(2N)}t]  

および 

         φ(t) {1/(1+4Nm)}[1- exp[-{2m+1/(2N))}t] 

が得られる。平衡状態での親縁係数は 

         φ≡φ() 1/(1+4Nm) 

であり、平衡状態までの半分の値までに到達する世代数は 

         t1/2=(ln 2)/{2m+1/(2N)}

0.6931/{2m+1/(2N)} 

  以上の結果は島モデル集団の親縁係数を記述しているが、遺伝的浮動と組織圧が毎世代一定である(複雑な)集団に近似的に適用することができよう。パラメータは集団の有効の大きさNe(移入する集団の一部を含むのでNとは異なる)と組織圧の割合me(転入者の一部を含むのでmとは異なる)との2つである。

 この結果を確かめるために、ある領域のn個の集団からn×n行列を生成する。この行列の要素pijは集団iで生まれた個体が集団jで子どもを生む確率で、pij=1である。この行列と関連のあるNiは集団の有効な大きさと組織圧miである。そうすると第t世代での集団ij間の親縁係数は 

   φij(t)=(1-mi)(1-mj)[pkjphiφhk(t-1) + pkjpki{1-φkk(t-1)}/(2Nk)] 

で表せる。このn×n行列は対称で遺伝的浮動と組織圧の平衡状態に到達する状況を表している。φij(t)の世代毎の値はφ(t){1/(1+4Nm)}[1- exp[-{2m+1/(2N))}]t]の形であり、このことからNemeを推定することができる。

 遷移確率pijは親子の対に定義すると、少なくとも片親の一方が子どもと同じ集団で生まれている場合は簡単な形であらわすことができる。この仮定でmijを集団iで生まれた男子が集団jで生まれた確率とする。そうすると、 

               mij=2pij    (ij)

                 =2pij-1  (i=j) 

である。集団の平均近交係数は 

          αi(t)= mijφij(t)=2pijφij(t)-φii(t) 

t-1世代からt世代へ増える近交係数はFk=(1/2)2tに相当することに注意すると、Fkの予測頻度はk=2t-1は親縁度とすると次のようになる。 

            pk=22t{α(t)-α(t-1) 

  t世代を含めて (t=2あるいは3までが普通)(近縁)近交を別に区別して、与えられた交配についてFc=0,1/2,…,(1/2)2tの値を取るものとする。そうすると集団iで生まれた子どもについての合計の近交係数は 

            FIT=F+(1-Fc)Fr 

ここでFrは遠縁の近交係数である。 

            Fr={αi()- αi(t)/{1-αi(t)} 

遠縁の近交係数はt+1世代以上の共通祖先による同祖確率の合計である。Fc= αi(t)と置くとFIT=αi()となる。

 これに対応する式として片親が集団iで生まれ、他方の親が集団jで生まれた場合にも当てはめられる。 

            φT=φc+(1-φc)φr 

ここでφcとφrはそれぞれ近縁と遠縁の親縁係数である。

 移動と遺伝的浮動で集団構造の記述を詳しく述べたが、このモデルの欠点を2つ指摘したい。第1は集団内で濃い近交あるいは近親婚の好みに配慮していない。第2は通常集められるデータは不完全で、推定値、時間的変化、それに調査もれなどで不確かな場合が多い。集団の大きさが仮定した頻度で安定するならば、相互交換の転入者数は同じであるとしなければならない。調査もれは推定することができるかも知れないが、移入のデータか

              7.4.1 典型的な近交パラメータ

 集団  標本数   105α α2/α   Ne     me   調和平均Ne 調和平均me

 中東        20        1524     0.76    175   0.441     34        0.282 

  隔離(対照)  31         980     0.44    864   0.177    139        0.102 

  開発国     18         176     0.49   3936   0.212    862        0.125 

 

ら親縁係数と近縁係数の予測値を確かめなければならない(7.4.1)

 家系図から近交係数の値について独立な情報を得ることができる。創始者から始めて、その後の世代の平均近交係数α(t)を式φ(t) {1/(1+4Nm)}[1- exp[-{2m+1/(2N))}]t]から求めることができる。また、一番新しい世代の親縁度を数えることができる。nkを親縁度kの数とする。それぞれは長さk+12つのループからなる。たとえば、いとこ(親縁度3)は長さk=42つのループからなる。親縁係数計算の基となる対の数をNとするなら、第t世代までの累加親縁係数は 

   φ(t)=nk(1/2)k+1/N 

確認ができないほど大きなk値について、式φ(t) {1/(1+4Nm)}[1- exp[-{2m+1/(2N)}t]]にφ(t)を適合させるようなことはしない。このモデルはデータとして対(例、夫婦)を用いればば交係数、無作為に選んだ対に適用すれば親縁係数を求めることができる。

 

7.5.親縁係数の帰納的追認

前節で家系図と移動のデータから親縁係数の予測するモデルについて述べてきたが、この帰納的追認としてbioassayによる方法がある。これは離散的表現型、量的形質、(氏族)姓氏などから親縁係数を推定するあらゆる試みが考えられる。

 最も簡単なアプローチは表現型頻度から遺伝子頻度と近交係数(θ)を同時に推定することである。対立遺伝子がm個の共優性遺伝子座でのθ=0の近傍での推定値は 

   θ=χ/{N(m-1)} 

で与えられる。ここにχ2は適合度検定のカイ二乗値、そしてNは標本の大きさである。 

         表7.5.1 交配型頻度のモデル(Yasuda 1968)

                      交配型        頻度                        

AA×AA         p4+6p4qθ

AA×Aa     4p3q+12p2q(1-2p)θ

AA×aa         2p2q2+2pq(1-6pq)θ      θ<min(q,1-q)

Aa×Aa         6p2q2+6pq(1-6pq)θ

Aa×aa         4pq3+12pq2(1-2q)θ

 aa×aa         q4+6pq3θ

表現型の判定における誤りやフェノグラムの間違いは近交係数に偏りを生じる。また標本の大きさが小さいことでも若干の偏りが生じる。

一方、配偶者単位の標本からの近交係数の情報量は配偶者個人単位より6倍になる。表7.5.1.はθ=0の近傍での近似式であるが、|θ|<min(q,1-q)なる附帯条件つきであるが、集団の島模型モデルを仮定するとφ=1-θの冪関数で表わすことができる(Yasuda 1973)のでこの付加条件は不必要となる。ここでqp=1-qは対立遺伝子aAの頻度である。

例題7.5.1. ABO式血液型. 対立遺伝子OABの頻度をそれぞれrpq (r+p+q=1)とする。表現型、遺伝子型、集団での観測値および期待値は表7.5.1.1であるとする。 

                    7.5.1.1 ABO式血液型の集団頻度

   表現型  遺伝子型  観測値      期待値                                

    O          OO         nO        N[r2+(r-r2)θ]}                           

     A        AA,AO        nA        N[p2+2pr+{p-(p2+2pr)}θ]                   

        B        BB,BO        nB        N[q2+2qr+{q-(q2+2qr)}θ]                  

        AB        AB          nAB       N[2pq-2pqθ]                              

       

集団の大きさをn=nO+nA+nB+nABであるとして、このデータについての帰無仮説H0:θ=0でのパラメータpqとθそれぞれについて対数尤度の一次微分をU(これをスコアという)で表すとである。これから[ 2Uθ|(θ=0)+pUp+qUq=0 ]が導かれる(Yasuda 1968)

 Up=    (-2/r)n0  + {2r/(p2+2pr)}nA   + {-2/(q+2r)}nB    +  (1/p)nAB

  Uq=      (-2/r)n0  + {-2/(p+2r)}nA +  {2r/(q2+2qr)}nB     + (1/p)nAB

Uθ|(θ=0)= {(1-r)/r}nO + {(q-r)/(p+2r)}nA + {(p-r)/(q+2r)}nB +  (-1)nAB

  数学的な解釈 (Edward AWF 1971参照)は省略するが、この従属性のため生物学的に意味のあるθ=0の近傍での推定値を得ることができない。ヒト集団の平均近交係数はせいぜい0.05の値であるのが普通であるが、コンピュータを走らせると、それよりはるかに大きなθの値が得られることがあるが、これは単にデータがこのモデルに合うことを示しているに過ぎない。未知の抗原を多数含むHLA白血球(ABO-like システム)でもハーデイ・ワインベルグ平衡からのずれθのUθスコアと複数の抗原の対立遺伝子頻度のUpiとの間でもこの従属性はみられる(Yasuda & Kimura 1968)

  姓氏は当然ながら遺伝とは関係ないが、父性社会での(文化)伝達はY連鎖の遺伝子の伝達をシミュレートしているので、集団構造を調べる一方法として利用できる。qkiを集団ik番目の姓氏の頻度とすると、 

            Iij=qkiqkj 

は集団ijの間のランダム同姓率random isonymyという。nkiを集団iから無作為抽出したk番目の姓氏の個体数とする。ここでNi=k nkiとすると不偏推定値は 

   Iij=k nki(nki -1)/{Ni(Ni-1)}      i=j

        =k nkinkj//{Ni(Nj)}            ij 

となる。親縁係数φの血縁者達の4φが同姓的isonymous by descentであるから、Iij/4はφijの推定値である。ただし3つのかなり厳しい条件が成立するものとする。(1)すべての姓氏は単一祖先由来monophyleticである、(2)突然変異と選択は移動にくらべて無視できる、それに(3)姓氏の伝達に関して遺伝子と同様に浮動と移動の影響を生じる。

 第一の仮定は通常お多くの姓氏、特に頻度の高い姓氏には複数の祖先があるpolyphleticから成立しない。姓氏は渡辺、渡部、渡邊、渡邉のようによく使用される字体で変化する。養子、婚姻、征服による強制、(綴りの変化)などで姓氏の伝達は不規則である。同姓率は表現型の調査は不要であるし、浮動の歴史的調査もできるが、遺伝子と姓氏が同様に伝達するという仮説は鵜呑みにしてはならない。あくまでもおよその目安である。なお、ここでいう姓氏は捨て児をなどの特別の場合を除き出生時に獲得した姓氏とする。

例題7.5  I=4φの関係。いとこ婚には4種類の亜型、兄弟、兄妹、弟姉、姉妹それぞれの子どもの組が考えられる。そこで婚姻によって、男性の姓は変わらないが女性は変わる父性社会では、子どもが(いとこ)結婚したとき、兄弟の組だけが同姓である。したがって同姓率はI=1/4である。いとこの親縁係数はφ=1/16であるから、I=4φの関係が推察される。このことは母性社会でも言えるし、また父性と母性の両方が混在する社会でも若干の修正でI=4φが言える。ただし、親子ではI=1/2、φ=1/4でこの関係は成立しない。

 

7.6. 距離による隔離 isolation by distance

マレコーは親縁係数を確率として、距離に関して次のように表わせることを示した(Malecot 1973)。距離は「隔離の度合い」を表す尺度で、具体的には配偶者、親子、二個体などの出生地(間の)距離が実際的である。二個体は信条や階級などであることも考えられるが、その尺度をどう取るかが問題であろう。 

             φijae-bd 

ここで 

      φiia=1/(1+4Neme)、       b=(2me)/σ 

である。dは集団ij間の距離、Neは局所的集団の有効な大きさ、meは有効な組織圧(移動率)、σは親子距離の標準偏差である。この結果は組織圧と浮動が平衡状態で、3つのパラメータはそれぞれの集団で一定であると仮定する。移動から求めた親縁係数から、abをそれぞれの局所集団ならびに全集団で求めることができる。実際にはこれらのパラメータは集団ごとに違い、隔離集団ではaが大きく、bは移動の少ない集団で大きい。

 表現型あるいは量的形質で親縁係数をバイオアッセイbioassayを適用する際、局所集団の遺伝子のランダム対で特に遠距離で観察される負の相関 (Morton 1971)に配慮する必要がある。すなわち 

              φ(d)=(1-L)ae-bd + L          L0 

ここでLは局所集団で十分大きい距離での相関係数である。ae-bd の平均は局所集団でのランダム親縁係数<φ>である。局所集団の遺伝子頻度での混合panmixiaに対する遺伝子頻度のランダム対の相対的親縁係数はφ(d)=0であるから、 

        <φ>= -L/(1-L)     

となる。

 同姓率から親縁係数を推定するには距離による隔離でまず補正が行なう。よくある血縁者の対が同姓である確率はi=4φである(例えば、同胞でi=1、φ=1/4、いとこでi=1/4、φ=1/16だが、親子ではi=2φ (Crow & Mange 1965)である。距離dでの同姓率は 

       I(d)=(1-L)i+L

              =4(1-L) ae-bd + L 

である。ここでは、Lは十分大きい距離で偶然にマッチする同姓率random isonymyであり、q2である。多重起原の姓氏、佐藤、鈴木や高橋は違う場所で無作為に選抜するから 

       φij=(Iij-L)/{4(1-L)}       L=q2/4 

となる。したがって無作為の多重起原の姓を含むIij/4よりは上式からの親縁係数の方がよい(少々低い値が得られる)。それでもこの推定値は局所的な多重起原の姓氏に依存している。そのような姓氏の人々が同じ局所に止まっていると仮定しているので、後者の推定値は高い方に偏る。しかし姓氏伝達の歴史は遺伝子のそれに比べてはるかに短く、これによる推定値は低い方に偏る。同姓率から求めた親縁係数を受け入れるには十分注意する必要がある(7.6.1)。個々の推定値の評価はそれぞれの集団の歴史的背景や姓氏の定義などを勘案しても、その絶対値よりもむしろ集団との相互比較する相対比の方が意味があるであろうが (Yasuda & Furusho 1971a; 1971b)

 

              7.6.1 いくつかの集団での同姓率

                     婚姻同姓率                      家系図による

  調査集団           q2/4     Im        F=(Im-q2)/4(1-q2)      F        

 白人                   0.00032      -                 -              -

 日本人                 0.00051      -                 -              -

 ハワイアン             0.00029      -                 -              -

 フイリッピン           0.00028      -                 -              -

 中国+韓国              0.00660      -                 -              -

 ハワイ住民             0.00027      -                 -              -

 19世紀イギリス         0.00026     0.0125          0.0029         0.0024

 ニューヨーク(植民地)   0.00020     0.0207          0.0050          0.0055

  19世紀オハイオ           -         0.0084          0.0019          0.0466

 オーストリア(近親婚)     -         0.1590          0.0395         0.0507

 Hutterites             0.04459     0.1951          0.0052             -

 

 局所集団の配偶者同姓率marital isonymyによるFISの推定は上記の批判に耐え得るが、2つの大きな仮定に依存している。第1に結婚前(厳密には出生時)の姓氏は正確に確認している。気をつけないと結婚後の姓氏であることがある。第2の対の無作為性について成り立つ1/4は配偶者対についても成り立つ。性に配慮した近親婚、たとえば2人の兄弟の子ども達の頻度が高いと、1/4という因子にその影響がでると思われるが、実際にはほぼ成立しているようである。これらの仮定の下で、配偶者同姓率は 

           Im=4FIS+(1-4FIS)q2 

したがって 

           FIS=(Im-q2)/ {4(1-q2)} 

ここでq2は隔離集団におけるランダム同姓率の頻度である。

 パラメータabの推定値が求められたとしても、移動についての解釈は難しい。まず、長距離と短距離の移動long-range & short range migrationの区別が恣意的である。移動者すべてからのσ2E(d2)とすると、d>4σを長距離とすることにより、その他の事実との整合性が得られる。したがって、この定義による長距離の移住者を除いた移住者から求めた標準偏差をσとする。飛び石モデルによる数学理論の多くは短距離の移動者は領域内の集団からの小人数である。d<0.10σを局所性の定義とするなら、その推定値はマレコーの近似値と一致する。 

           me≒√{m(m+2k)} 

ここでmは長距離の移動者の頻度、kは長距離の移動者を除いた短距離(d<0.10σ’)の移動者の頻度を表わす。

 多くの集団でバイオアッセイによる親縁係数を求めたところ、Neme、σの経験式として次の近似が得られた。 

       ln σ 0.60 – 0.728 ln b

          ln Ne   2.666 – 0.677 ln a

          ln me   -4.005 – 0.304 ln a 

バイオアッセイ法で求められた推定値は移動および系図から求めた推定値に比べて信頼性が低い。しかし、近過去に拡散と混合、あるいは歴史記録が不十分な集団では、一つの試みとして調べ得る集団構造を推論することは可能であろう(7.6.2, Azevedo E 1969) 

             表7.6.2 ブラジル東北地方の親縁係数の階層構造 

 領域       n        Ne           σ2            σ             α          φ(d)        φ+(1-φ)α     

 東北地方     1    7×106      4.4×106     2,100      0.0080            0          0.0080

 州               7    1×106       6.3×105       790      0.0074    0.0006          0.0080

 近隣          27   2.6×105    1.6×105         400      0.0066    0.0014          0.0080

 市郡      1,083    6,500          4,100         64      0.0051    0.0029          0.0080

 地区      2,725    2,600          1,600          40      0.0049    0.0031          0.0080

n=領域数、Ne=単位集団の有効な大きさ、σ2=距離d2乗の期待値、

α=領域内の平均近交係数、φ(d) =領域間の平均親縁係数、φ+(1-φ)α=全体の値。 

 隔離集団isolatea>0.005で定義することができるが、この定義は集団内のいくつかの領域の間で遺伝的浮動がはっきりと認知できるほどに分化した集団に該当する。隔離集団では領域内での婚姻の傾向があり、有効な転出入率も小さく、移動に地理的障害があってもあまり影響がない。このとき連続集団ではb値は大きくなるであろうが、人の住まぬ地域や大きな湖や海があるとb値は小さくなる傾向がある。隔離は地域や国家にかたまるであろうが、そのような集団構造は近隣集団に比して内部で相当の分化を生じているとみられるので、遺伝疫学の調査研究に特異的な機会となろう。

 

7.6.3 距離による隔離

  集団         データ    観察値          予測値

                                       a      b      σ’   Ne     me      Neme   

  Ethinic groups         表現型     .1582    .0008   191    49    .032      2

  Pingelap/Mokil環礁    距離       .0884    .0069    40    73    .038      3

  Bougainville集落      表現型      .0765    .1050     5    80    .040      3

  Australian原住民      表現型      .0641    .0013   134    90    .042      4

 Pingelap/Mokil環礁     移動       .0606    .0120    27    93    .043      4

 Bougainville集落       移動       .0588    .0954     6    95    .043      4

  Micronesia環礁         距離       .0569    .0016   115    97    .044      4

  Pingelap/Mokil環礁    表現型      .0565    .0069    40    98    .044      4

  Pingelap/Mokil環礁     氏族       .0540    .0111    28   101    .044      4

  Microbesia環礁        表現型      .0463    .0023    88   112    .046      5

  New Guinea環礁        表現型      .0444    .0519     9   115    .047      5

  Marshall環礁           移動       .0431    .0005   269   117    .047      6

  Makiritare集落        表現型      .0423    .0440    10   119    .048      6

  南米indian         表現型       .0379    .0032    70   128    .049      6

 Papago (localities)   表現型      .0182    .0661     8   208    .062     13

  Aland(フィンランド) 移動        .0156    .1539     4   231    .065     15

Orkney諸島(スコットランド) 表現型       .0130    .0079    36   261    .068     18

  Barra(スコットランド)    表現型       .0104    .0058    45   302    .037     22

 Barra               移動        .0076    .0284    14   373    .080     30

  スイス山岳コミューン ABO式血液型  .0069    .0643     8   397    .083     33

 Lewis              表現型       .0061    .0057    46   432    .086     37

ブラジル東北(地方)    表現型      .0050     .0064    42   493    .091     45

 Oxfordshire 村々    移動        .0048     .8620     1   506    .092     47

 Barra             同姓率      .0048     .0112    28   506    .092     47

 スェーデン(地方)     表現型       .0033     .0053    48   650    .104     67

  スイスコミューン   ABO式血液型    .0025     .0185    19   782    .113     88

  ベルギーコミューン ABO式血液型    .0009     .0247    16  1546    .154    238   

  日本()            表現型        .0006     .0064    42  2027    .174    352

  ある特定の隔離集団を理解するには、現状の遺伝子頻度を過去に生じた出来事を念頭にして考察しなければならない。問題を取り上げるのに遺伝の知識は必須であるが、その際進化過程での変化を生じる要因を明らかにすることが肝要である。それには社会学的さらには歴史学的事実を援用して解決することになるが、そのようなことはヒトやヒトに関わる生物種ごとで知ることができよう。婚姻について、グループでいかなる遺伝子の分布パターンにも起因する正確な歴史的データがあれば、起こり得る浮動の大きさを予測する数学的の計算はもはや無用であろう。歴史上の事実が観察されるパターンを完全に「解き明かす」と言えよう。

 都合のよい事例はこの処方からそれほど違うことはない。OLD Order Amishの家系図は進化以前の移動から再構成された。PingelapMokilの系図は台風で生き残った小さな創始者のグループを1775年までに遡り口承で書き上げることができた(Morton 1971)Ramah Navaho, Tristan Da Cunha, Cocos諸島などは1世紀ないし3世紀前までの家系図が再構成されかなり完全である。しかし、例外ともいえるこのような家系図ですら最初の世代の信頼性が定かで無い。

 世代が長期に及ぶと2つの限界がある。系図の確認の精度は世代を辿ると次第に悪くなる。最後には鍵となる人からの経路になるし、遺伝的に重要な歴史的な事実も省略されるようになる。アフリカの遺伝子がどのようにして1000年以上も遡れる固有の歴史を持つHabbanitesJebeliyaに入ったのであろうか?東ヨーロッパのアシュケナージ・ユダヤ人のタイ・サック病Tay-Sack diseaseや他のまれな遺伝子Fraikorは何百年もの間に集団は劇的に大きくなったり縮小したりしたからだ主張されているが、そうであろうか。Rao & Mortonはヒトの多くの劣性遺伝子のせいぜいいくつかがそのような条件から外れる場合があることを経験しているが、正確な交配のついての歴史的データには及ばない。距離による隔離はそのようなデータがないときに一つの答えを提供する(7.6.3)

例題7.6.1姓氏の研究小史。姓氏についての量的な研究はゴールトン(Galton 1889)が嚆矢である。世代の経過と共に姓氏が消失する確率を求めたのはロッカ(Lotka 1931)、その応用として突然変異遺伝子の消失確率を求める決定論的モデルによる計算がされている(Haldane 1927, Fisher 1939, Kojima & Kelleher 1962, Yasuda et al. 1974)。これらの研究はいずれも姓氏の理論分布を仮定して行われた。

  配偶者の出生時の姓氏が一致する同姓isonymyの割合についての研究はチャールス・ダーウィンの二男ジョージ・ダーウィンDarwin (1875)の近親婚の調査が最初である。当時の新聞欄でいとこ婚のうち同姓婚の割合を調べている。近交係数や親縁係数との関係を始めて定式化したのはクロー・メンジCrow & Mange (1965)で、ある隔離集団で個体の近交係数と集団の親縁係数を始めて求めてその集団構造を調べる糸口を開いた。日本においても親縁度と血縁関係の相関に注目して、親縁度と近親婚の理論的関係が導かれている(神崎 1954, Yasuda 1983)。その際、神崎は滝口のいくつかの名簿調査(滝口 1943)から日本人のランダム同姓率の値0.002を求めている。

 

7.7. まれな遺伝子の分布

適切な系図記録があれば、子孫で異常に高い頻度へ浮動した対立遺伝子の創始者(保因者)を同定できるかも知れない。理想的には先祖の一組の配偶者がその遺伝子の保因者の共通祖先で、多くの非保因者はその夫婦の子孫でない場合である。Old Order Amishの調査で、Ellis-van Creveld症候群患者80人の構成はSamuel King夫妻を共通祖先とする親とその他、頻度がわからないが非保因者からであった。

 この原則から保因者/非保因者と祖先/非祖先に関して2x2分割表を作成して統計的考察を行うことが可能である。血縁関係の存在でχ2検定の解釈が不透明になる。しかし極端な偏りは東カロリン諸島のすべての保因者が200年前の超大型台風Lengkiekiでの生残者Mwahueleから完全色盲遺伝子を継承したことには疑う余地がない(7.7.1, Hussels IE & Morton NE 1972)。 

     7.7.1 ピンゲラップ環礁とモキール環礁における完全色盲1067同胞について

                                      1067同胞に対する親縁関係         

               はい   いいえ      合計             

  保因者が見つからない      363         727          1090        

  保因者がいる                0         117           117             

                             363         844          1027        

 これは対の血縁者を用いる家系情報をまとめる近似法を極端に簡便化した方法である。マレコーの親縁係数φにのみ依存するのであり、同時同祖の複雑な尺度を必要とするものではない。この単純化は創始者と患者そのものをよりも罹患ホモ接合の両親を考慮することで得られる。親縁があり/なしと二分することで情報を犠牲にしているが、創始者(保因者)との親縁関係で回復できるかも知れない。しかしまず2x2分割表からの初歩的な証拠を得る家系分析を行った方がよい。この論理は複合遺伝あるいは遺伝が疑われる場合にも応用することができる。ピンゲラップ島のハンセン氏病の創始者が同定できなかったのは、この地のハンセン氏病の集積を遺伝感受性で説明できないことの一つとして理解できよう。20世紀初期に開鉱したNauru燐酸鉱山での接触による。

 Workmanはこのやり方を系図でなく表現型バイオアッセイや言語、文化的証拠を用いた親縁で集団間の比較をすることを示唆している。集団間の親縁と糖尿病有病率の不一致は遺伝よりも文化によるとする発見的事例を挙げている。理想的にはそのような付加的証拠はきめ細かい集団間調査が必要である。たとえば生物学的伝達と文化的伝達を分ける経路係数と主遺伝子を判別する分離比分析などである。

 空間でのまれな遺伝子の分布を調べる方法に2通りある。第1は主たる原点を一つ仮定して、散布する中心とその分散を決める。散布の原点を表す地理的座標(ef)で、座標(X,Y)を無作為に選んだ人が保因者である確率は近似的に 

          P(X,Y)=d+kC(X,Y) 

ここに 

C(X,Y)={1/(2πV)}exp[-{(X-e)2+(Y-f)2}/(2V)] 

である。発端者に対して親縁係数φのある個体を選抜したとき、その個体が保因者である確率は近似的にd+2φC(X,Y)である。保因者の割合d/(d+k)は領域内で一様分布をするが、残りは分散V=t(σ’)2の等方性正規分布である。tは拡散が始まってから経過した世代をあらわし、(σ’)2は短距離移動の分散である。限られた地域の疾患の分布、たとえばアシュケナージ・ユダヤ人のタイ・サック病、ブラジルの欠手決足症acheiropodyにこの理論は積極的に適用できよう。

 第2のアプローチは保因者の配偶者が保因者である確率が 

   P(Aa|Aa)2{q+φ(d)} 

であるモデルを用いる。そうすると配偶者距離は 

   r(d)={(Q+ae-bd)μ(d)}/(Q+φ)、   QA/B+L 

ここでμ(d)は一般集団での配偶者距離の分布、φ=買モ(d)μ(d)は平均近交係数である。ABは遺伝的荷重(混合荷重と近交荷重)である。同じ公式が患者についてランダムな対を選んだときにも適用できる。このときμ(d)はランダムな組み合わせの分布、Qは患者すべてが同じ遺伝子についてホモ接合でないときのおおきな値である。

 このモデルをスイスの色素性網膜症retinitis pigmentosaに適用すると、Qの推定値は家族症例で0.001、単離症例0.017と、単離症例がはるかに高い。この結果は分離比分析や近親婚調査から多くの単離例が非劣性でおそらく遺伝性でないことを支持している。Bは近親婚調査から、Lは親縁分析から求められるから、Qの推定値は単離例のうち非劣性の割合であり、網膜変性に関与する遺伝子座の数を求めることができる。ただし遺伝的荷重の理論とは違い、ある限界を与えているに過ぎない。

 同じ論法を対照標本として異なった疾患のランダムな組合せを用いて発端者の親のランダムな組合せにも適用できる。Qの値は筋緊張性ジストロフィー、A型血友病、B型血友病それぞれの疾患でのランダムな組合せから、平均の遺伝子頻度と矛盾しない。短い距離の対が著しく多く、これは局地的に同祖的であることを反映している。家族性の網膜変性を診断に基づいてわけて、グループ内の対についてQを推定すると、全体の遺伝子頻度より有意に低かった。したがって網膜変性に拘わる座位数は2つ以上であることと診断基準の遺伝的基礎が一部違うことはほぼ疑いない。診断基準間の親の(対の)組合せからはQ=0.73となるので、同祖的な遺伝子がほとんどないことがわかる。換言すれば、それぞれ関与する遺伝子は特徴的な診断基準に対応している様子であり、臨床分類が遺伝的にも確かである。距離による隔離は他の事実を補い、遺伝疫学でもっと広く用いられる価値が十分にある。

 

7.8. 異型交雑

異型交雑outcrossingは配偶者が互いに違う集団から由来することを表わす。その遺伝的影響には2つあろう。有害劣性遺伝子のホモ接合の頻度が低下するのは確かで、自然選択の篩いに未だに掛かっていない遺伝子型を創造するかも知れない。共適応した遺伝子型の崩壊は生物種間交雑でしばしば見られるが、雑種は親集団間の大きさ、死亡率や罹病率の中間となるが、ヒトではまだ示されていない(Morton, Chung & Mi 1967)

 異型交配の最も簡単なデータ処理は特異的なF2雑種に関する遺伝子型頻度で見られる。劣性ホモ接合が一義的な関心事である。F2における遺伝子頻度をqとすると、その親(F1)での頻度はq±Δであった筈である。局地的な完全混合を仮定すると、表7.8.1で示したようにP世代とF1世代間でのホモ接合性の相違は2Δ2=2q(1-q)αである。ここにαは親世代の平均近交係数である。PF1世代間の罹病率の相違をM、集団内の近交荷重をBとすると、 

               α=-M/(2B) 

F2雑種に関する親のグループの近交係数の推定値である。符号を変えた上式を測定値にも適用できる。それはホモ接合性の低下は罹病率の減少と大きさの増加になると予測されるからである。

                   7.8.1. 異型交雑によるホモ接合性

         世代       ホモ接合の頻度P(aa)

                                 {(q+Δ)2+(q-Δ)2}/2

          F1               (q+Δ)(q-Δ)=q2-Δ2

                   F2                q2

   この考えをハワイの180,000出生児に適用すると、主要グループの混血児と少数グループの混血児それぞれで上式のαが0.00090.0005となった。ここにコーカソイドと太平洋集団の混血児を主要な混合とみなし、これらの範疇内での民族間の混合を少数とした。どちらの推定値もが0から有意でなく、母方混合maternal hybridityと組換えの影響は見つからなかった。現状においては、ヒト集団は異型交雑で崩れる共適応の遺伝的構成を現されていない。

 罹病率や大きさから得られた小さな値のαは多型から求めた値に比べて大きい。この場合親縁係数のバイオアッセイは主な民族グループについてφRT=.15であった。明らかに多型は罹病性への異型交雑の影響にかかわるまれな劣性遺伝子よりも弱いし、より変異のある選択を受けている。多型(プラスより強い論拠となる同姓率)による親縁係数のバイオアッセイは、同質的な領域でだけまれな劣性遺伝子と関わりがあるが、進化遺伝学で関心がある民族や生物の配列のレベルではない。

 まれな劣性遺伝病を考察すると、異型交雑効果には驚くことがあろう。たとえば嚢胞性線維症cystic fibrosisの西ヨーロッパ由来の白人では0.016であるが、非白人ではわずか0.003でしかない。白人の発生率26×10-5は異型交雑で5×10-5に下がる。この選ばれた遺伝子についてのαの値は公式から0.0043である。選択されないまれな劣性遺伝子のα値はたしかにもっと小さく、ハワイの主な異型交雑についてのαの平均値は0.0009であることと整合性がある。しかしそのように小さな値が、まれな劣性遺伝子による遺伝病の発生率へ比較的大きな影響をする。その大きさはおよそ(q-α)/(q+α)で、異型交雑でと内交配とほぼ同じ程度(q2)である(7.8.1参照)

 

7.9. 参考文献

Azevedo E, Morton NE, Miki C & Yee S 1969. Distance and Kinship in Northeastern Brazil. American Journal of Human Genetics 21: 1-22.

Crow JF & Mange AP 1969. Measurements of Inbreeding from the Frequency of Marriage between Persons of the Same Surname. Eugenic Quartary 12: 199-203.

Edwards AWF 1971. Estimation of the Inbreeding Coefficient from ABO Blood-Group Phenotype Frequencies. Amer J Human Genet 23: 97-98.

Fisher 1930. The Genetical Theory of Natural Selection. Claredom Oress, Oxford.

Galton 1889. Probable Extinction of Families.  In: Appendix F of Natural Inheritance. Macmillion, New York. Pp241-248.

Haldane 1927. A Mathematical Theory of Natural and Artificial Selection. Part V. Selection and Mutaion. Proc Camb Phil. Soc. 23:838-833.

Hussels I & Morton NE 1972. Pingelap and Mokil Atolls: Achromatopsia. American Journal of Human Genetics 24: 304-309.

神崎 貢。1954. 婚姻同姓率。生物統計学雑誌。2:292-298.

Kojima K & Kelleher TM 1962. Survival of Mutant Genes. Amer Nat 96: 329-343.

Malecot G 1969. The Mathematics of Heredity. Freeman, Cooper and Co., San Francisco.

Malecot G 1973.  Isolation by Distance. In Genetic Structure of Population, Ed Morton NE. University Press of Hawaii Honolulu, Hawaii. Pp. 72-75.

Morton NE, Chung CS & Mi MP 1967. Genetics of Interracial Crosses in Hawaii. Monographs in Human Genetics. Vol 3. Karger Basel 160 pp.

Morton N.E.(ed) 1969. Genetic Structure of Population. University Press of Hawaii, Honolulu.

Morton NE, Yee S, Harris DE & Rew R 1971. Bioassay of Kinship. Theoretical Population Biology 2: 507-524.

Morton NE, Roisenberg I, Lew R & Yee S 1971. Pingelap and Mokil Atolls: Genealogy. American Journal of Human Genetics. 23: 350-360.

滝口  良景、1943. 邦人姓氏の統計学的研究。民族衛生 11:241-245.

Wright S 1040. Breeding Structure of Population in Relation to Speciation. Amer

  Nat 74: 232-248.

Yasuda N 1968. An Extension of Wahlund’s Principle To Evaluate Mating Type Frequency.          

  American Journal of Human Genetics 20:1-23.

Yasuda N 1968. Estimation of the Inbreeding Coefficient from Phenotype Frequencies by a Method of Maximum Likelihood Scoring. Biometrics 24: 915-935.

Yasuda N & Kimura M 1968. A Gene-Counting Method of Maximum Likelihood for Estimating Gene Frequencies in ABO and ABO-like Systems. Ann Human Genet, Lond 31: 409-420.

Yasuda N & Furusho N 1971a. Random and Nonrandom Inbreeding Revealed from Isonymy Study. I. Small Cities of Japan. American Journal of Human Genetics 23: 303-316.

Yasuda N & Furusho T 197b. Random and Nonrandom Inbreeding Revealed from Isonymy Study. U. A Group of Farm-Villages in Japan. Japanese Journal of Human Genetics. 15: 231-240

Yasuda N 1973. Mating Type Frequency in Term of the Gene Frequency Moments with Random Genetic Drift. In Genetic Structure of Populations. Ed Morton NE 1973. University of Hawaii Press, Honolulu. Pp60-65.

Yasuda N, Cavalli-Sforza LL, Skolbick M & Moroni A 1974. The Evolution of Surnames: An Analysis of Their Distribution and Extinction. Theor Population Biology 5:123-142.