第7回のABO式血液型の集団遺伝学の続きです。
[ABO式血液型の形式遺伝学]
最初に適切な遺伝学説を説いたのは von Dungern EとHirszfeld L 1911. Uber Vererbung gruppenspezifischer Strukturen des Blutes. Z Immun Forsch 6:284-292.であった。 4種類の表現型O, A, B,ABを説明するため、独立な二組の対立遺伝子(A,O:B,O)でA,Bをそれぞれ優性と仮定した。 Bernstein F 1925. Zusammenfassende Betrachtungen uber die erblichen Blutstrukturen des Menschen. Zeitschrift fur Induktive Abstammungsund Vererbungslehre. 37:237-270. は HW の予測値を用いて、この仮説を検討したところ、観測値と適合しないことに気付いた。 彼は3対立遺伝子で6遺伝子型が考えられるとし、 A と B が O に対して優性であることから4表現型が得られるとした。
これらの二つの仮説を区別する一番よい方法は家系調査である。 しかし、二つの仮説の相違は少なくとも片親がAB型である結婚型でしかわからない。 2遺伝子座仮説では両親が4種類の血液型どの組合せからも O型の子どもが生まれる可能性があるのに、1遺伝子座3対立遺伝子仮説では少なくとも片親がAB型である結婚型からはO型は生まれない(読者は検討のこと)。
AB型は一番少ない血液型であるし、生まれる子どもの数(同胞数sibship size)が小さいと考えられる血液型の子どもがすべて生まれるとはかぎらない。 初期の文献にはAB型の親からO型の子どもが報告されている。 これは判定に用いた血清が良くなく、判定を誤ってしまったか、生物学的な実子でなかったかである。 Bernsteinはこのような観察に惑わされることなく、正しい結論を導いた。
Bernsteinの主張は次の通りである。
2座位説が正しいとしよう。 pをA遺伝子の頻度、その対立劣性遺伝子aの頻度を p'(=1-p)、qをB遺伝子の頻度、その対立劣性遺伝子bの頻度を q'(=1-q) としよう。 そうすると次の諸頻度が集団で予測される。
表現型 | 遺伝子型 | 遺伝子型頻度 | 表現型頻度 |
O型 | aabb | (1-p)**2x(1-q)**2 | p’**2xq’**2 |
A型 | AAbb Aabb |
p**2x(1-q)**2 2p(1-p)(1-q)**2 |
(1-p’**2)q’**2 |
B型 | aaBB aaBb |
(1-p)**2xq**2 (1-p)**2x2q(1-q) |
p’**2x(1-q’**2) |
AB型 | AABB AaBB AABb AaBb |
p**2xq**2 2p*(1-p)q**2 p**2x2q(1-q) 2p(1-p)2q(1-q) |
(1-p’**2)(1-q**’2) |
これから表現型頻度について次の関係が得られる。
- [O]x[AB]=[A]x[B]
- ([A]+[AB])([B]+[AB])=[AB]
Bernsteinは多くの文献報告についてこれを検討したところ、いつも
[O]x[AB]<[A]x[B]、([A]+[AB])([B]+[AB])>[AB]
であることが分かった{前回の講座で示した日本人の献血データでこれを確かめよ([A]x[B]=2.94([O]x[AB]), ([A]+[AB])([B]+[AB])=6,999,781[AB])}。 この相違はたいへん大きく、どのデータでもそうなるので、偶然による偏りで説明するのは不適切である。 Bernsteinは調査集団の異質性を考えたが、それだけでは説明できないことがわかった。 一方すでに述べたが、複対立遺伝子仮説による予測値は観測値とよく合うことが示された。
Teraoら(1986)[Terao K, Fujimoto K, Cho F and Honjo S 1986. The inheritance mode of simian-type E, F, and GH blood groups in cynomolgus monkeys. Amer J Primat 11: 245-251]はカニクイザルの4種類の赤血球抗原の遺伝様式を調べるため、家系調査と集団調査を行った。 家系資料から、各抗原反応の存在がないことに対して優性であることが証明された。 集団資料から2つの抗原を対にした6通りのデータを作成して、それぞれのデータについてHWの法則に適合するかしないかを、2座位説と3対立遺伝子説を検討した。 その結果、E,F抗原は独立の遺伝子座に、G,H抗原はサイレント抗原も含めて1遺伝子座3複対立遺伝子であることがわかった。
[無限アレルモデルのHW法則への適用]
遺伝子DNAの塩基配列が調べられるようになって、限られた調査数にも関わらず多数の「対立遺伝子」がみつかるようになった。 このような状況で、個々の表現型の観測値と予測値を比べる従来のX2(カイ自乗)や尤度比を用いる検定法は、個々の観測値が小さく、あるいは0となって、基礎となっている大標本理論にそぐわない。
そこでいくつかの方法が考えられている。ここでは(1)ヘテロ接合の合計で観測値とHW法則の予測値をくらべる方法と(2)異なる遺伝子型の数で観測値と予測値を比較する方法を取り上げてみよう。 後者についてはChakraborty(1993)[Chakraborty R 1993.Generalized occupancy problem and its applications in opulation genetics.In Geneyics of cellular, individual, family and population variability(Eds Sing CS & Hanis CL), Oxford University Press, NewYork] を参照されたい。
例えばDeka(1991)[Deka R, Chakraborty R and Ferrell RE 1991. A population genetics study of six VNTR loci in three ethnically defined populations.Genomics 11: 83-92]はニューギニアで6座位のVNTRの多型を調べた。 そのうちのD1S76座位で、35人から6つの対立遺伝子がみつかった。 カウント法でこれらの対立遺伝子の数を数えると、1,3,7,9,25,25(合計70)であった。
- 20人が7種類のヘテロ接合のいずれかであった。 HWの法則から予測されるヘテロ接合の合計の予測値は25.4で、X2=4.25(df=1)は5%水準で有意である。 ホモ接合は4種類でその合計は15人で、その予測値は9.6となる。
- ヘテロ接合には7種類の違う遺伝子型がみつかり、ホモ接合には4種類の遺伝子型が観測された。 これらの数がHWの法則からの予測値とくらべることになる。 Chakraborty(1993)によると違う遺伝子型の平均予測値(M)と分散は(V)は次式で表される。
M=K-T1、 V=T1(1-T1)+T2
ここにKは考えられる遺伝子型の数、T1は違う遺伝子型についての(1-遺伝子型予測頻度)nを合計したもの、T2は2つの遺伝子型を取り出し、(1-遺伝子型1の予測頻度-遺伝子型2の予測頻度)nをすべての組合せについて合計したものである。 nは標本の大きさである。 VNTRのデータでは、ホモ接合については M=3.329, V=0.578=(0.760)**2、ヘテロ接合については M=10.106,,V=1.652=(1.285)**2。
1),2)いづれの検定法でもヘテロ接合の観測値が少ないことが示唆される。 この真の原因はこれだけではわからない。 遺伝的あるいは人類学的検討や分子遺伝的な考察をあわせて行う必要があろう。
4.3.3.2 X連鎖遺伝子の頻度
この場合は(1)集団を性別にわけて、それぞれの性で遺伝子頻度を求める。 そして必要なら(2)遺伝子頻度に性差があるかを検定し、(3)差がなければ、それぞれの遺伝子頻度に遺伝子数の割合で荷重した平均を集団の遺伝子頻度とする。
a)共優性の場合
2対立遺伝子A,aの頻度をp,q(p+q=1)とする。 遺伝子型は男子ではA,a、女子ではAA,Aa,aaとする。 それぞでの観測値を[*]で表し、男子、女子の総数はそれぞれ Nm(=[A]+[a]) Nf(=[AA]+{Aa]+[aa])とする。
- 対立遺伝子Aの頻度は男子では pm=[A]/Nm、女子では pf={2[AA]+[Aa]}/2Nf。 対立遺伝子aの頻度は直接カウントしてもよいが、qm=1-pm, qf=1-pfから計算できる(カウントした方が計算のチェックができる)。
- pm,pfの分散はそれぞれ Vm=pm(1-pm)/Nm, Vf=pf(1-pf)/(2Nf)であるから X2=(pm-pf)**2/(Vm+Vf)が自由度1のカイ自乗分布をする性質を用いて検定する。
有意差がなければ、対立遺伝子Aの頻度は次の公式から求めることができる。
p=mpm+fpf, q=m(1-pm)+f(1-pf)
ここでm,fはそれぞれ男子、女子の遺伝子総数の割合である{m=Nm/(Nm+2Nf),f=2Nf/(Nm+2Nf), m+f=1}。 遺伝子頻度pの分散はV=pq/(Nm+2Nf)となる。
b)優性の場合
共優性の場合と同じ記号を用いるが、女子では表現型がA_とaaの2種類になる。 男子での遺伝子頻度の推定は共優性の場合と同じであるが、女子での遺伝子頻度の推定は第6回講座(4.3.3.1,b)の常染色体遺伝子の推定法による{訂正。 前回の講座で h=2q/(2-q) は誤りで、h=2q/(1+q) と訂正してください}が、p,qの代わりにpf,qfを代入する。 有意差の検定も共優性の場合と同じですが、女子の遺伝子頻度の分散は Vf=(1-qf2)/(4Nf) となる。 有意差がなければ、次式に最初 1-p=qf を代入して両辺の差が十分小さくなるまで反復して q,p=1-q の値を求める。
q=m(1-pm)+f(1-p)
推定値の分散は 1/V=1/Vf+1/Vm から得られる。
4.3.3.3 ハプロタイプhaplotypeの頻度
密に連鎖した2遺伝子座を同時に考察したとき、集団データから配偶子あるいはハプロタイプ頻度を求める公式を示しておく。 詳細は原著を参照されたい。 古典的な例ではMNSs式血液型、最近ではHLA型やREFPs等が挙げられる。数値例は省略する。
- a) 2座位ともに共優性の場合
A座位にはA1,A2の対立遺伝子が、B座位にはB1,B2の対立遺伝子があるとする。 ハプロタイプAiBjの頻度をrij (i,j=1,2)とする。 各表現型とその観測値(nk)(k=1,9)と予測値は次のようになる。 二重ヘテロの表現型には2通りの遺伝子型があることに気を付ける。
表現型 | 観測値 | 予測値 |
A1B1 | n1 | n(r11**2) |
A1B1B2 | n2 | n(2xr11r12) |
A1B2 | n3 | n(r12**2) |
A1A2B1 | n4 | n(2xr11r12) |
A1A2B1B2 | n5 | n(2xr11r22+2xr12r21) |
A1A2B2 | n6 | n(2xr12r22) |
A2B1 | n7 | n(r21**2) |
A2B1B2 | n8 | n(2xr12r22) |
A2B2 | n9 | n(r22**2) |
合計 | n | n |
カウント法で次の数(aとb)を求める。
a1=(2n1+n2+n4)/(2n), a2=(n2+2n3+n6+n5)/(2n), a3=(n4+2n7+n8+n5)/(2n), a4=(n6+n8+2n9)/(2n), b=n5/(2n). |
ハプロタイプの頻度は
A1B1 | r11=a1+bh |
A1B2 | r12=a2-bh |
A2B1 | r21=a3-bh |
A2B2 | r22=a4+bh |
但し h=2xr11r22/(2xr11r22+2xr12r21) は二重ヘテロの個体が A1B1/A2B2 の遺伝子型である確率である。
実際の計算はまず h=0.5 として、データから rij を求める。 それらの数値から h を改めて計算して、再度 rij を計算する。 rij の必要な桁数が変わらなくなるまでこれを反復して得た値が最尤推定値となる。 連鎖不平衡値の推定公式や分散も求められているが詳細は Yasuda(1978a) を参照されたい。 [Yasuda N 1978a The sampling variance of the linkage disequilibrium parameter in multiallele loci. Heredity 41:155-163.]
b)1座位は共優性、1は優性の場合(Yasuda,1978aを参照)
c)2座位ともに優性の場合(Yasuda,1978b)
A,B各座位の対立遺伝子をそれぞれA,OとB,Oとし、O遺伝子はいずれの座位でも劣性であるとする。 ハプロタイプAB,AO,OB,OOの頻度は
rAB=1+sqrt{[O]/N}-sqrt{([A]+[O])/N}-sqrt{([B]+[O])/N} rAO=sqrt{([A]+[O])/N}-sqrt{[O]/N} rOB=sqrt{([B]+[O])/N-sqrt{[O]/N} rOO=sqrt{[O]/N} |
から求められる。 ここに[*]は*表現型の観測値、Nは観測値の総数である。
特にrABの分散は次の公式から求められる。
V(rAB)=[{1-sqrt{[O]/([A]+[O])}}{1-sqrt{[O]/([A]+[O])}}+rAB(1-rAB/2)]/2N
また連鎖不平衡値(dAB)とその分散V(dAB)も次式から求められる。
dAB | = | sqrt{[O]/N}-sqrt{([A]+[O])([B]+[O]}/N |
V(dAB) | = | [[AB]-4N{([A]+[B]+2[O])/{2xsqrt{([A]+[O])([B]+[O])} -sqrt{([A]+[O])([B]+[O])}/N] |
n遺伝子座が密に連鎖して、各遺伝子座に2つの対立遺伝子があってそれらの一方が劣性であるときのハプロタイプ頻度を求める公式は得られている。 その他優劣関係が複雑な場合は、全てが共優性の場合でも解析的な公式は得られていない。 ましてや対立遺伝子数が3以上の複対立遺伝子がある場合はほとんど手が付けられていない。 この方面の研究は実際にはEMアルゴリズムを用いて電算機で計算するプログラムの開発でカバーされている[例えばLong JC 他 1995]。
引用文献
Bernstein F 1925. Zusammenfassende Betrachtungen uber die erblichen Blutstrukturen des Menschen. Zeitschrift fur Induktive Abstammungsund Vererbungslehre 37:237-270.
Chakraborty R 1993. Generalized occupancy problem and its applications in population genetics. In Genetics of cellular, individual, family, and population variability (Eds Sing CS & Hanis CL) Oxford University Press,New York
Deka R, Chakraborty R and Ferrell RE,1991. A population genetics study of six VNTR loci in three ethnically defined populations. Genomics 11:,83-92.
Long JC, Williams RC, and Urbanek 1995. An EM algorithm and testing strategy for multiple-locus haplotypes. Amer J Human Genet 56:799-810.
von Dungern EとHirszfeld L, 1911. Uber Vererbung gruppenspezifischer Strukturen des Blutes. Z ImmunForsch .6:284-292.
Terao,K, Fujimoto K, Cho F and Honjo S 1986. The inheritance mode of simian-type E, F, and GH blood groups in cynomolgus monkeys. Amer J Primat 11: 245-251.
Yasuda N 1978a The sampling variance of the linkage disequilibrium parameter in multiallele loci. Heredity 41:155-163.
Yasuda N 1978b Estimation of haplotype frequency and Linkage disequilibrium parameter in the HLA system. Tissue Antigens 12:315-322.
次回,は近親交配についてです。