第15回集団遺伝学講座

2016/07/14

安田徳一{YASUDA, Norikazu}

5.12　患者同胞法 affected sib-pair method

遺伝病の原因遺伝子をゲノム上にマップすることが昨今遺伝医学研究者によって行われている。これは原因遺伝子の病気への作用機構を調べることなく、ゲノム上の位置を既知の標識遺伝子を沢山調べてそれぞれについて連鎖分析をして、連鎖があれば原因遺伝子の位置がわかるという方法である。標識遺伝子座位としてはHLA (6p21.3)、RFLPs、VNTR、ESTsなどが用いられる。これには病気が多発する大家系の調査が必要で、費用や時間の消費は往々にしてぼう大になる。そこで考え直されたのが2つの形質をきょうだい2人の対で調べて形質の遺伝連鎖を探る一世代資料による同胞対照法 paired sib method である。

同胞対照法を最初に述べたのは Penrose(1935) で統計的には2×2分割表を用いて 60対の同胞を調べてA凝集素と赤毛の連鎖を示唆した。原理的には各常染色体遺伝子座に2個の対立遺伝子を仮定している。HLAの研究が始まってまもなく多数の複対立遺伝子やハプロタイプが見つかり、Thomson and Bodmer(1979)はきょうだいに多発する症例のデータを用いて疾患原因遺伝子のマップをすることを模索した。2人の患者がきょうだいである家系を集め(病院記録や診療記録、カルテなど)、遺伝標識としてたとえばHLAをタイプすれば6p21.3(第6番染色体短腕領域2のバンド1のサブバンド3)の近傍に原因遺伝子があるかどうかは、原因遺伝子がHLAと連鎖しているかどうかを検討して判断することができる。

最初に開発されたトムソン・ボドマー法はきょうだいの(健康な)両親の標識遺伝子も調べる、つまり一家系あたり最小限両親と一対の患者同胞について標識遺伝子を調査するものであった。データとして両親は健康なのが普通である。若年に発症する疾患でこのようなデータが得られことが多い。晩年に発症する疾患についてはすでに親が死亡しているか調査不可能なことが多いので患者同胞の未発症の同胞の遺伝標識を調べることにより、両親の遺伝子型を推測して標識遺伝子と原因遺伝子の連鎖を検討する方法も開発されている(Holmans and Clayton 1995)。

5.12.1 トムソン・ボドマー法

きょうだいやイトコなどの一対の血縁者が同じ病気である場合、もしHLAなどの遺伝標識の遺伝様式と病気のそれとが関連するなら、両者は組換えは別として密に連鎖しているのではないか、ということに着目したのは Day and Simons(1976)であった。彼らは特定のHLAハプロタイプを持つ個体の相対リスクでこの関係を研究したが、集団遺伝学の方法で行ったのが Thomson and Bodmer(1979)であった。

患者同胞対法:対立遺伝子の数を4以上とし、両親はいずれもヘテロ接合でお互いに同じ遺伝子を共有しないものとする。すなわち、4種類の対立遺伝子をa,b,c,dとすると、両親の交配型 abxcd から生まれる子どもの遺伝子型はac,ad,bc,bdのいずれかである。2人のきょうだいはこれら4つの遺伝子型からランダムに2つ取り出した組合わせである。組合わせ方の合計は16通りあり、そのうちの4通りは (ac,ac), (ad,ad),(bc,bc),(bd,bd) と両親の遺伝子2個をきょうだいで共有してをり、別の4 通りは (ac,bd),(ad,bc),(bc,ad),(bd,ac)(出生順位を考慮) と両親の遺伝子を一つも共有していない。残りの8通りは両親の遺伝子を1個共有する。したがって、2人のきょうだいが2個、1個、0個の同祖遺伝子を共有する確率は 1/4,1/2,1/4 である。共有する同祖遺伝子の数を同胞対毎に数えて、集めた同胞対をX:Y:Z=0.25:0.5:0.25 の比に分類することができる。

ところでこの同胞対がある疾患に共に罹病している場合を考察してみよう。問題の疾患の原因遺伝子が標識遺伝子と同一染色体上に密に連鎖していなければ、共有する同祖遺伝子の数による同胞対の比は相変わらずX:Y:Z=0.25:0.5:0.25となることが予測される。しかし、もし密に連鎖しているならばこの比は違ってくる。疾患がまれな優性遺伝であればX:Y:Z=0.5:0.5:0、まれな劣性遺伝病であればX:Y:Z=1:0:0 と予測されることは容易に理解ができる。ゲノムの位置のわかっている標識遺伝子とその近傍のゲノムが一緒に複製されて親から子へと伝えられる性質を利用するのが患者同胞対法である。

一般に疾患の発生率 I は疫学調査により求めることが可能で、その遺伝子頻度 p は任意交配集団で

まれな優性遺伝病なら	I≒2p	∴p=I/2
まれな劣性遺伝病なら	I≒p**２	∴p=√I

から計算できる。環境因子で同じ症状が顕れるなど原因遺伝子以外の要因(原因遺伝子が複数など)で発症する、いわゆる浸透率penetrance(f)が100%でないときは、上式の I の代りに I/f を用いて遺伝子頻度 p を求める。遺伝子頻度がまれでなかったり、近親婚が無視できない集団については別に若干工夫を必要とする。

一般に患者同胞対の比 X:Y:Z は疾患の原因遺伝子頻度で次のように表わされる。まれな優性遺伝病と劣性遺伝病については Thomson and Bodmer(1970)、優性遺伝病でヘテロの浸透率がホモの半分である(浸透率について相加的な)場合は Thomson (1986)による。

	X	Y	Z
優性遺伝病	(2ーp)/D１	{1+p(1-p)}/D１	p(2ーp)**２/D１
(相加的)優性遺伝病	(1+p)/D２	1/2	p/D２
劣性遺伝病	1/D３	2p/D３	p２/D３

ここで D１=4+4p(1-p)+p(1-p)**２, D２=2(1+3p), D３=(1+p)**２である。　これらを数表にして計算の便宜が計られている(Yasuda and Sasazuki,1982)。なお優性遺伝病の二つのモデルは数値的にもあまり判別し難いことがわかる。たとえば Y については 0<p<1 の値で {1+p(1-p)}/D１～1/2 であるし、X については優性遺伝病の発生率がまれだと (pが0に近い)(2ーp)/D１～(1+p)/D２である。優性遺伝病のホモとヘテロの浸透率を別々に求めることは実務的にも容易ではないので、この区別はむしろ理論的な興味でしかない。

具体例:若年性糖尿病とHLA

Ryder et al.(1979)は若年性糖尿病できょうだい発症例118対の家系についてHLA ハプロタイプの共有確率を調査したところ次の通りであった。

HLAハプロタイプの共有数	観測数(%)	連鎖のない場合の予測数(%)
0	5 (4.2)	29.5 (25.0)
1	44 (37.3)	59.0 (50.0)
2	69 (58.5)	29.5 (25.0)
計	118(100.0)	118.0(100.0)

ここで予測数は2遺伝子座が連鎖していない場合の共有数の比 1:2:1 から求めた。観測値が予測値と有意に違うことは X**２=7.71(df=2) すなわち P<10**(－５) であることからも明らかである。この結果から、若年性糖尿病の原因遺伝子はHLA座位と密に連鎖していることが示唆される。また若年性糖尿病の遺伝様式とこのタイプの若年性糖尿病の発生率が次のようにして推定される。

まず劣性遺伝の仮定で観測された共有確率比に最も近い予測値をたとえば最尤法で求めると、疾患の原因遺伝子頻度は p=0.30 で X:Y:Z=59.2:35.5:5.3 となった。適合度の X**２値は 0.38 (df=1、観測データからパラメータpを推定しているので自由度が1つ減る)となるから、劣性遺伝の仮説は棄却できない (P<0.55)。次に優性遺伝の仮説では原因遺伝子頻度は p=0.04、共有確率比の予測値は X:Y:Z=47.5:49.6:2.8であった。この結果は観測された共有確率比と合わない (X**２=7.1、df=1、P<0.01)。

以上の結果から若年性糖尿病は劣性の遺伝様式をしており、その原因遺伝子は第6 番染色体短腕領域2のバンド1のサブバンド 3(6p21.3) の近傍にあることが示唆される。その発生率は I=p**２=(0.30)**２=0.09、およそ10人に1名と予測される。

少なくとも20の遺伝子座が若年性糖尿病の発症に関与していることがゲノム全般についての遺伝標識との連鎖分析から示唆された(Davies 他, 1994)。主要組織適合性抗原複合体(HLA)6p21の近傍(IDDM1)、11p15のインスリン遺伝子の近傍(IDDM2)、 15q26と連鎖したIDDM3(Field 他,1994)、11qに連鎖しているIDDM4,6qに連鎖しているIDDM5,18番染色体にも一つ同定された。これら複数の遺伝子群のうち主要効果を示すのは6p21と密に連鎖したIDDM1であると見られ、他はポリジーンと考えられている。

5.13 患者同胞対法(続)

(1)Thomson and Bodmer(1970)が開発した患者同胞対法では(通常は健康である)患者の両親の遺伝標識も調べる必要があった。仮に染色体上の位置がわかった座位を標識として用いても、対立遺伝子の数が4以上である必要があるとの条件付きである。この問題について若干考えてみよう。

任意交配の集団である標識遺伝子座の対立遺伝子数をm(≧4)とする。両親が共にヘテロ接合でしかもお互いに異なる遺伝子を保有している確率は HH=Σ(2pｉpｊ)(2pｋpｌ)である。ここにpは対立遺伝子頻度で添え字は異なる対立遺伝子をあらわす。個々の対立遺伝子頻度が求められればこの確率は計算することができるが、仮にすべての頻度が同じ場合を検討することで様子を調べてみよう。この場合の確率はすべての対立遺伝子頻度が等しくない場合に比べて最大となる。

HH=Σ(2pｉpｊ)(2pｋpｌ)	=(1-1/m)(1-2/m)(1-3/m)	(m≦4)
	= 0	(1≦m≦3)

と表わすことができる。

古典的な血液型についての具体的な例は次の通りである(Yasuda and Sasazuki, 1982)。

対立遺伝子数m	確率HH	血液型
2	0.00	Lewis,P,Diego
3	0.00	ABO,Lutheran,Kell,Duffy,Kidd,Km
4	0.09	MNSs, Gm
7	0.35	HLA-C 8 0.41 Rh
8	0.41	Rh
9	0.59	HLA-DR
15	0.65	HLA-A
29	0.81	HLA-B
50	0.88	–
80	0.93	–
100	0.94	–

以上の考察から遺伝標識として候補に挙がるのはボックス5.1で述べたSSRである。マイクロサテライト、ミニサテライトなどのように比較的短いヌクレオチド配列の縦列反復をしたもので形式的には対立遺伝子の数がたいへん大きいことが観察されるし、これらのマップ位置も既知であるものが増えてきている。

(2)患者同胞対法の適用に際してもう一つの難点はしばしば両親の遺伝標識を調べることができないことである。患者がtype||糖尿病などのように晩発性の遺伝疾患に罹っていると親はすでに死亡していることがしばしばである。病気が若年性でも特にヒトの場合には両親が必ずしも調査に協力してもらえるとは限らない。

そこで両親の遺伝標識が調べられていないデータでの患者同胞対法が開発されている。いろいろな方法が工夫されているが、そのうちの一つを紹介しよう。それは同祖遺伝子(gene identical by descent)を共有する確率の代りに同質遺伝子(gene identical by state)を共有する確率を用いるものである。2人のきょうだいがそれぞれGという遺伝子を保有していたとしたら、(i)そのG遺伝子はいずれかの親が持つ一つのGの減数分裂によるコピーか、(ii)両親が持つ複数のGのそれぞれのコピーか、はきょうだいだけを調べる限り区別できない。前者は親の特定の遺伝子が複製されて子の2人のきょうだいに伝えられているとみられるので、きょうだいで観察された 2つのG遺伝子は同祖的、すなわち同祖遺伝子である。後者は親世代で観察された2個のG遺伝子、この2つは親子2世代の観察データからは少なくとも同祖的とは判断できないから、きょうだいのデータをみる限りは同祖的とはいえない。したがって同質的と呼ぶことにする。両親が調べられていても対立遺伝子の数が少ないと同祖的と判断できないことがあることはすでに(1)で述べた。

それでは同質遺伝子を共有する確率を求めてみよう。これを最初に示したのは Lange(1986)である。患者が属する健康人集団から無作為に抽出した標本での標識対立遺伝子Gｉの頻度をpｉとする。2人の同胞が2個の同質遺伝子を共有する確率P(2) は次の3通りの状況での確率の和である。

2つが同祖遺伝子である場合。この確率は1/4である。
1つの同祖遺伝子があって、一方の親がその遺伝子についてホモ接合である場合。前者の確率は1/2で後者の確率はΣpｉ**２であるから、この場合の共有確率は (1/2)Σpｉ**２となる。
同祖遺伝子が一つもない場合。同質遺伝子が一致する場合には2通りある。両親が共にホモ接合である場合と母親の2つの対立遺伝子それぞれが父親のそれぞれ 2つの対立遺伝子と結合した場合であるが、このうちすべての対立遺伝子が同じである場合は重複する。両者の確率はいづれも(Σpｉ**２)**２であるが両親の対立遺伝子4つがすべて同じ確率Σpｉ４を差し引くことになる。

以上をまとめると確率P(2)は次のようになる。

P(2)=1/4 + (1/2)Σpｉ**２　+ (1/4){2(Σpｉ**２)**２- Σpｉ**４}

次に一つも共有しない確率P(0)を求めよう。2人の同胞は同祖遺伝子が一つもない場合でしか標識遺伝子は不一致である。すなわち、きょうだいの一人ひとりは違う遺伝子を両親から遺伝する。これら2組みの対立遺伝子には同じものはあり得ない。第一のきょうだいがある対立遺伝子のホモ接合なら、第二のきょうだいはそれとは違う遺伝子型である。このような確率は pｉ２(1-pｉ)**２である。もしヘテロ接合なら、その確率は 2pｉpｊ(1-pｉ-pｊ)**２である。以上をまとめると

P(0)=(1/4){Σpｉ**２(1-pｉ)**２} + 2Σ’pｉpｊ(1-pｉ-pｊ)**２}

ここにΣ’は添え字i,jにi>jという条件を付けて和をとることを表わす。

一つ共有する確率P(1)は

P(1)=1-{P(2)+P(0)}

から求めることができる。

これらの公式は 2Σ’Qij=ΣΣQij-ΣQii(Komatsu 1952, Yasuda 1986)なる関係に注目して、Sｋ=Σpｉ**ｋを用いて表わすと計算が容易である。すなわち

P(2)=1/4 +	(1/2)S２(1+S２)	–			(1/4)S４
P(1)=1/2 +	(1/2)S２(1-2S２)	–	S３	+	S４
P(0)=1/4 –	S２(1-S２/2)	+	S３	–	(3/4)S４

すべての対立遺伝子の頻度が同じなら、その数をmとすると公式は次のように表わされる。

P(2)=0.25+	(0.5/m)	[1+(1/m){1-0.5(1/m)}]
P(1)=0.50+	(1/m)	[{0.5-(1/m){2-(1/m)}]
P(0)=0.25-	(1/m)	[1-0.75(1/m){2-(1/m)}]

これらは一遺伝子座が最も多型な場合での同質遺伝子の共有確率を表わしている。これを数値で表わすと次のようになる。

対立遺伝子数	遺伝子頻度	同質遺伝子の共有確率
(m)	(1/m)	P(2)	P(1)	P(0)
2	0.5	0.593	0.375	0.037
3	0.333	0.462	0.481	0.055
4	0.25	0.402	0.515	0.082
5	0.2	0.368	0.528	0.104
6	0.166	0.346	0.532	0.121
7	0.142	0.330	0.533	0.146
8	0.125	0.391	0.533	0.146
9	0.111	0.311	0.532	0.156
10	0.1	0.304	0.531	0.164
20	0.05	0.276	0.520	0.203
50	0.02	0.260	0.509	0.230
100	0.01	0.255	0.504	0.240
∞	–	0.25	0.5	0.25

これらの数値を同祖遺伝子の共有確率 P(2):P(1):P(0)=0.25:0.50:0.25 と比べると興味深い。たとえばm=4で同質遺伝子の共有確率は 0.402:0.515:0.082 であるから、もし同質遺伝子についてのデータを同祖遺伝子のデータとして統計分析をすると、 X２=0.2058n (df=2)、ここでnは調べた患者同胞対の数である。このX２の5%水準での値は5.99であるからn≧30で有意差が表われる。すなわち同質遺伝子の共有確率のデータを同祖遺伝子のデータと間違えて分析すると、疾患原因遺伝子が標識遺伝子と連鎖しているという誤った結論をだす恐れがある。

患者同胞対法で同祖遺伝子を共有する場合と同質遺伝子を共有する場合の相違は、前者では一般集団での標識遺伝子頻度を知らなくてもよいのに対して、後者では調べる必要があることである。しかも正しくは患者の出身地の集団の遺伝子頻度を用いるのがよいが、日本人のDNAマーカーの頻度についてはまだまだ調査が必要であると考えられる。

リウマチなどの成人病で素質が原因とみられる疾患については、患者の親はすでに死亡していたり、調査不可能なのことがしばしばである。幸いなことにこの世代は一組のきょうだい数が多く、患者同胞のみならず非罹病の健康なきょうだいも調査できることがある。このようなデータについてはきょうだいの標識遺伝子型から両親の保有した遺伝子を推定して、きょうだい対の標識遺伝子の共有確率を推定する方法も考えられている(Holmans and Clayton, 1995)。

文献

Davies JL, Kawaguchi Y, Bennett ST, Copeman JB, Cordell HJ, Pritchard LE, Reed PW, Gough SCL, Jenkins SC, Palmer SM, Balfour KM, Rowe BR, Farrall M, Barnett AH, Bain SC and Todd JA, 1994. A genome-wide search for human type 1 diabetes susceptibility genes. Nature 371: 130-136.
Day NE and Simons MJ, 1976. Disease susceptibility genes – their identification by multiple case family studies. Tissue antigens 8: 109-119.
Field LL, Tobias R and Magnus T,1994. A locus on chromosome 15q26 (IDDM3) produces susceptibility to insulin-dependent diabetes mellitus.Nature Genetics 8:189-194.
Holmans P and Clayton D, 1995. Efficiency of typing unaffected relatives in an affected-sib-pair linkage study with single-locus and multiple thightly linkage marker. Amer J Human Genet 57: 1221-1232.
Komatsu Y, 1952. Probablistic-theoretic investigation on inheritance. 7.Non-paternity problems. Proc Jpn Acad 28: 102-125.
Lange K, 1986. The affected sib-pair method using identity by state relations. Amer J Human Genet 39: 148-150.
Penrose LS 1935.The detection of autosomal linkage in data which consist of pairs of brothers and sisters of unspecified parentage. Ann Eugen,Lond 6:133-138.
Ryder LP et al. 1979. Adv Exp Med Biol 119:4-50.
Thomson G 1986. Determinating the mode of inheritance of RFLP-associated diseases using the affected sib-pair method. Am J Hum Genet 39: 207-221.
Thomson G and Bodmer WF 1970. The genetics of HLA and disease associations. In Measuring Selection inNatural Population (eds FB Christiansen, T Fenchel and O Barndorff-Nielsen), pp 84-93. Copenhagen: Munksgaard.
Yasuda N, 1986. Handy formula for calculating the probbility of parentage exclusion. Jpn J Human Genet 31: 113-114.
Yasuda N and Sasazuki T 1982. Affected sib pair method for searching major gene in multifactorial disease. Jpn J Human Genet 27: 295-311.