安田徳一{YASUDA, Norikazu}
5.12 患者同胞法 affected sib-pair method
遺伝病の原因遺伝子をゲノム上にマップすることが昨今遺伝医学研究者によって 行われている。これは原因遺伝子の病気への作用機構を調べることなく、ゲノム上 の位置を既知の標識遺伝子を沢山調べてそれぞれについて連鎖分析をして、連鎖が あれば原因遺伝子の位置がわかるという方法である。標識遺伝子座位としてはHLA (6p21.3)、RFLPs、VNTR、ESTsなどが用いられる。これには病気が多発する大家系 の調査が必要で、費用や時間の消費は往々にしてぼう大になる。そこで考え直され たのが2つの形質をきょうだい2人の対で調べて形質の遺伝連鎖を探る一世代資料 による同胞対照法 paired sib method である。
同胞対照法を最初に述べたのは Penrose(1935) で統計的には2×2分割表を用いて 60対の同胞を調べてA凝集素と赤毛の連鎖を示唆した。原理的には各常染色体遺伝 子座に2個の対立遺伝子を仮定している。HLAの研究が始まってまもなく多数の複対 立遺伝子やハプロタイプが見つかり、Thomson and Bodmer(1979)はきょうだいに多 発する症例のデータを用いて疾患原因遺伝子のマップをすることを模索した。2人 の患者がきょうだいである家系を集め(病院記録や診療記録、カルテなど)、遺伝標 識としてたとえばHLAをタイプすれば6p21.3(第6番染色体短腕領域2のバンド1のサ ブバンド3)の近傍に原因遺伝子があるかどうかは、原因遺伝子がHLAと連鎖してい るかどうかを検討して判断することができる。
最初に開発されたトムソン・ボドマー法はきょうだいの(健康な)両親の標識遺伝 子も調べる、つまり一家系あたり最小限両親と一対の患者同胞について標識遺伝子 を調査するものであった。データとして両親は健康なのが普通である。若年に発症 する疾患でこのようなデータが得られことが多い。晩年に発症する疾患については すでに親が死亡しているか調査不可能なことが多いので患者同胞の未発症の同胞の 遺伝標識を調べることにより、両親の遺伝子型を推測して標識遺伝子と原因遺伝子 の連鎖を検討する方法も開発されている(Holmans and Clayton 1995)。
5.12.1 トムソン・ボドマー法
きょうだいやイトコなどの一対の血縁者が同じ病気である場合、もしHLAなどの遺 伝標識の遺伝様式と病気のそれとが関連するなら、両者は組換えは別として密に連 鎖しているのではないか、ということに着目したのは Day and Simons(1976)であっ た。彼らは特定のHLAハプロタイプを持つ個体の相対リスクでこの関係を研究した が、集団遺伝学の方法で行ったのが Thomson and Bodmer(1979)であった。
患者同胞対法:対立遺伝子の数を4以上とし、両親はいずれもヘテロ接合でお互い に同じ遺伝子を共有しないものとする。すなわち、4種類の対立遺伝子をa,b,c,dと すると、両親の交配型 abxcd から生まれる子どもの遺伝子型はac,ad,bc,bdのいず れかである。2人のきょうだいはこれら4つの遺伝子型からランダムに2つ取り出した 組合わせである。組合わせ方の合計は16通りあり、そのうちの4通りは (ac,ac), (ad,ad),(bc,bc),(bd,bd) と両親の遺伝子2個をきょうだいで共有してをり、別の4 通りは (ac,bd),(ad,bc),(bc,ad),(bd,ac)(出生順位を考慮) と両親の遺伝子を一つ も共有していない。残りの8通りは両親の遺伝子を1個共有する。したがって、2人の きょうだいが2個、1個、0個の同祖遺伝子を共有する確率は 1/4,1/2,1/4 である。 共有する同祖遺伝子の数を同胞対毎に数えて、集めた同胞対をX:Y:Z=0.25:0.5:0.25 の比に分類することができる。
ところでこの同胞対がある疾患に共に罹病している場合を考察してみよう。問題 の疾患の原因遺伝子が標識遺伝子と同一染色体上に密に連鎖していなければ、共有 する同祖遺伝子の数による同胞対の比は相変わらずX:Y:Z=0.25:0.5:0.25となること が予測される。しかし、もし密に連鎖しているならばこの比は違ってくる。疾患が まれな優性遺伝であればX:Y:Z=0.5:0.5:0、まれな劣性遺伝病であればX:Y:Z=1:0:0 と予測されることは容易に理解ができる。ゲノムの位置のわかっている標識遺伝子 とその近傍のゲノムが一緒に複製されて親から子へと伝えられる性質を利用するの が患者同胞対法である。
一般に疾患の発生率 I は疫学調査により求めることが可能で、その遺伝子頻度 p は任意交配集団で
まれな優性遺伝病なら | I≒2p | ∴p=I/2 |
まれな劣性遺伝病なら | I≒p**2 | ∴p=√I |
から計算できる。環境因子で同じ症状が顕れるなど原因遺伝子以外の要因(原因遺伝 子が複数など)で発症する、いわゆる浸透率penetrance(f)が100%でないときは、上 式の I の代りに I/f を用いて遺伝子頻度 p を求める。遺伝子頻度がまれでなかっ たり、近親婚が無視できない集団については別に若干工夫を必要とする。
一般に患者同胞対の比 X:Y:Z は疾患の原因遺伝子頻度で次のように表わされる。 まれな優性遺伝病と劣性遺伝病については Thomson and Bodmer(1970)、優性遺伝病 でヘテロの浸透率がホモの半分である(浸透率について相加的な)場合は Thomson (1986)による。
X | Y | Z | |
優性遺伝病 | (2ーp)/D1 | {1+p(1-p)}/D1 | p(2ーp)**2/D1 |
(相加的)優性遺伝病 | (1+p)/D2 | 1/2 | p/D2 |
劣性遺伝病 | 1/D3 | 2p/D3 | p2/D3 |
ここで D1=4+4p(1-p)+p(1-p)**2, D2=2(1+3p), D3=(1+p)**2である。 これらを数表にして計算の便宜が計られている(Yasuda and Sasazuki,1982)。な お優性遺伝病の二つのモデルは数値的にもあまり判別し難いことがわかる。たとえ ば Y については 0<p<1 の値で {1+p(1-p)}/D1~1/2 であるし、X については優性 遺伝病の発生率がまれだと (pが0に近い)(2ーp)/D1~(1+p)/D2 である。優性遺伝 病のホモとヘテロの浸透率を別々に求めることは実務的にも容易ではないので、こ の区別はむしろ理論的な興味でしかない。
具体例:若年性糖尿病とHLA
Ryder et al.(1979)は若年性糖尿病できょうだい発症例118対の家系についてHLA ハプロタイプの共有確率を調査したところ次の通りであった。
HLAハプロタイプ の共有数 |
観測数(%) | 連鎖のない場合の 予測数(%) |
0 | 5 (4.2) | 29.5 (25.0) |
1 | 44 (37.3) | 59.0 (50.0) |
2 | 69 (58.5) | 29.5 (25.0) |
計 | 118(100.0) | 118.0(100.0) |
ここで予測数は2遺伝子座が連鎖していない場合の共有数の比 1:2:1 から求めた。 観測値が予測値と有意に違うことは X**2=7.71(df=2) すなわち P<10**(-5) で あることからも明らかである。この結果から、若年性糖尿病の原因遺伝子はHLA座位 と密に連鎖していることが示唆される。また若年性糖尿病の遺伝様式とこのタイプ の若年性糖尿病の発生率が次のようにして推定される。
まず劣性遺伝の仮定で観測された共有確率比に最も近い予測値をたとえば最尤法 で求めると、疾患の原因遺伝子頻度は p=0.30 で X:Y:Z=59.2:35.5:5.3 となった。 適合度の X**2 値は 0.38 (df=1、観測データからパラメータpを推定しているので 自由度が1つ減る)となるから、劣性遺伝の仮説は棄却できない (P<0.55)。次に優性 遺伝の仮説では原因遺伝子頻度は p=0.04、共有確率比の予測値は X:Y:Z=47.5:49.6:2.8であった。この結果は観測された共有確率比と合わない (X**2=7.1、df=1、P<0.01)。
以上の結果から若年性糖尿病は劣性の遺伝様式をしており、その原因遺伝子は第6 番染色体短腕領域2のバンド1のサブバンド 3(6p21.3) の近傍にあることが示唆され る。その発生率は I=p**2=(0.30)**2=0.09、およそ10人に1名と予測される。
少なくとも20の遺伝子座が若年性糖尿病の発症に関与していることがゲノム全般 についての遺伝標識との連鎖分析から示唆された(Davies 他, 1994)。主要組織適合 性抗原複合体(HLA)6p21の近傍(IDDM1)、11p15のインスリン遺伝子の近傍(IDDM2)、 15q26と連鎖したIDDM3(Field 他,1994)、11qに連鎖しているIDDM4,6qに連鎖してい るIDDM5,18番染色体にも一つ同定された。これら複数の遺伝子群のうち主要効果を 示すのは6p21と密に連鎖したIDDM1であると見られ、他はポリジーンと考えられてい る。
5.13 患者同胞対法(続)
(1)Thomson and Bodmer(1970)が開発した患者同胞対法では(通常は健康である)患 者の両親の遺伝標識も調べる必要があった。仮に染色体上の位置がわかった座位を 標識として用いても、対立遺伝子の数が4以上である必要があるとの条件付きであ る。この問題について若干考えてみよう。
任意交配の集団である標識遺伝子座の対立遺伝子数をm(≧4)とする。両親が共に ヘテロ接合でしかもお互いに異なる遺伝子を保有している確率は HH=Σ(2pipj)(2pkpl)である。ここにpは対立遺伝子頻度で添え字は異なる対立 遺伝子をあらわす。個々の対立遺伝子頻度が求められればこの確率は計算すること ができるが、仮にすべての頻度が同じ場合を検討することで様子を調べてみよう。 この場合の確率はすべての対立遺伝子頻度が等しくない場合に比べて最大となる。
HH=Σ(2pipj)(2pkpl) | =(1-1/m)(1-2/m)(1-3/m) | (m≦4) |
= 0 | (1≦m≦3) |
と表わすことができる。
古典的な血液型についての具体的な例は次の通りである(Yasuda and Sasazuki, 1982)。
対立遺伝子数m | 確率HH | 血液型 |
2 | 0.00 | Lewis,P,Diego |
3 | 0.00 | ABO,Lutheran,Kell,Duffy,Kidd,Km |
4 | 0.09 | MNSs, Gm |
7 | 0.35 | HLA-C 8 0.41 Rh |
8 | 0.41 | Rh |
9 | 0.59 | HLA-DR |
15 | 0.65 | HLA-A |
29 | 0.81 | HLA-B |
50 | 0.88 | – |
80 | 0.93 | – |
100 | 0.94 | – |
以上の考察から遺伝標識として候補に挙がるのはボックス5.1で述べたSSRである。 マイクロサテライト、ミニサテライトなどのように比較的短いヌクレオチド配列の 縦列反復をしたもので形式的には対立遺伝子の数がたいへん大きいことが観察され るし、これらのマップ位置も既知であるものが増えてきている。
(2)患者同胞対法の適用に際してもう一つの難点はしばしば両親の遺伝標識を調べ ることができないことである。患者がtype||糖尿病などのように晩発性の遺伝疾患 に罹っていると親はすでに死亡していることがしばしばである。病気が若年性でも 特にヒトの場合には両親が必ずしも調査に協力してもらえるとは限らない。
そこで両親の遺伝標識が調べられていないデータでの患者同胞対法が開発されてい る。いろいろな方法が工夫されているが、そのうちの一つを紹介しよう。それは同 祖遺伝子(gene identical by descent)を共有する確率の代りに同質遺伝子(gene identical by state)を共有する確率を用いるものである。2人のきょうだいがそれ ぞれGという遺伝子を保有していたとしたら、(i)そのG遺伝子はいずれかの親が持つ 一つのGの減数分裂によるコピーか、(ii)両親が持つ複数のGのそれぞれのコピーか、 はきょうだいだけを調べる限り区別できない。前者は親の特定の遺伝子が複製され て子の2人のきょうだいに伝えられているとみられるので、きょうだいで観察された 2つのG遺伝子は同祖的、すなわち同祖遺伝子である。後者は親世代で観察された2個 のG遺伝子、この2つは親子2世代の観察データからは少なくとも同祖的とは判断でき ないから、きょうだいのデータをみる限りは同祖的とはいえない。したがって同質 的と呼ぶことにする。両親が調べられていても対立遺伝子の数が少ないと同祖的と 判断できないことがあることはすでに(1)で述べた。
それでは同質遺伝子を共有する確率を求めてみよう。これを最初に示したのは Lange(1986)である。患者が属する健康人集団から無作為に抽出した標本での標識対 立遺伝子Giの頻度をpiとする。2人の同胞が2個の同質遺伝子を共有する確率P(2) は次の3通りの状況での確率の和である。
- 2つが同祖遺伝子である場合。この確率は1/4である。
- 1つの同祖遺伝子があって、一方の親がその遺伝子についてホモ接合である場合。 前者の確率は1/2で後者の確率はΣpi**2であるから、この場合の共有確率は (1/2)Σpi**2となる。
- 同祖遺伝子が一つもない場合。同質遺伝子が一致する場合には2通りある。両親 が共にホモ接合である場合と母親の2つの対立遺伝子それぞれが父親のそれぞれ 2つの対立遺伝子と結合した場合であるが、このうちすべての対立遺伝子が同じ である場合は重複する。両者の確率はいづれも(Σpi**2)**2であるが両親の 対立遺伝子4つがすべて同じ確率Σpi4を差し引くことになる。
以上をまとめると確率P(2)は次のようになる。
P(2)=1/4 + (1/2)Σpi**2 + (1/4){2(Σpi**2)**2- Σpi**4}
次に一つも共有しない確率P(0)を求めよう。2人の同胞は同祖遺伝子が一つもない 場合でしか標識遺伝子は不一致である。すなわち、きょうだいの一人ひとりは違う 遺伝子を両親から遺伝する。これら2組みの対立遺伝子には同じものはあり得ない。 第一のきょうだいがある対立遺伝子のホモ接合なら、第二のきょうだいはそれとは 違う遺伝子型である。このような確率は pi2(1-pi)**2である。もしヘテロ接合 なら、その確率は 2pipj(1-pi-pj)**2である。以上をまとめると
P(0)=(1/4){Σpi**2(1-pi)**2} + 2Σ’pipj(1-pi-pj)**2}
ここにΣ’は添え字i,jにi>jという条件を付けて和をとることを表わす。
一つ共有する確率P(1)は
P(1)=1-{P(2)+P(0)}
から求めることができる。
これらの公式は 2Σ’Qij=ΣΣQij-ΣQii(Komatsu 1952, Yasuda 1986)なる関係に 注目して、Sk=Σpi**kを用いて表わすと計算が容易である。すなわち
P(2)=1/4 + | (1/2)S2(1+S2) | – | (1/4)S4 | ||
P(1)=1/2 + | (1/2)S2(1-2S2) | – | S3 | + | S4 |
P(0)=1/4 – | S2(1-S2/2) | + | S3 | – | (3/4)S4 |
すべての対立遺伝子の頻度が同じなら、その数をmとすると公式は次のように表わ される。
P(2)=0.25+ | (0.5/m) | [1+(1/m){1-0.5(1/m)}] |
P(1)=0.50+ | (1/m) | [{0.5-(1/m){2-(1/m)}] |
P(0)=0.25- | (1/m) | [1-0.75(1/m){2-(1/m)}] |
これらは一遺伝子座が最も多型な場合での同質遺伝子の共有確率を表わしている。 これを数値で表わすと次のようになる。
対立遺伝子数 | 遺伝子頻度 | 同質遺伝子の共有確率 | ||
(m) | (1/m) | P(2) | P(1) | P(0) |
2 | 0.5 | 0.593 | 0.375 | 0.037 |
3 | 0.333 | 0.462 | 0.481 | 0.055 |
4 | 0.25 | 0.402 | 0.515 | 0.082 |
5 | 0.2 | 0.368 | 0.528 | 0.104 |
6 | 0.166 | 0.346 | 0.532 | 0.121 |
7 | 0.142 | 0.330 | 0.533 | 0.146 |
8 | 0.125 | 0.391 | 0.533 | 0.146 |
9 | 0.111 | 0.311 | 0.532 | 0.156 |
10 | 0.1 | 0.304 | 0.531 | 0.164 |
20 | 0.05 | 0.276 | 0.520 | 0.203 |
50 | 0.02 | 0.260 | 0.509 | 0.230 |
100 | 0.01 | 0.255 | 0.504 | 0.240 |
∞ | – | 0.25 | 0.5 | 0.25 |
これらの数値を同祖遺伝子の共有確率 P(2):P(1):P(0)=0.25:0.50:0.25 と比べると 興味深い。たとえばm=4で同質遺伝子の共有確率は 0.402:0.515:0.082 であるから、 もし同質遺伝子についてのデータを同祖遺伝子のデータとして統計分析をすると、 X2=0.2058n (df=2)、ここでnは調べた患者同胞対の数である。このX2の5%水準で の値は5.99であるからn≧30で有意差が表われる。すなわち同質遺伝子の共有確率の データを同祖遺伝子のデータと間違えて分析すると、疾患原因遺伝子が標識遺伝子 と連鎖しているという誤った結論をだす恐れがある。
患者同胞対法で同祖遺伝子を共有する場合と同質遺伝子を共有する場合の相違は、 前者では一般集団での標識遺伝子頻度を知らなくてもよいのに対して、後者では調 べる必要があることである。しかも正しくは患者の出身地の集団の遺伝子頻度を用 いるのがよいが、日本人のDNAマーカーの頻度についてはまだまだ調査が必要である と考えられる。
リウマチなどの成人病で素質が原因とみられる疾患については、患者の親はすで に死亡していたり、調査不可能なのことがしばしばである。幸いなことにこの世代 は一組のきょうだい数が多く、患者同胞のみならず非罹病の健康なきょうだいも調 査できることがある。このようなデータについてはきょうだいの標識遺伝子型から 両親の保有した遺伝子を推定して、きょうだい対の標識遺伝子の共有確率を推定す る方法も考えられている(Holmans and Clayton, 1995)。
文献
- Davies JL, Kawaguchi Y, Bennett ST, Copeman JB, Cordell HJ, Pritchard LE, Reed PW, Gough SCL, Jenkins SC, Palmer SM, Balfour KM, Rowe BR, Farrall M, Barnett AH, Bain SC and Todd JA, 1994. A genome-wide search for human type 1 diabetes susceptibility genes. Nature 371: 130-136.
- Day NE and Simons MJ, 1976. Disease susceptibility genes – their identification by multiple case family studies. Tissue antigens 8: 109-119.
- Field LL, Tobias R and Magnus T,1994. A locus on chromosome 15q26 (IDDM3) produces susceptibility to insulin-dependent diabetes mellitus.Nature Genetics 8:189-194.
- Holmans P and Clayton D, 1995. Efficiency of typing unaffected relatives in an affected-sib-pair linkage study with single-locus and multiple thightly linkage marker. Amer J Human Genet 57: 1221-1232.
- Komatsu Y, 1952. Probablistic-theoretic investigation on inheritance. 7.Non-paternity problems. Proc Jpn Acad 28: 102-125.
- Lange K, 1986. The affected sib-pair method using identity by state relations. Amer J Human Genet 39: 148-150.
- Penrose LS 1935.The detection of autosomal linkage in data which consist of pairs of brothers and sisters of unspecified parentage. Ann Eugen,Lond 6:133-138.
- Ryder LP et al. 1979. Adv Exp Med Biol 119:4-50.
- Thomson G 1986. Determinating the mode of inheritance of RFLP-associated diseases using the affected sib-pair method. Am J Hum Genet 39: 207-221.
- Thomson G and Bodmer WF 1970. The genetics of HLA and disease associations. In Measuring Selection inNatural Population (eds FB Christiansen, T Fenchel and O Barndorff-Nielsen), pp 84-93. Copenhagen: Munksgaard.
- Yasuda N, 1986. Handy formula for calculating the probbility of parentage exclusion. Jpn J Human Genet 31: 113-114.
- Yasuda N and Sasazuki T 1982. Affected sib pair method for searching major gene in multifactorial disease. Jpn J Human Genet 27: 295-311.