基礎の遺伝疫学講座   安田 徳一 (2008/07/01)

ヒト集団の多様性の統計的性質を扱う研究分野は集団遺伝学の知見をヒトへ適用することで、往時は人類集団遺伝学と呼ばれていた。多様性の原因は遺伝にあるとする考え方が主流で、環境要因については別に疫学という領域があった。その自然の成り行きで遺伝と環境の両原因を同時に配慮した学問領域が要請されるようになり、いわゆる遺伝疫学なる学問が興った。本講座はその一つの流れとしてモートン教授Prof Newton E Mortonを中心とするグループの貢献についてまとめた。私事になるが1961年から5年の間、私はモートン教授のPh.D学生として師事した。当時、モートン先生はウィスコンシン大学からハワイ大学へ所属が変わり、その間に「ブラジル調査プロジェクト」を行っている。研究面では遺伝的荷重の推定、連鎖分析のロッド値法の開発、分離比分析の開発から集団構造の研究へと遺伝疫学の骨組となるパーツを創る途上にあった。ホノルルでは非メンデル性疾患のしきい値モデルの開発に着手していた。私は遺伝疫学の萌芽期の展開を幸いにも垣間見ることができた。この講座では「分子遺伝疫学」に至るまでの遺伝疫学の展開についてその全体と迄はいかないが述べたいと考えている。

 

1. はじめに

 疫学epidemiologyは本来感染症の爆発的流行が時間、地域あるいは特定の集団に集中して起こることをあらわす「流行」epidemicという現象に対処する学問領域である。学問の進歩により工業化社会では公衆衛生面での感染症との関わりが少なくなり、慢性疾患に関心が持たれるようになってきた。疫学と遺伝学が一緒になってその目標や方法を考えることが望ましいし、また当然ながらお互いに避けて行くわけにはいかないであろう。  血縁者間や集団での遺伝性疾患の病因、分布それに疾患のコントロールを扱う学問領域を「遺伝疫学genetic epidemiology」という(Morton 1967)。  遺伝疫学は集団遺伝学から分岐したともいえる。その創始者はハーディ・ワインベルグの法則で知られているワインベルグWeinberg(1908)である。彼は二卵性ふたごが生まれる遺伝様式を明らかにする目的で、性の違うふたご(二卵性)を出産した女性の母、娘それに姉妹でふたごを出産した頻度を調べ、その期待値を求めるための集団での一般法則を求めようとした。その法則を用いて二卵性ふたごを生む遺伝様式を優性、劣性あるいは血縁の程度によらない等確率であるかを検討して「劣性遺伝ではないか」と推論している。ハーディ・ワインベルグも法則に関しては、1908年の1月13日に口頭発表し、その年の秋までには印刷された。一方、ハーディ(Hardy 1908)の論文は4月5日にアメリカのサイエンス誌に受理され、7月10日に印刷公表されている(Stern 1943)。本来ならワインベルグ・ハーディの法則と呼んでしかるべきであろうが、これも世の習いの一例であろう。  当時はメンデルの法則が再発見されて間もなくの頃で、遺伝inheritanceは交配実験で確かめるのが普通であった。ワインベルグは産科医の現場から、ヒト遺伝の研究、特に病理形質についての交配実験は不可能であることから、血縁者の対を調べること、また家系調査にしても患者を発端として調べるので、劣性形質では患者の分離比が大きく偏るいわゆる確認の偏りascertainment biasを補正することが必要であるなど、動植物での交配実験の替わりとなる数学的方法を提唱してその後のヒトの統計遺伝学の萌芽的研究に手をつけている。  家族や集団で子供が親から継承するgenetic transmissionのあらゆる数学的性質をひっくるめて研究する分野は遺伝疫学に相当するが、初期のころは集団遺伝学の一部分であった。分化がはじまったのはCC LiのIntroduction to Population Geneticsのテキストに表れている。初版(1948)の第1章は分離比分析で始まっているが1954年版では「この章の内容は以後の章の課題と全く異なるので省略する」とコメントしている。その後しばらくしてNeel & Schull(1954)はその時代の健康に関する問題を扱う新しい領域として「疫学的遺伝学」epidemiological geneticsという領域に触れている。興味深いことにはこの本の日本語訳が3年後に出版されているが、殆ど読まれなかったのではなかろうか。後に遺伝疫学genetic epidemiologyという用語の方がよいのではないかということになった。ある形質の家族集積性はその一部が環境要因によるもので、遺伝疫学研究の一部は遺伝要因と環境要因を分ける作業ともいえる。  ワインベルグは「ハーディ・ワインベルグの法則」を一座位複対立遺伝子のモデルに拡張し、さらに複座位にまでにも及んでいる。当時は連鎖という考えはなかったのだが、独立な2座位の配偶子頻度は子どもの世代で平衡にはならず、そのずれの頻度は親世代の半分になることを明らかにしている(Weinberg 1910)。すなわち1座位のそれとは異なり、2座位の配偶子頻度は1世代で平衡状態にはならない。これは一般にJennings(1917)が最初に報告したとされているが、7年も前にワインベルグがすでにドイツ語で発表している。同じ論文でワインベルグは血縁者間の相関についても考察しており、記号はともあれフィッシャーの有名な論文Fisher(1918)に先立つこと8年である。  ワインベルグの多くの方法は今日ごく当たり前の事柄であるか、その後の発展では時代遅れとなってしまった。優性遺伝をする四肢短縮症の観察で、正常な両親から生まれる子どもで罹患するのが末っ子に多いという事実を新しい突然変異で説明しようと試みている。「もし出生順位の精密な解析によって末子での高い発生率が真に本当であることがわかれば、突然変異が原因で四肢短縮症が生じるといえよう」Weinberg (1912)。これについては今日分子遺伝技法で精密に解析されるようになった。当時、突然変異については漠然とした考えでしかなく、ワインベルグがどの程度理解していたかは定かでない。ショウジョウバエでの研究がようやく始まった頃である。またワインベルグは母親年齢、父親年齢、子どもの出生年齢の区別はしていない。ペンロースが初めて父親年齢をそのリスク因子として指摘したのは40年後である(Penrose 1955)。 今日の突然変異の理解は、塩基置換による突然変異はDNA複製に依存するが、欠失あるいは重複はDNA複製に依存しないので親の性や父親年齢とには関連がみられない。

 

1.1 初期の研究

 個体を単位とする遺伝の基礎はまず数学的方法(Weinberg、Hardy)と実験(Johannsen)によって展開された。一方、対の個体を単位とする方法がすでにヒトで開発されていた。ゴールトンによる相関係数と回帰の考え(Galton 1889) が定式化されている。連続形質と離散形質のいずれもがメンデル遺伝で説明できることはフィシャーによって数学的に示された(Fisher 1918)。その一つの結果として、同胞相関が親子相関より高いことから環境効果よりドミナンス効果(対立遺伝子の相互作用)を強調する風潮を生むことになった。  家系分析は核家族(両親とその子ども達)に限定され、交配型ごと別々に2つのパラメータ、分離比(p)と確認の確率(π)でモデル化された。ワインベルグの先駆的モデル(Weinberg 1912b)に最尤法がホールデンHaldane (1932)によって適用されたが、多くの遺伝病はほぼ完全浸透の1座位2対立遺伝子モデルに当てはまることで十分であった。罹患した子どもが1人(単離例isolated case)の核家族の期待値から、ホールデンは突然変異、表現模写、あるいは劣性遺伝子がヘテロ接合でまれに発症する孤発例sporadic case(x)の割合を求めた(Haldane 1949)。  連鎖分析は無作為に選んだ2座位で行われた。次第に効率を上げて行ったが、Bernstein, Weiner, Haldane, Fisherは対照となる交配がなくともヒトで連鎖を見つけることが可能であることを示した。ペンロースは対のきょうだいでメンデル遺伝をしない形質についても適応できる方法を提案している[Penrose(1935)]。フィッシャーの最尤法によるu-得点u-scoreは簡潔さという点で優れていた(Fisher 1935)。いくつかの第T種の誤りが報告されたが、有意水準の選び方が適切でなかったり、大標本理論を適用したことなどで連鎖はなかなか見つからなかった。  集団構造の基礎となるモデルは20世紀の前半でほぼ工夫された。ライトの階層構造モデルは結合する配偶子間の相関係数で表されたが、その特徴は負の値も許容する点にある。ワールンドの分割モデルは部分集団の遺伝子頻度の分散で表されている。コッターマンは家系図での確率モデル(Cotterman 1940)を初めて工夫した。マレコーMalecot(1948)は個体間の親縁係数を定義し、さらにその世代と地理的距離との関係を定式化したが、数学的理論に止まった。同姓率isonymyは既に工夫されており(Darwin 1875)、集団の混合population mixture(Bernstein 1931)や近親婚の影響(Arner 1908, Bemiss 1948)の研究が始められていた。近親婚とまれな劣性遺伝病の関連はアルカプトン尿症で示された(Garrod 1908)。フィシャー、ライト、ホールデンらにより開発された進化理論は突然変異率の推定を可能とし、ホールデンHaldane(1935)はその方法を伴性と常染色体優性遺伝子に適用した。後にNeel他(1949)は劣性の鎌状赤血球遺伝子へ適用した。当時脊椎動物の突然変異率の推定値はこれらだけであった。  

 

1.2 二十世紀後半の発展

 第2次世界大戦が終わると、とくに人類遺伝学の分野の発展は目覚ましい。分子遺伝学、ヒトの細胞遺伝学が生まれ、誘発突然変異に対する懸念から大規模な集団調査が行われるようになった。大量のデータとコンピュータやコストの高い機器の使用はその処理に新しい局面を開いた。  他人集団の遺伝分析にもいくつかの進展があった。Cotterman (1953)は遺伝子型と表現型の関係を論理的に表すいわゆる正則表現型システムregular phenotype systemを開発し、さらに因子結合システムfactor-union systemへと具象化した(Cotterman(1969))。このモデルは遺伝子頻度やハプロタイプ頻度の最尤推定に有用なことがわかり、したがって遺伝システムについての仮説検定を行うことができるようになった(Yasuda 1969)。このように他の多くの場合も含めて遺伝学は戦後のコンピュータの発展とそれに伴う数値解析の開発の恩恵を受けている。必ずしも代数的近似解を求める必要はなくなったのである。優れた集団遺伝学者が手に負えなかった数多いモデルも実際に使えるようになったのである。研究可能な複雑な遺伝システムについての実務上の限界は対立仮説との判別に必要とする標本の大きさである。量的形質の分布ですら情報を取り出すことができる。歪んだデータの分布を単に機械的に正規分布の和のモデルに適合するようパラメータを推定するのでなく、それぞれ遺伝子型に相当する歪んだ分布の和をデータに適合させて一つの歪んだ分布に対して検定することができる(MacLean et al 1976)。分布の型や表現型への大きな貢献をするmegapheric環境因子による誤りがあるから、当面する推論は家系分析で確かめる必要がある。無作為標本の混合分析commingling analysisは常に発見的heuristicであることに留意したい。量的形質の分離比分析の前触れに過ぎない。このときしきい値からのずれに含まれる情報を失う重大な誤りを犯さないで二分できないことが多い。  量的形質にみられる家族類似性の原因を遺伝と環境に分ける研究が二人1組の血縁者を単位とするデータを用い、ライトによる経路分析path analysis(Wright 1931)が用いられるようになった。排除された障害は次の3つである。(1)社会層、運動あるいはダイエットのようなライフスタイルに関わる方面の易罹性を指標にした養子調査をしなくても、不完全ながらも文化伝達cultural inheritanceを遺伝伝達から区別することができるようになった。(2)社会的なホモガミーhomogamyが配偶者間の相関として記述されるようになった。(3)一群の観察された相関についての仮説の統計的検定法が開発されて、同一のデータセットについてシミュレーションや多重比較で確かめることができるようになった。経路係数法は離散形質にも適用されるようになり、多変量形質や時系列データにまで拡張されている。  コンピュータの導入は電卓に頼っていた限界を吹き飛ばしてしまった。変動分離比と確認の確率のモデルが工夫され有用なことがわかった(Morton 1958)。エルンストン・スチュワートは交配型固有の分離比の替わりに集団パラメータを用いたモデルで核家族にとどまらずそれより大きな家系の分析をする工夫をした(Elston & Stewart(1971))。コンピュータでこの一般性を確かなものとするために、単因子モデルと多因子モデルを別々に考慮することが余儀なくされ、その結果いかなる家族性の傾向をも単因子によると解釈せざるを得なかった。確認の偏りを補正する点については何ら進展がなかった。これは家系分析の問題点として残ることになった(Boehnke & Greenberg 1984)。モートン・マックレーンは確認の偏りを制御するため核家族に限定した主要座位とポリジーン座位を統合したモデルを開発した(Morton & MacLean 1974)。その後ポインターpointerによる確認法を認めて(Lalouel & Morton 1981)、補助的な適合度検定の継承パラメータtransmission parameterを導入する(Lalouel 他 1983)などの工夫で改良を試みた。  連鎖分析では最尤スコア法より好ましい確率比probability ratioに取って替わった。その方が少数の逐次標本への適用が容易である。ホールデン・スミスは標本の大きさを固定した検定法を取り上げた( Haldane & Smith 1947; Smith 1953)。ホールデンのショウジョウバエの遺伝の知見とスミスのベイズの定理に対する考えに引きずられて組換え率の分布を一様としたため、彼らの開発したスコアは相加的にならなかった。その頃戦時機密が解除されて、爆弾の品質管理で開発されていた逐次検定法が公表された(Wald 1947)。そこで用いられているロッド値lod scoreは相加的で逐次標本に都合のよい性質があるので、ヒト連鎖の検出に好都合であることが分かった(Morton 1955)。連鎖群を同定するという利点も見つかった。ロッド値は原著のデータに戻らなくても尤度でよいという性質がある。遺伝子の順位を検定するには多点分析がより強力であることがわかったが、遺伝子順位のマップ距離map distanceを定めるには未だロッド値が有用である(Morton他 1986)。隣接マーカーの分かっている疾患原因遺伝子についての遺伝相談genetic counselingにおいて多重組換え率、特に2重組換え率は有用であると思われるので、多点組換えの理論を開発する必要がありその検定も重要である(Morton他 1985)。この点は実験遺伝学では無視されている。幸いなことに遺伝相談で、干渉interferenceはホールデンが予見した(Haldane1919)ようにコサンビKosambiとカーター・フォクナーCarter-Falconerのレベルの間にある。ホールデンは干渉のないときのマップ関数を提唱しただけでなく、それがショウジョウバエのデータに適合しないことを示した。そして過去50年間に提唱されたどの公式よりも適合のよい経験的マップ関数がよいと言っている。干渉がないとするマップ関数にどの程度の誤差があるのかは議論の余地があるところであるが、そのような誤差は容易に避けられないという事実に概ね議論が一致している。  集団構造population structureは家系図と移動パターンから分析できる。あるいは遺伝子頻度、遺伝子型頻度、人類学上の計測値anthropometricsそれに同姓率isonymyからでも評価できる。数値分類学者は同じような集団を一まとめにするとこれらの方法は位相的に合同であると考える。遺伝学者はさらに集団内と集団間での親縁係数kinship coefficientの推定値が一致することを要請する。マレコーは親縁係数の世代間の関係式が集団の大きさと移動率で表せるモデルを開発した(Malecot 1950)。いろいろの数値を比べるには、家系図から求められる親縁係数は記録されている祖先よりさらに以前の創始者まで遡って外挿する必要がある。バイオアッセイbioassayでは調査地区の最大距離での親縁係数に補正が必要となる。いくつかの測定値から得た結果はほぼ一致した推定親縁係数が得られることがわかった。地区の歴史、民勢学、生態学的観点から一致がみられた。親縁係数は数値分類の生物学的に最も適切な基礎パラメータであり、遺伝子頻度から遺伝子型頻度にも関係があり、さらに近交係数の推定も可能である。近交係数は突然変異・選択の平衡状態で決まるまれな劣性遺伝疾患の発生率に深く関与している。  原子核エネルギーの戦時あるいは戦後の平和利用でヒトの突然変異への懸念が高まった。様々な調査研究から得た推定値は驚くほど一貫しており、自然突然変異率の平均値は20x10-6/座位/世代である。緩被ばくによる倍加線量は1グレイである。この値は急被ばくによる倍加線量がメガマウスの実験から約30センチグレイであることから得られた。倍加線量は自然突然変異率が2倍となる(遺伝では生殖細胞の)被ばく線量で、突然変異率は放射線線量に比例して増えることが知られている。広島・長崎の原子爆弾傷害委員会の調査報告にはこの事実についてあまり触れていない。優性突然変異という任意の仮定なしには周産期死亡や易罹病性のデータは倍加線量の計算に適用できない。オークリッジで行われたメガマウス実験も特定座位の劣性突然変異をヒトで観察される適応度の成分についての観察は行っておらず、したがって結論は得られていない。放射線や化学薬品などの突然変異原に暴露したときの影響を予測する根拠もはっきりしないままである。  遺伝疫学の分野としての集団細胞遺伝学population cytogeneticsはかなり成功を収めている。それは染色体異常により、生存し得ないか重篤の身体障害となるのが全受胎の少なくとも1/12に及ぶという驚くべき発見によるところが大であることによる。胞状奇胎、hydatidiform、卵巣形腫ovarian teratoma、ダウン症候群Down syndrome、それに多くのがんなど様々な疾患は染色体に原因があり、それは正確に診断できるので個人あるいはその血縁者の予後を知ることができる。理解が深まると共に治療法はその病因と深く関わることになろう。  今日、遺伝疫学は分子生物学の急速な進展に同化しつつある。完全な連鎖マップや疾患座位の分子的定義などが約束されている。大きな対立遺伝子は細分割され、連鎖不平衡は遺伝子順位や組換えの情報をもたらすであろう。親子関係や何らかの突然変異の起源が事実上確かなものとして決定できるであろう。これらの進展は分子疫学の領域となるのは明らかである。この基礎講座では以上の話題について、各章で順次にわかりやすく解説していきたいと考えている。

 

1.3 引用文献

Arner GBL: Consanguineous marriages in American population. Columbia University studies in history, economics, and public law 31, 1-99, 1908.
Bemiss SM: Report on influence of marriages of consanguinity upon offspring. Trans Am Med Assoc 11, 319-425.
Bernstein F: Die geographische Verteilung der Blutguruppen und ihre anthropologishe Bedeutung. Comiato Italiano per lo studio dei problrmi della populazione (Rome: Instituto Poligrafico dello stato) , pp 227-243, 1931.
Boehnke M & Greenberg DA: The effects of conditioning on probands to correct for multiple ascertainment. Am J Hum Genet 36, 1298-1308, 1984.
Cotterman CW: A calculus for statistic-genetics, Ph D thesis, Ohio State University, 1940. Reprinted 1974 in Genetics and social structure (ed) PL Ballonoff (Stoudsburg: Dowden, Hutchinson, and Ross).
Cotterman CW: Regular two-allele and three-allele systems Part I. Am J Hum Genet 5, 193-255, 1953.
Cotterman CW: Factor-union phenotype systems. In Computer applications in genetics. (ed. NE Morton). University of Hawaii Press, Honolulu. Pp 1-18, 1969.
Darwin GH: Marriages between first cousins in England and their effects J Stat Soc 38, 153-184, 1875.
Elston RC & Stewart J: A general model for the genetic analysis of pedigree data. Hum Hered 21, 523-542, 1971.
Fisher RA: The correlation between relatives on the supposition of Mendelian inheritance. Trans Roy Soc, Edinb 52, 399-433,1918.
Fisher RA: The detection of linkage with dominant ‘dominant’ abnormalities. Ann Eugen, London 6, 187-201, 1935.
Galton : Natural Inheritance. MacMillan, London, 1889.
Garrod AE: Inborn errors of metabolism. Lancet ii、1-7, 1908.
Haldane JBS: The combination of linkage values, and the calculation of distances between the loci of linked factors. J Genet 8, 299-309, 1919.
Haldane JBS: A method for investigating recessive characters in man. J Genet 25: 251-255, 1932.
Haldane JBS: The rate of spontaneous mutation of a human gene. J Genet 31, 317-326, 1935.
Haldane JBS & Smith CAB: A new estimate of the linkage between the gene for color blindness and hemophilia in man. Ann Eugen London. 14, 10-31, 1947.
Haldane JBS: A test for homogeneity of records of familial abnormalities. Ann Eugen, London 14, 339-341, 1949.
Hardy GH: Mendelian Proportions in a Mixed Population. Science 249-50, 1908.
Jennings HS: The numerical results of diverse system of breeding, with respect to two pairs of characters, linked and independence, with special relation to the effects of linkage. Genetics 2, 97-154.
Lalouel JM & Morton NE: Complex segregation analysis with pointers. Hum Hered 31, 312-321, 1981.
Lalouel JM, Rao DC, Morton NE & Elston RC:A unified model for complex segregation analysis. Am J Hum Genet 35, 816-836, 1983.
Li CC: An introduction to Population Genetics. National Peiping University, Peipin 1948.
Li CC: Population Genetics . University of Chicago, Chicago, 1955.
MacLean CJ, Morton NE, Elston RC & Yee S: Skewness in commingled distributions. Biometrics 32, 695-699, 1976.
Malecot G: Les mathematiques de l’heredite (Paris, Masson 1948). Translated in English by Yermanos, The mathematics of heredity, WH Freeman & Company, San Francisco, 1969.
Malecot G: Quelques schemas sur la variabilite des populations naturelles. Ann Univ Lyon A 13, 37-60, 1950.
Morton NE: Sequential tests for the detection of linkage. Am J Human Genet 7, 277-318, 1955.
Morton NE: Segregation analysis in human genetics. Science 127, 79-80, 1958.
Morton NE & Chung CS(eds): Genetics of International Crosses in Hawaii. Karger, Basel, Switzerland, 1967.
Morton NE & MacLean CJ: Analysis of family resemblance. V. Complex segregation of quantitative traits. Am J Hum Genet 26: 489-503, 1974.
Morton NE, MacLean CJ & Lew R: Tests of hypotheses on recombination frequencies. Genet Res 45, 279-286, 1985.
Morton NE, MacLean CJ , Lew R & Yee S: Multipoint linkage analysis. Am J Hum Genet 38, 868-883, 1986
Neel JV, Kodani M, Brewer R & Anderson RC: The incidence of consanguineous matings in Japan. Am J Hum Genet 1, 156-178, 1949.
Neel JV & Schull WJ, Human Heredity, University of Chicago, Chicago, 1954. (和訳、大倉興司、山本 泉、仲尾善雄、人類遺伝学、医歯薬出版株式会社、1957(昭和32年))。 Penrose LS: Detection of autosomal linkage in data which consist of pairs of brothers and sisters of unspecified parentage. Ann Eugen , London, 6, 133-138, 1935.
Penrose LS: Parental Age and Lancet 2, 312-313, 1955.
Stern C: The Hardy-Weinberg law. Science 97, 137-138, 1943.
Smith CAB: The detection of linkage in Human Genetics. J Roy Stat Soc B 153-192, 1953.
Wald A: Sequential analysis. Wiley, New York, 1947.
Weinberg W: Jahreshefte des Vereins fur Vaterlandische Naturkunde in Wurttemberg, Sututtgart 64, 368-382, 1908. Boyer SH (英語翻訳) Papers on Human Genetics, Prentice- Hall, Inc, Englewood, Cliffs, New Jersey, 1963.
Weinberg W: Wetrage zur Theorie der Vererbung. Archv fur Rassen-und Gosollschafts-biologie 7, 35-49, 169-173, 1910.(第一部の英訳。Meyer K: Further contributions to the theory of inheritance. Quantitative genetics part I., Editor Hill WG, Van Nostrand, New York, 1984).
Weinberg W: Sur. Vererbung des Zwergwuchses. Arch Rassen Ges Biol 9, 710-712, 1912.
Weinberg W: Weitere Beitrage zur Theorie der Verernung. 4. Uber Methode und Fehlerquellen der Untersuchung auf Mendelsche Zahlen beim Menschen. Arch Rassen Ges Biol 9, 165-174, 1912b.
Yasuda N: Estimation of the inbreeding coefficient from Mating type frequency and gene frequency. In Computer applications in genetics. (ed. NE Morton). University of Hawaii Press, Honolulu. Pp 87-96, 1969.