第27回 スタンフォード大学でのポストドグⅡ(02/01/2006)

10. スタンフォード大学でのポストドグⅡ

カヴァリ博士の院生向けの人類集団遺伝学の講義を聴講する機会があったが、Cultural Inheritanceの数理モデルには従来の集団遺伝学理論を含めてさらに飛躍する意気込みが伺えた。親から子どもへと遺伝子は伝わるというのが原則であるが、文化の伝播はその逆方向の子どもから親世代へ、さらには文化を共有する小集団内のどのメンバーにも広がる。したがって「進化速度」は遺伝子よりはるかに速いであろう。学問という文化もこのようにして発展していくのかとも考えさせられた。

様々な社会性の要因の結果である姓氏の分布はその解析的表現は容易でない。経験的に、縦軸に姓氏の種類(k)、横軸に同じ姓氏の人数(m)を両対数用紙にプロットすると、ほぼ直線になる。興味深いのは左上から右下に向かう直線はmが大きくなるにつれて竹箒の先のようにプロットされた点のばらつきが大きくなることである。この直線部分はいわゆる Zipfの法則に合っている(Yasuda N & Saito N, 1984. Biology and society 1: 75-84)。しかし、この記述的な表現よりはむしろ確率モデルを用いたい。確率分布としてまず候補に挙がるのはフィシャーの対数列分布(fisher RA, 1943. J Anim Ecol 12:42-48)か、t検定でよく使われるスチューデント分布である。ところが、ここで一つ問題になるのは、集団構造を理解する上で必要なパラメータの同姓率が確率分布の2次のモーメントであることである。Zipfの法則を確率分布で表すと、いわゆる離散型パレト-分布で、1/kc+1の無限限項の和(k=1,2,…,∞)である。この級数はc>0ならば収束するが、c≦0では発散する(リーマンのζ関数)。ところが2次のモーメントが収束するにはc>2という条件が必要となる。イギリスの小集団9つのうち1地区ではc=1.76となり(Fox WR & Lasker GW 1983, Hum Biol 51,81-87)、同姓率の期待値は求められない。この例外となる集団の大きさは他の8集団より一桁オーダが大きいことと9集団をプールしての結果もc<2となるから、離散型パレトー分布は小集団では使えるのかもしれない。

t分布の2次のモーメントは直線の勾配によって収束したり、しなかったりする。一番簡単なコーシー分布は分散が発散することでよく知られている。2次のモーメントが無限大では同姓率の期待値としてはどうしようもない。

そこで、集団遺伝学の中立突然変異の離散型モデルを姓氏の分布に応用することにした。離散型分布としてKarlin S & McGregor J, 1967. Proc Fifth Berkeley Symp Math Stat Prob 4: 415-438を用いた。各姓氏の期待頻度Nsはガンマ関数、デイガンマ関数を含む形なので、理解し易くするため集団の大きさNと姓氏の移動や変化を表すνパラメータの関数として数表にした。この分布の期待同姓率は

 I=1/(Nν+1-ν)

となるから、観察同姓率Σ(Ns/N)2と比較することができる。姓氏の分布ならびに同姓率の推定については北部イタリアのパロマ谷の教区の資料を分析し、中立突然変異説で記述することができた。その後このラインの研究は2回のシンポジウム(Human Biology 1983; 1989、Rivista di Anthtropologia 1996)でまとめられている。

集団遺伝学のテキストを開くと、必ず最初に遭遇するのがハーデイ・ワインバーグの法則である。日本語のテキストではこれをハーデイ・ワインベルグの法則としているのが多々ある。「ワインは英語読み、ベルグはドイツ読みで何ともしまりがつかない。」最近講義の際に聴講生から受けた質問である。ハーデイGHはイギリスの数論を盛り上げた泰斗でインドの天才数学者ラマヌジャン(1887-1920)を見出したことでもよく知られている。「2143/22の四乗根がπの小数点8桁まで正しい近似値」なんて! しかも2つの数値を電卓で入力したあと平方根キイを2回たたけば答えが出てくる。今日の電卓の開発まで予想していた?! 応用数学を嫌い、「実務に役立たない学問」を身上としていたハーデイは、まったく専門外の領域(遺伝学)のたった一つの(応用数学的?) 論文で、メンデルと同様に後世に名を残したのは皮肉である。ワインバーグはドイツの産科開業医である。人類統計遺伝にも幾多の貢献があるが、健康な両親に生まれた小人症、アコンドロプラジア症(優性遺伝)の患者が末子に多いことから、突然変異ではないか(Weinberg W, 1912)と指摘している。これは後にペンローズ(Penrose 1955)により父親年齢と関連のあることが明らかにされた。今日突然変異は細胞分裂の際のDNA複製の誤りであることが分かっているが、年齢効果から考え付いたすばらしい洞察力である。

ハーデイ・ワインバークの法則は任意交配の行われている無限大の集団で遺伝子型の頻度が常に

p2:2pq:q2           (1)

の比となることを主張している。ここでp、qは対立遺伝子頻度である。この状態は安定でしかも親世代で遺伝子頻度に性差があったら次の世代で平均化され安定になるという特徴がある。ここで任意交配でなく近親交配(いとこ、二重いとこなど)の存在を認めると、遺伝子型の頻度は

(1-f)p2+fp: 2pq(1-f): (1-f)q2+fq      (2)

となる。ここにfは近交係数である。育種家は個々の遺伝子が目的の形質を示す遺伝子とそうでない遺伝子に数値を割り当てる(0,1形質)。そうすると任意交配のパターンを2×2分割表の形にまとめて、形質の相関係数rを上記の遺伝子型分布を用いて求めることができる。その結果はr=f、すなわちfは形質の相関係数を表す。

視点を変えて集団がいくつかの分集団で構成されているとしよう。例えば2分集団でそれぞれの遺伝子頻度はp1:q:1、p2:q2、遺伝子型頻度はp12:2p1q1:q12、p22:2p2q2:q22とする。全集団の遺伝子頻度はp=(1/2)p1+(1/2)p2:q=(1/2)q1+(1/2)q2。遺伝子頻度の分散をσ2とすると、σ2=(1/2)(p12+p22)-p2 = (1/2)(q12+q22)-q2 と表せるから、遺伝子型の頻度は p22:2pq-2σ2:p22:となる。ここでσ2=pqf、すなわちf=σ2/(pq)とおけば(2)の形が得られる。これを進化の過程の途中の世代での観察とみて、過去のある世代の集団の創始者(ヘテロ接合)からスタートし、毎世代の遺伝子頻度に機会的浮動が起こっているモデルを考えてみよう。毎世代頻度の異なる分集団が生成されていくが、さらに将来の世代の分集団を考えると遺伝子頻度は最終的にはp:q=1:0か0:1のいずれかに落ち着く(固定または消失)。このときの遺伝子頻度の分散はpqである。したがって、進化の途中で観察される分散と進化の最終段階での分散との比がfとなっていることが分かる。このfをfST で表す。fST は進化途上の集団がどのくらい分化しているかを表すパラメータである。なお、このモデルは分集団の大きさが等しくなくても、また分集団の数がいくつあっても成り立つことが容易に証明できる。

パラメータfがいくつかの異なる状態を表すパラメータであることがこれでよくわかる。 どの場合でも遺伝子型頻度という結果は同じである。このことは量子力学の問題として光が波であり粒子であると推論するのに似た論法である。シュレディンガーの波動方程式は光には波の性質があることを示し、ハイゼルベルグの運動方程式は光が粒子の性質を持つことを示している。ここでの違いは表現法が(演算子か行列)だけなのである。光の実体は両方の性質を兼ね備えている! 人類にはまだ解き明かせない真理がたくさんあるのだ。

ヒトの移動パターンの確率モデルについての考察をした(Yasuda N, 1975. Theoretical Population Biology 7: 156-167)。各人の出生地を調査し、父子と母子の出生地間距離をもってヒトの1世代での移動の指標とした。配偶者間の出生地間距離も親縁係数との関わりで調査した。考察した確率モデルは次のように単純化したものを考案した。各人の移動はランダムウォ‐クとし、子どもが生まれた時点でランダムウォ‐クはストップとした。したがってランダムウォ‐クの距離はストップまでの時間が変数の関数で表せる。ランダムウォ‐クは2次元正規分布、ストップまでの時間はカンマ分布(もっとも簡単なのは指数分布?) を仮定して、時間について分布の畳み込みを行うと第二種の修飾型ベッセル関数で表されるKb分布がえられた。イタリアのパロマ谷の隔離集団でその適合性を調べたが、合わなかった。ヒトがランダムに移動することは微視的にみたらあり得ないことあろうが、ヒトの移動を確率的に考える第一歩とし、今後の研究を期待したい。やり残した問題の一つである。

学位論文では経験的に2パラメータの確率密度関数を用いて、交配型の出現頻度を多型遺伝子頻度と親縁係数の関数で表せることを発表したが、遺伝子頻度の機会的浮動のある有限集団での交配頻度をモーメント法で求めた(Yasuda N, 1973. In Genetic Structure of Population (Ed NE Morton) Univ Hawaii, Pp 60-65.)。移動や突然変異があると、定常状態での確率密度はベータ関数で表されるが、これもモーメント法で確認した。

当時の研究ノートを見ると、スタンフォードではヒト集団構造の確率モデル化を果敢に考案していた。イタリアのデータが使えることもあって、考案したモデルのデータへの適用を図っていたようである。複雑な特殊関数の利用とそれらの数値計算に果敢にアタックしていた。確率モデルがあり、それに対応するデータがあれば、その両者を繋ぐものはフィッシャーの最尤法である。カウント法による遺伝子頻度の推定値は最尤推定値であることはすでに分かっていた。複雑な数値計算を我流でプログラムをコンピュータに入力していた。有効数字の問題、桁落ちや、級数の何項までとればよいのか、漸化式をどちらの方向から計算したらよいのか、など等、文献やマニュアルを探すのにも大変であった。コンピュータのアウトプットと数表を照らし合わせて何桁かの有効数字が合っていればよしとしたこともあった。生もののデータを扱っているのである。21世紀に入り、コンピュータの使い方もずいぶんと変わった。データも大型化した。プログラミングも既存のサブルーチンやモヂュルを組み合わせて、構築しているようである。品質管理のようにルーチン化したデータ処理ではそれでもよいのかもしれないが、我流はどちらかというとサブルーチンを作る立場で苦しんだ。

学生であったハワイでは、電卓で平均値や分散の計算をするとき必ず2回以上異なる順序で数値を入力して行っていた。2回やって答えが合えばそれでよしとしていたが、考えてみれば2回とも間違っていたかもしれない。使い込んだ電卓なら、その内臓ソフトを信用してもよいだろう。そこまで疑ったら何もできなくなる。今日のパソコンや大型のデータ処理にいつ頃になったら慣れて信用できるようになるのか、たわごとかもしれないが本人は真剣である。とりわけ繰り返しが何度も重なる計算では「有効数字は大丈夫?」とよけいなことかも知れないが、心配である。そういえば生物実験の確認でもin vitroは必ずしもin vivoではないと言われる今日この頃である。in silcoに疑問を持たずにin vivoとして受け入れる人がいるのはどう考えたらよいのだろうか。

Dr C Stern博士をバークレイに訪ねた。ハワイのDr L Snyderの先生である。徳永千代子さんがおられ、今はスターン先生の秘書とのこと。ご自宅はGoldscmitt博士の旧邸宅とか。案内してもらった。 遺伝研のゴールドシュミット文庫はこの先生の寄付であったとか。最初に三島へ行ったときこの文庫にずいぶんとお世話になったことを思いだした。このときスターン先生の人類遺伝学(第3版)の翻訳について徳永さんから相談を受け、それではと後日にすでに初版を翻訳された東京医科歯科大学の田中克己教授に連絡をとり、僭越ながら私もお手伝いすることになった。これが私の翻訳の嚆矢となった。

丹羽大貫さんには自動車運転の指導を受けて、大学のグランドをぐるぐる回って免許を取った。サンフランシスコまでのハイウエイを運転させてもらったが、彼の肝をつぶすようなスピードを出したらしい。その後日本に帰って日本の免許に書き換えたが、71歳の誕生日まで一度もハンドルを握らなかった。おかげで無事故無違反、晩年はゴールド免許!60歳以後の身分証明書として活用はしただけであった。気持ち的にはいざとなったら練習したらよいと考えていたが、とうとうそのチャンスはなかった。

笹月健彦さんと知己を得たのもこの頃である。彼はHLAの研究で多くの業績を上げた人である。遺伝疫学の問題解決で多くのアイデアを示唆してもらった。話が淡々としており、分かった分かったと安易に相槌を打とうものなら、理解が繋がらなくなる。論理が明晰であるが、こちらの脳がついて行かない。

7月中頃から1ヶ月、グレイハンドのバスで東海岸まで旅行した。1ヶ月99ドルの留学生向けのサービスを利用したが、最終的には40日ほどになってしまった。アメリカ合衆国は途方もなく大きいことがよくわかった。。途中、Dr A Cambel、平泉雄一郎先生ご夫妻、向井輝美教授、根井正利教授、GW Lasker教授、J Scandalios助教授、Kelso教授などの友人知人を訪ね、セミナーや談話などを重ねた。ルートはMenlo Park→UCLA→Las Vegas→Grand Canyon→Flagstaff→Phonix→Tuson→El paso→(Mexico)→El paso→Austin→Houston→Atlanta→Raleigh→New York→Brown University→Detroit→Boston→Niagara fall(Canada)→East Lansing→Chicago→Cheyenne→Denver→Salt Lake city→Yellow stone National park→Salt lake city→Reno→Sao Francisco→Menlo parkである。この旅行記は資料が拙宅の書庫のどこかに埋没しており、現時点ではきちんと書くにはあまりにも断片的である。なんとか探し出して、後にこのフォーラムで発表したいと考えている。

この旅行で得た一つ確かなことは「人との出会いと別れを大切に」ということであろう。これだけ広い大地をバスで駆け巡ると、知人他人を問わず、言葉をかわすことで暖かな気持ちになる。自然は強烈で荒々しいし広々し過ぎるから、本当に一期一会である。

この感覚は大事にしたいと思う。