安田徳一{YASUDA,Norikazu}
進化機構の理論的な考察は集団遺伝学の発展へとつながったのであるが、その基礎は1930年代のはじめにフィッシャー(Fisher 1930)、ホールデン(Haldane 1932)、ライト(Wright 1931)によるところが多大である。しかし、メンデル遺伝学とダーウイニズムを結びつけるに際して、ハーマン・マラー(Muller 1962)の名前を忘れてはならない。
マラーはX線が突然変異原であることを最初に示した功績(Muller 1927)で、後にノーベル章を受賞している。しかし、彼の進化機構についての基本的な考えはあまり良く知られていないようである。自然選択による適応進化の基にあるのは遺伝子の驚くべき性質によるのだということを強く述べている。遺伝子は自己複製をするだけでなく、突然変異をしてその新しい形で再び自己複製をする。自然選択は突然変異型の増殖の違いと位置づけている(Muller 1929)。さらに遺伝子は生命の基礎そのものであるとした。これらの考えは当時の生物学者らが遺伝子を交配実験の結果を説明するための「架空の因子」であるとみなしていた時代に提言したのである。マラーは「生命たるゆえんはダーウインの自然選択で進化する潜在力にある」とした。また、遺伝子突然変異はランダムで、通常は有害であって、劇的な突然変異ほどより害である傾向がある、など、今日では常識となっている原則を確立した。ほとんどの突然変異遺伝子は優性の度合がある程度あり、より有害な突然変異遺伝子より弱有害突然変異遺伝子の方がおそらく有害の度合が大きいと予測した。この予測はクロー、向井の仕事によって確かめられた(綜説 Simmons & Crow 1977;Crow 1979)。カーソンによるマラーの伝記(Carson 1981)はアメリカにおける遺伝子の実験的研究の始まりを理解する上でも、またマラーの人柄を知るにも大変興味深い。一読をお進めする。
フィッシャー、ホールデン、ライトが始めた数学的理論は「遺伝子頻度」というパラメータを用いて展開された。進化の過程でのユニットは「遺伝子置換」である。選択は個体あるいは個体群に作用するが、遺伝子そのものには働かない。それでも、親から子どもに伝わるのは本来の遺伝子型でなく一連の多少なりとも独立の遺伝子セット(ゲノム)である。メンデル性遺伝にしたがう種では数え切れない組合わせにしたがって遺伝子(群)が一緒になり、毎世代分離する。遺伝的変化の本質的な尺度となる量は遺伝子頻度の変化である。したがって自然選択の理論は主として遺伝子頻度を扱うことになる。ところが1970年代の初めころまでは遺伝子頻度を観測し、実験的研究をするのがかなり困難であった。たとえば、ウマがタヌキくらいの大きさから今の大きさになるのに要する年数を知ることはできるが、幾つの遺伝子置換が起こったかはほとんど分からなかった。ホールデン(Haldane 1949)は巧妙な方法でこの問題の解答を導いたが、いくつかの仮定は当然ながら推測の域を免れず、したがって得られた推定値に確信はなかった。今日では、ヘモグロビンの進化速度が一千万年あたり1個のアミノ酸の置換え、すなわち10億年に1コドンあたり1個の置換が観察される、ということができる(Crow 1969)。また個人の遺伝子座のうちどのくらいの割合がヘテロ接合であるのか、あるいは種のどれだけが多型であるのか、という問いかけに対しても答える手段をもち始めている。
突然変異は「個体」に生じる事象である。突然変異により、その個体の属する「集団」に新たな突然変異の遺伝子頻度が従来の野生型遺伝子に対して相対的に決まる。その後世代を経過すると、集団中の遺伝子がすべて突然変異遺伝子だけとなることがある。そのときには、突然変異遺伝子は野生型遺伝子と呼ぶようになろう。このとき集団で「遺伝子置換」があったという。強調しておきたいことは、突然変異が個体で生じる事象であるのに対して遺伝子置換は集団で見られる進化事象である、ということである。突然変異遺伝子はその頻度を変えながら世代を経て、遺伝子置換すなわち固定に至るまでの過程をたどる。これが進化のユニットである。この進化のユニットを量的に把握するのが進化学の基本的な考え方である。
それではどのような機構で遺伝子置換が生じるのであろうか。これについては今日、突然変異遺伝子が従来の野生型遺伝子に比べて有利であるというダーウインの自然選択説(表現型レベル、分子レベル)と、突然変異遺伝子の機会的浮動による中立説(分子レベル)とが提唱されている。いずれにせよ、進化モデルの仮説は実験的に検証することが困難なため、ただちに結論を得ることは難しい。まずはタンパク質のアミノ酸配列や遺伝子DNAの塩基配列のデータを用いて検証する方法をみてみよう。
アミノ酸配列や塩基配列を調べることによって、これまでの遺伝の実験が交配可能な範囲でしか出来なかったのが、配列のアライメントalignmentという方法で種を越えた変異を調べることができるようになった。物理、化学のことばで生物の変異が理解できるのである。遺伝子DNAの物理化学的構造から、一遺伝子座の対立遺伝子の数も従来の2個からほとんど無限大とするモデルも現実的である。
ここで簡単に分子レベルの遺伝子の性質と突然変異について簡単にまとめておこう。遺伝子、正確にはシストロンcistronはDNAの4種類の塩基、アデニン(A)、チミン(T)、グアニン(G)、シトシン(C)で書かれた線状のメッセージとみなせる。遺伝子が働くにはこのメッセージが伝令RNAという分子に転写される。この分子にもDNAと同様に4種類の塩基があるが、チミンはなくその代りにウラシル(U)を使っている。伝令RNAの情報はアミノ酸のつながるポリぺプチドに翻訳される。20種類のアミノ酸amino acidがある。ポリリぺプチド polypeptideは折り畳まれて機能のあるタンパク質functional proteinとなる。タンパク質分子は我々の存在を可能とするものであり、チトクロームcなどの酵素、インスリンなどのホルモン、ケラチンなどの構造タンパク質はすべてこのようにして作られる。遺伝情報は連続した3塩基、トリプレットtripletはアミノ酸に翻訳されるコードcodeで、これをコドンcodonという。トリプレットの各位置には4文字が考えられるから、43=64種類のコドンが考えられる。そのうち61は20種類のアミノ酸のコードに使われ、残りの3つは句読点(鎖の終了)として使われる。64種類のコードはすべて解読されている。
標準RNA遺伝暗号表 UUU(Phe) UCU(Ser) UAU(Tyr) UGU(Cys) UUC(Phe) UCC(Ser) UAC(Yyr) UGC(Cys) UUA(Leu) UCA(Ser) UAA(Term) UGA(Term) UUG(Leu) UCG(Ser) UAG(Term) UGG(Trp) CUU(Leu) CCU(Pro) CAU(His) CGU(Arg) CUC(Leu) CCC(Pro) CAC(His) CGC(Arg) CUA(Leu) CCA(Pro) CAA(Gln) CGA(Arg) CUG(Leu) CCG(Pro) CAG(Gln) CGG(Arg) AUU(Ile) ACU(Thr) AAU(Asn) AGU(Ser) AUC(Ile) ACC(Thr) AAC(Asn) AGC(Ser) AUA(Ile) ACA(Thr) AAA(Lys) AGA(Arg) AUG(Met) ACG(Thr) CAG(Lys) CGG(Arg) GUU(Val) GCU(Ala) GAU(Asp) GGU(Gly) GUC(Val) GCC(Ala) GAC(Asp) GGC(Gly) GUA(Val) GCA(Ala) GAA(Glu) GGA(Gly) GUG(Val) GCG(Ala) GAG(Glu) GGG(Gly)
Ala=アラニン(A)
Arg=アルギニン(R)
Asn=アスパラギン(N)
Asp=アスパラギン酸(D)
Cys=システイン(C)
Gln=グルタミン(Q)
Glu=グルタミン酸(E)
Gly=グリシン(G)
HYis=ヒスチジン(H)
Ileu=イソロイシン(I)
Leu=ロイシン(L)
Lys=リジン(K)
Met=メチオニン(M)
Phe=フェニールアラニン(F)
Ser=セリン(S)
Thr=スレオニン(T)
Try=トリプトファン(W)
Tyr=チロシン(Y)
Val=バリン(V)
Term=終了コドン
この注釈で(*)の中の1文字はアミノ酸の1字表記。
逆引きRNA遺伝暗号表はアミノ酸からコドンを推測するもので、同義コドンの推定に有用である。私の知るかぎり、逆引き暗号表はこれが初めてである。
逆引きRNA遺伝暗号表 6コドンアミノ酸 (3) Leu(CU*,UU+) Ser(UC*,AG-) Arg(CG*,AG+) 4コドンアミノ酸 (5) Val(GU*) Pro(CC*) Thr(AC*) Ala(GC*) Gly(GG*) 3コドンアミノ酸 (1) Ile(AU-,AUA) 2コドンアミノ酸 (9) Phe(UU-) Tyr(UA-) His(CA-) Gln(CA+) Asn(AA-) Lys(AA+) Asp(GA-) Glu(GA+) Cys(UG-) 1コドンアミノ酸 (2) Met(AUG) Trp(UGG) {アミノ酸の種類(20)} 終止コドン Term(UAA,UAG,UGA)
‘*’=(U,C,A,G),‘-’=(U,C),‘+’=(A,G)。括弧内のいずれの塩基でも同じアミノ酸をコードする。AUGは配列の5末端では翻訳開始のシグナル、配列途中ではMetをコード。
遺伝子突然変異はDNAのメッセージの変化である。二つのグループにわけることができる。(1)1個のヌクレオチド塩基が別の3種類のどれかに置き換わる(点突然変異point
mutation)、(2)1個以上のヌクレオチド塩基が欠損したり挿入されなり、かなりのDNAセグメントが転座したり逆位となったりする構造上の変化(線突然変異length
mutation)。
塩基置換のほうが構造変化よりかなり多く起きていることが近縁種の相同遺伝子を比べること(alinment)から分かった。換言すれば、ヌクレオチド置換が分子レベルでの進化的に一番起こっている変化である。
進化を分子レベルから理解する上でもう一つ重要な話題は遺伝子の重複である。これについてはOhno(1970)のすぐれた著書があるが、最近では真核細胞生物に特有で大規模な重複構造をもつ多重遺伝子族が話題になっている(Ohta 1980)。これらは直列tandem重複であるが、ゲノムの倍数性polyploidyによる並列重複も生物進化の上で見過ごすわけにはいかない。哺乳類などの高等な真核生物はバクテリアなどの原核生物とは異なった遺伝物質のDNAレベルの変異性をもつことも明らかになりつつある。それ以外にもゲノム内を移動する "動く遺伝子"transposonも広く生物会界に存在する証拠が得られている。
実際に分子レベルで調べた進化上の変化像はネオダーウイニズムからの予測とはかけ離れたものであった。その著しい特徴は次のようである(Kimura & Ohta 1974)。
この速度は、100アミノ酸で構成されるポリヌクレオチド鎖で、28x106年に1アミノ酸の置換が生じるという、控えめな値から求めた。ゲノムあたり、世代あたりの突然変異による置換速度としてのこの値は、ホールデン(Haldane 1957)がすでに求めている哺乳類での値より何百倍も早い速度であるのに木村は気付いた。ホールデンは元々あった遺伝子が環境の変化で不利となり、一方あらたな突然変異は本来は不利であるのが環境の変化で有利となった状況を設定した。そのようなシナリオでの、種における遺伝子置換が起こることによる「費用」cost、すなわち選択死の大きさを求めた。
自然選択により1遺伝子の置換が実行されるのに必要な費用Dは、選択係数とはほぼ無関係に決まり、既存の遺伝子を置き換える突然変異遺伝子の初期頻度によることが示された。すなわち、優劣関係がないときは簡単にD=-2・ln(p)である。ここにDは経過する世代で蓄積する選択死の数、pは突然変異遺伝子の初期頻度である。たとえばp=10−6ならばD=27.6となる。突然変異遺伝子が完全劣性であればDの値はもっと大きくなる。ホールデンはD=30を実際の進化における値として取り上げた。選択がいくつもの座位でゆっくりとn世代あたり平均的な速度で起こっていると考えると、その種の適応度は最適値より30/n低いことになる。すなわち、選択強度はI=30/nである。標準進化ではI=0.1が妥当であろうから、突然変異遺伝子の置換は300世代に1個になる。これで表現型レベルの進化が遅々たることをうまく説明することが出来る。
木村(Kimura & Maruyama 1989)は拡散方程式の方法で有限集団における置換による荷重をホールデンのシナリオに配偶子の機会的抽出の過程を取り入れた計算を行い、次の結果を得た。
D=L(p)=-2・ln(p)+2
ここでp=1/(2N)、すなわち集団の実個体数Nのうち1個の遺伝子がそれまで存在していた対立遺伝子より選択に有利な突然変異をしたとき、その置換による荷重はL{1/(2N)}=2・ln(2N)+2となる(Kimura & Maruyama 1969)。
分子レベルで、もし進化の過程で(積極的に)選択有利な突然変異対立遺伝子の置換が主として起こっているとすると、世代毎の置換による荷重はものすごく大きくなり、いかなる哺乳動物もそれに耐えることは不可能である。たとえば、選択有利な遺伝子の突然変異が10-6/世代なら、p=1/(2N)=10-6から、L(p)=29.6。1世代1年としても荷重は約30である。これは集団の大きさが一定であるとして、2年毎に1個の遺伝子を置き換える(平均の置換による荷重)には、親はexp(15)〜3.27x106 の子どもを産まなければならない。しかもその子どもの1人が成長しさらに子どもを生むのである。
さらに、自然選択(例えば、選択係数s1=0.001)による分子進化の速度を説明しようとすると、有利な突然変異が異常に早い速度で生じる(突然変異率v=0.015)ことになる。世代当たりの突然変異の置換速度kは(4Nes1v)で(ここにNeは集団の有効な大きさである)、例えば、k=3(これは年あたり0.5の置換率に相当する)、2Ne=100,000、s1=0.001としてv=0.015/配偶子/世代が得られる。これは非常に高い突然変異率で、配偶子あたりの致死及び半致死突然変異率の合計に相当する。明らかに、有利な突然変異は有害な突然変異より頻度は低いに違いない。もしkがもっと大きく、Neあるいはs1がもっと小さいと、vはもっと大きくなる。
有利な突然変異がそのように高く、しかも長い進化の過程で一定であることは、自然選択による適応進化の基本原則にそぐわない。有利な突然変異による置換がある度に、次に有利な突然変異が生じる確率は一般に減少すると考えられるからである。ただし環境が劇的に変化するのなら別である。
1966年代には電気泳動法の開発でアイソザイムなど分子レベルの遺伝的多型が観察されるようになった。Lewontin & Hubby(1966)はウスグロショウジョウバエの遺伝子座18個をランダムに選んで、座位当たりの平均異型接合性をおよそ12%、多型の割合が30%であると報告した。同様な結果がヒトでも得られた(Harris 1996)。したがって、これらの生物集団で多数の遺伝子座に頻度の高い対立遺伝子が分離しており、各個体の数百数千の座位でヘテロ接合となっているに違いない。しかもこれらの多型は可視的な表現型でなく、環境条件との相関もない。もしこれらが超優性であるなら、分離による荷重はとてつもなく大きくなり、高等生物が生存することが不可能に近い荷重となる。
これらのことから「進化の過程で主要なヌクレオチド置換はダーウインの積極的な(有利な遺伝子の)選択よりむしろ、選択の上で中立あるいはほぼ中立な突然変異遺伝子の無作為な固定による」という考えがひらめいた(Kimura 1983,p28)。多くの酵素多型は突然変異による対立遺伝子の新生とそのランダムな消失のバランスの結果として存続している。1967年12月に福岡の遺伝談話会において、初めてこの考えを発表し、のちに雑誌Natureに発表した(Kimura 1968)。
中立説は分子進化の問題(例、King & Jukes 1969)だけでなく、集団内のタンパク質の多型や塩基配列の変異をも説明しているのが特徴的である。すなわち、中立突然変異と遺伝的浮動が主たる役割をしている。これら分子レベルで初めて検出された多型変異は自然選択に中立、あるいはそれに近いもので、突然変異による新生と遺伝的浮動による消失との釣合いによって集団中に存続する。したがって遺伝的多型は分子進化の一局面なのである。
遺伝的多型genetic polymorphismはFord(1965)が「一つの種に属する二つ以上の不連続な変位型が同一の棲息域に生じ、そのうち最もまれな型でも再起突然変異と選択との単なる釣合いでは維持され得ない程度の頻度に達している状態」と定義した。この定義はその前提として多型の存続の機構として超優性を暗黙に過程しているきらいがある。今日では次のような定義が受け入れられている。遺伝的多型とは、「同一集団に二つ以上の対立遺伝子が共存することをいうが、対立遺伝子のうちで頻度が最も高いものが99%以上を占める場合は除くものとする。」境界を99%としたのは便宜的なもので、調査された個体数が小さく、20〜30ぐらいのときは95%で境界線を引いた方がよい(木村 1979)。
電気泳動法の開発で同一種内の酵素の変異すなわちアイソザイムisozyme(イソ酵素ともいう)の研究がいろいろの生物について行われた。それらによると、遺伝子座あたりのヘテロ接合の頻度の平均値はショウジョウバエでは8%から18%(中央値は12%)、ヒトでは7%、多型の座位の割合は28%である。マウスではヘテロ接合の頻度の平均が5.6%〜11.0%と報告されている。さらに「生きている化石」というカブトガニのヘテロ接合の頻度の平均値は約6%、多型の座位の割合は25%で、他とあまり違いない値を示すのは興味深い。
ここで調べられたアイソザイムの遺伝子座がゲノムからの無作為標本であるなら、集団内の遺伝的変異がばく大なものであることが考えられる。たとえばヒトでは、構造遺伝子の数は約3万くらいというから、個体あたり約2,000(=30,000x0.07)の座位がヘテロ接合である。しかしこれは過小推定値である。電気泳動法によって検出されるタンパク質の変異は、分子の表面で電荷に違いのあるアミノ酸置換が主なものである。せいぜいアミノ酸の変化の1/3ぐらいである。したがってヘテロ接合である座位の数は個体あたり約6,000になる。また、遺伝暗号には縮重degeneracyがあり、とくにコドンの第3番目ではDNA塩基が置き換わってもアミノ酸に変化の起こらないことが多いから、DNA塩基のレベルでは集団内変異はさらに大きい。
一方、ヒトゲノムのDNA塩基対の数はおよそ30億(3x109)である。塩基部位nucleotide siteあたりのヘテロ接合性の平均はおおよそ0.1%と推定されるから、したがってヒト集団の個体あたりのDNA塩基(父親由来と母親由来)がヘテロである平均数は100万を越えるとみられる(Kimura 1973,1991)。もちろん、DNAのすべてがタンパク質に翻訳される構造遺伝子として働くとは考えられないので、そのような作用を持つ部分は全体の数パーセントかも知れない。それでもDNAのレベルでみると、個体あたり10,000以上の遺伝子座でヘテロ接合の状態にあると考えられる。このようなばく大な遺伝的変異が種内にどのような機構で存続するのかは集団遺伝学の最大の問題である。現在、中立説および選択説とよぶ二つの相反する仮説が提出されており、これをめぐる激しい論争がある。中立説と選択説の論争は集団内変異についてだけでなく、分子進化の機構についても行われている。
異なる生物種の相同タンパク質を比較することによって、遺伝子の内部で突然変異が進化の過程でどの位の速度で種内に蓄積してきたかを推定することができる。たとえば、脊椎動物のヘモグロビン分子はα鎖2本とβ鎖2本で構成されているが、そのうちのα鎖は哺乳動物では141個のアミノ酸がつながっている。これをヒトとゴリラと比較すると、アミノ酸配列はN末端から23番目でゴリラのアスパラギン酸がヒトのグルタミン酸と、1箇所を除きほか140箇所のアミノ酸はすべて一致している。またヒトとアカゲザルでは4箇所、さらに系統的に離れたウシ、ウマ、ヒツジ、ウサギなどと20前後のアミノ酸部位が違っているが、残りの部位ではいづれもアミノ酸は同じである。タンパク質を構成するアミノ酸は20種類あり、それぞれの部位に重複をゆるしてこのうちのどれか一つによって占められることをから、哺乳動物のヘモグロビンα鎖の141部位のうち100部位以上が一致していることは、これらの動物が共通の祖先から由来したと考えるのが最も妥当である。
なお、DNAの小さな重複、欠失による違いは進化の過程で3億5千万年以上も前に分岐したヒトとコイを比較してはじめて観察される。アミノ酸の違いが68部位あるにも関わらず、重複あるいは欠失による相違はアミノ酸部位三つに相当するだけである。一部の脊椎動物の系統とヘモグロビンの分子の進化的変化は次のようにまとめてみた。
古生代 オルドビス期 5億年−4.4億年 ヤツメウナギノ分岐 シルル期 4.4億年−4.0億年 α鎖とβ鎖の重複による分岐 デボン期 4.0億年−3.5億年 コイの分岐 石炭期 3.5億年−2.7億年 二畳期 2.7億年−2.25億年 中世代 三畳期 2.25億年−1.80億年 ジュラ期 1.80億年−1.35億年 白亜期 1.35億年−0.7億年 哺乳類(ネズミ、ウマ、ヒト)の分岐 新生代 0.7億年−0.0億年
αヘモグロビン鎖のアミノ酸の相違(木村・太田,1973)
コイ ネズミ ウマ ヒト 68 67 68 コイ 23 17 ネズミ 18 ウマ
さて、このような資料から、分子進化の速度をどのようにして求めるのであろうか。
例としてヒトとウマのヘモグロビンα鎖の比較をとると、古生物学の研究からヒトとウマの共通祖先が分岐したのは、今からほぼ8,000万年前にさかのぼることがわかっている。両者のα鎖は141のアミノ酸部位のうち18か所で違っており、したがって、進化の過程である一つのアミノ酸部位に置換の起こる率は、平均して年あたり
(18/141)÷(8×107)÷2〜0.8×10-9
となる。これはほぼ10億年に0.8個の変化にあたる。この計算で最後に2で割るのは、共通の祖先から一方ではヒトへの進化、他方ではウマへの進化の二つの経路があって、両方の変化の総計がアミノ酸部位18か所での相違となって観察されているからである。ただし、この計算はおおざっぱなもので、進化の二つの経路でともに同じ部位でアミノ酸の置換が起きた場合の補正がしていない。もし、比較する生物があまり系統的に離れていない場合には、相同タンパク質のアミノ酸の違いが少ないので、同一部位に2回以上置換の起きる確率は十分小さいことが予想され、上述の計算で十分である。
それでは2回以上の変化も考慮した計算法について考えてみよう。二つのタンパク質P1,P2を比較したとき、全体でnaa個の部位のうちdaa個でアミノ酸が異なっていたとする。この二つのタンパク質が共通の祖先タンパク質PAから分岐したとして、その過程でどれだけのアミノ酸の置換が行われたかを推定するのが目的である。ここで問題となるのはP1とP2とを比較したとき、ある一つの部位に違いがあるとしても、これが共通な祖先のPA から分岐した段階で、一方にだけ一つの置換が起こった結果だとは言い切れない。PA からP1 へゆく途中と、PA からP2へゆく途中との両方に置換が起きた場合も、また片方で2回以上置換が起きた場合でも、P1、P2の比較では単にアミノ酸の違いとしてしか確認できない。その上、両方で同一の置換がおこればまったく変化が検出できないが、このような事象はまれにしか起こらないと考ええられるので、無視してもさしつかえない。
重要なのは二つ以上の置換を、どのように推定するかということである。これはヒトとウマといった比較的近い種間を比べるときは問題にならないが、二つの種が遠くはなれていると無視できなくなる。たとえばヒトとコイのヘモグロビンα鎖では、約半数のアミノ酸部位が異なっているので、補正がどうしても必要である。そこで統計的な仮定をもちいることにする。部位数が大きく、置換のおこる頻度がまれであるので、「アミノ酸部位あたりの置換数の分布がポアソン法則にしたがう」という仮定である。分子のうちで重要度が特に高くて、ほとんど変化しない部位は別として、この仮定はほぼ成り立つと考えられる。グロビン分子では、進化の仮定で変わらない部位は五つあり、四つは機能的に最重要なヘムと結びついている。これは合計140部位のうちのごく少数であるから、ここであげた仮定はほぼ成り立っているとみなせよう。
さて、PAからP1とP2の両方向に分化する過程で、一つのアミノ酸あたり平均Kaa回の置換が行われたとする。アミノ酸の合計部位数をnaaとすると、一つの部位に置換が0,1,2,...回起こる予測数は、それぞれ
naaexp(-Kaa)、naaKaaexp(-Kaa)、naa(Kaa2/2)exp(-Kaa)、…
で表わされるから、それぞれの実測した置換の数から「未知」のパラメータKaaを推定することができる。ここでさらにKaaはすべての部位で同じであると仮定する。この仮定を取り外すとポアソン法則が成り立たなくなり(例えば、負の2項分布法則)、推定する必要のあるパラメータが2つ以上になり、数学的な取り扱いがさらに複雑になる。生物学の問題としてやたらに抽象化に走ると問題の本質からはずれることになるから、上述の簡単な仮定に止めて問題を考えることにする。
アミノ酸の各部位で違いが観察された部位数をdaaとすると、naa-daaは違いが観察されなかった部位の観測数である。相違のなかったアミノ酸部位で、観察数と予測数とを等しいと置くと
naa-daa =naaexp(-Kaa)
であるから、pd=daa/naaとおいて、両辺の対数をとって、次の式からパラメータKaaを求めることができる。
Kaa=-lne(1-pd)=-2.3log10(1-pd)
ここで求めたKaaは統計学でいう最尤推定値になっている。ここでKaaの標準誤差σKは次のようになる。
σK=√[pd/{(1-pd)naa}]
たとえばヒトとコイのヘモグロビンのα鎖の比較では、重複または欠質によって異なっている3個のアミノ酸部位を除き、naa=140、daa=68だから、上式からKaa=0.665±0.008が得られる。
このようにして推定したKaaの値は、二つのタンパク質P1、P2が共通の祖先PAから分化する仮定でそれぞれT時間の間に置換したアミノ酸の部位あたりの総数で、合計2Tの時間にわたる変化である。したがって、単位時間あたり,アミノ酸あたりの置換率は
kaa=Kaa/(2T)
となる。ヒトとコイの比較では、両者は共通の祖先からデボン紀(今から約3億5千万年から4億年前)に分かれたと古生物学の研究から推定されており、いま仮に2T=7.5x108(年)とおけば、
kaa=8.9×10-10
が得られる。もしデボン紀の始めに分岐したのであれば、2T=8×108で、kaaの値は8.3×10−10となり、少し短くなる。これらの値が、ヒトとウマの比較から得られた値とほぼ同じなのは興味深い。ヘモグロビンではおおよそ、平均して一つのアミノ酸部位で置換の起こる割合は10億年に1回(10-9)である。
この方法で脊椎動物に属する各種の生物のヘモグロビンのα鎖、β鎖及びα鎖とβ鎖の間の変化について、1年あたりのアミノ酸部位あたりの進化における置換率を求めてみると、どの比較からもほぼ10-9という値になる。表現型レベルで急速に進化している生物群でも、また何億年間もほとんど変わらないものでも、「分子レベルでは進化の速度はほとんど同じである」というおどろくべき結論が得られる。また世代の長さも影響がないようにみえる。このような速度の一様性は、分子進化の最も著しい特徴の一つである。
同じ計算を別の分子のチトクロームcについて、菌類からヒトにいたるまでの広範囲の生物群について行なっても、やはり置換速度はほぼ一様である。ただし速度はヘモグロビンの約1/3である。この一様性により、現存種の間でアミノ酸の配列を比較することで、化石のし両がない場合でも、信頼のおける系統樹をつくることができる。以下に異なった数種のタンパク質分子について推定した進化速度を示す。最も速いのはフィブリノぺプチドで、最もおそいのはヒストンH4である。両者の間には1,000倍に近い開きがある。
いろいろなタンパク質の進化におけるアミノ酸あたりの1年あたりの進化速度(Kimura 1983)
タンパク質 アミノ酸当たりの置換率(×109) フィブリノぺプチド 8.3 リボヌクレアーゼ 2.1 リゾチーム 2.0 ヘモグロビンα 1.2 ミオグロビン 0.89 インスリン 0.44 チトクロームc 0.3 ヒストンH4 0.01