第13回集団遺伝学講座を送ります。 今回はポリジーンの分子遺伝学的な解釈のレビュウーを紹介します。 これまで量的遺伝はモデル的で生化学的な裏付けがあまりなかったようです。 ただしこれも一つの見解でおおいに議論の余地はあると思います。 |
量的形質の遺伝学は二つの前提に基づいている。
1.量的形質を決めている遺伝子と定性的形質を決めている遺伝子とその遺伝情報が塩基配列にコードされているという点では同じである。 違いは明確な表現型の相違が現れないというに過ぎない。 それらが構造遺伝子なのか、調節遺伝子なのか、反復配列なのか、小さな付加なのか欠損なのか、分子遺伝学でわかっているDNAの変異なのか、あるいはまだみつかっていないものなのか。 最近考えられているトピックスの一つを紹介しよう。
変異の多様性は量的形質の(平均値に近い個体がより多くの子どもを残し両極端の数 値の個体ほど子どもの数が少ない)安定型選択と高い頻度の有害でない突然変異の釣合で保有されているという仮説がある。
この考えを支持する因子をゲノムに探すとしたら、次の性質を満たしている必要があろう。
これらの条件を満たす要素として、単純反復配列simple sequence repeats SSRsが候補に挙げられる。
単純反復配列SSRsとは比較的短いヌクレオチド配列、たとえばTCCTCCTCCTCCのような縦列反復配列である。 SSRsが6つまでの塩基から成るものをマイクロサテライトmicrosatellitesと言い、もう少し長い60塩基程度の塩基から成るものをミニサテライトminisatelitesと言う。 マイクロサテライトの反復数は2〜3から20〜30であるが、ミニサテライトは50〜60から数百の反復モチーフmotifsから成る。 興味深いことはSSRsは非反復配列よりも突然変異率が著しく高いことである。
真核生物のゲノムの非コード領域はそのほとんどがSSRsの様相を示す。 この領域にはSSRsが広く分布してをり、ランダム配列の5ないし10倍もあるという。 ヒトも含めた哺乳類のゲノムのコード領域にもトリプレット反復triplet repeatsと称する3塩基SSRsが見つかっている。 このような分布状況から、SSRsはほとんどの遺伝形質に関わりのある因子と言えよう。
20以上のグルタミンのpolygulutamineや10より多いプロリンのpolyprolineの配列が少なくとも67種類の転写因子で見つかっている。 たとえばヒトのTATA結合タンパク質やいくつかの種でのアンドロゲン受容体、イーストのGAL11、SNF5遺伝子、それにショウジョウバエのNotch遺伝子などがコードするタンパク質があげられる。 これらはいずれも正常な機能に重要であることは、進化的にもいくつかの種でみられること、DNA結合タンパク質により転写が活性化することからも言えよう。 最近ではポリグルタミンの伸長はヒトの神経変性疾患の原因としても知られている。
非コード領域のSSRsも機能的に重要である。脳のmRNAも翻訳開始シグナルの上流にCGG反復のある遺伝子が豊富である。 ヒトの脆弱X精神遅滞に関わるFMR1遺伝子の5'側非翻訳領域(5'UTR)はほ乳類放散の1億5千万年にもわたって保存されてきている。 さらに、poly(T),poly(C),poly(TG),poly(TC) いろいろなhomopolymeric trinucleotide配列、poly(TCCC)、Jeffreys型ミニサテライトなどの様々なSSRsが核タンパク質と結合することがわかっている。
SSRsが転写の活性因子である直接の証拠として、SSRsがプロモータ領域の上流にあると発現ベクターで転写活性がみられるが、SSRsを除くと著しく転写活性が減少することが挙げられる。 SSRsが転写活性に関して、SSRsを挿入する実験も行われている。
マイクロサテライトの反復数の変異は本来DNA複製に際してストランドの誤対合によるずれの小変化のようである。 一方、ミニサテライトに於ける縦列反復の数ははもっと複雑な遺伝子変換gene conversionによると考えられる。 SSRsの高い易突然変異性は新しい対立遺伝子の現れる確率が高いことを意味し、種あるいは集団の高度な多型を説明できる。 対立遺伝子数の無限大モデルの一つである。
SSRsの反復数と関与する遺伝子の転写活性に関係がある最初の報告はイーストのADR2である。 2つのconstitutive突然変異遺伝子のプロモ−タ領域には、通常は(T)20であるのが(T)53、(T)54となっており、Adr2pのレベルが5倍も高いことがわかった。 この他にも同様な関係がいくつもみつかっている。
反復数の影響はタンパク質のポリグルタミン配列の機能にも現れている。 ヒトのアンドロゲンレセプタに関わるCAG反復数の漸増はアンドロゲン応答因子のある標的応答遺伝子の転写活性を一次関数的に減少する。
生化学的レベルの変異が生物の生理や発生のレベルで表現型効果を示すであろうことは十分考えられることである。 現在SSRsの長さの変異による機能の変化を示す一番直接的な証拠はヒトの3塩基反復の伸長とみられる神経変性疾患である。 とくに反復数と発症年齢、反復数と疾患の重症度の強い相関である。 しかしながら、これらの疾患は(それほど多くなく、しばしば生じる)典型的なSSR変異でなく、むしろ極端な伸長と関係している。 これらの例は幸いなことにまれである。このほかにもいくつかの例が報告されている(MacKusick 1997)。
これまでに挙げたSSR変異の影響例は一様に有害なものばかりであったが、これらはヒトの遺伝病に注目するといった確認(調査のやり方)の偏りであることは明かである。 そのような強烈な影響がSSR反復数での突然変異のすべて、もしくは大部分で予想されると考える理由はない。
通常の集団ではSSR反復数の減少と増加はほぼ同じ程度と考えられる。 多くの遺伝子座がどの特定の形質の量的変異を決めるのに関わるから、SSRのずれで生じる新しい遺伝的変異の形質の平均値への影響は消し合ってしまい、わずかに全体の分散が増えることが予想されようが、これも安定化選択の作用をうけるであろう。
多面発現がSSR変異のごく普通の効果であるならば、特異的タンパク質の合成あるいは機能における比較的わづかの量的変異も表現型のレベルで重複した多面発現となろう。 そのような例も場合によってあるかもしれないが、理論的研究シミュレーション実験の結果、進化する系は違う機能に関与する遺伝子については多面発現はまずないという調整機構があるにちがいないことがわかった。 事際に、多細胞動物の基本的特徴である発生と生理についてはよく知られている。
これらの考察から観察される量的形質の遺伝的変異のもとはSSRsと考えることが出来よう。
2.各遺伝子座はその効果について累積的(相加的)である。 これは遺伝子が厳密に相加的だと言うのではなく、遺伝子A、Bそれぞれが体形を大きくするなら、個々のものよりも二つ一緒の方が大きな体形が生じることを意味する。 これらの前提を確かめるには、(DNAなどの)標識遺伝子を使って量的遺伝子を細かく分析して、関与する遺伝子座の地図作製Quantitative trait loci(QTL) mappingをする方法がある。
したがって個々の遺伝子の効果は測定することがほとんど出来ないが、それらの累積効果は測定可能である。 第12回の講座で示したように、各個体で測定された表現型値Pはその遺伝子型値Gと環境値の和Eで表せる。 さらに遺伝子型値は個々の対立遺伝子の相加効果A、対立遺伝子間の非相加的なドミナンスD、遺伝子座間の非相加的なエピスタシスIの作用によって定まる。 すなわち
P | = | G+E |
= | A+D+I+E |
したがって、集団で測定された表現型値はある大きさのばらつきを示すことが考えられ、実際にはそれは分散で表される。 平均値を基準として測定するなら、分散はそれぞれの測定値の自乗和の平均値になる。 また分散は前述の作用要因で分割することができる。 すなわち、
VP | = | VG+VE |
= | VA+VD+VI+VE |
ただし、(i)遺伝子型値と環境値の相関がなく、(ii)遺伝子型と環境の相互作用がないものとする。 この2つの条件のいづれかが成立しない場合は共分散あるいは相互作用による表現型分散への寄与を考慮する必要がある。
各分散は次のように定義される。
分散のタイプ | 記号 | 測定値 |
---|---|---|
任意交配集団で単一遺伝子座あたりの分散への寄与を、遺伝子頻度(p,q)、遺伝子型値(±a,d)で表すと次のようになる(2対立遺伝子モデル)。
遺伝子型分散 | |
---|---|
相加的分散 | |
ドミナンス分散 |
例。マウスのpygmy遺伝子。 値を平均値からのずれ(偏差)で測るならば、分散は各偏差の自乗に対応する遺伝子型頻度を乗じたものの合計である。 遺伝子頻度qが0.1ならば
同様にして育種価を用いれば相加的分散が、優性偏差を用いればドミナンス分散が得られる。 もちろんここで示した公式から直接求めることもできる(a=4, d=2)。
遺伝子頻度 | q=0.1 | q=0.4 | |
---|---|---|---|
もし環境分散VEが8.0000ならば、表現型分散VPはq=0.1ならば1.1664+1.0368=9.1664、q=0.4ならば15.1424となる。 実際には遺伝子頻度が違えば環境分散も変わることがあるが、ここでは数値例の説明ということで変わらないとした。
ここで遺伝力(率)heritabilityの説明をして置こう。 広義(in broad sense)と狭義(in narrow sense)の遺伝力が考えられている。 記号で示すと次のようになる。
広義の遺伝力は遺伝決定genetic determinationとも言い、表現型分散を遺伝分散と環境分散に分割したとき遺伝分散の割合を表す尺度である。 ショウジョウバエの自然集団(任意交配をしていると考えられる)からハエを捕獲して胸部の長さ(1/100mmの単位で測定)で体形の大きさを測定したものとする。 表現型分散は任意交配集団で測定し、環境分散は2種類の純系を交配して生じたF1雑種集団から得られる。 これら2つの分散の差が遺伝子型分散である。 広義の遺伝力は遺伝子型分散と表現型分散の比として求められる。
例(データはRobertson FW,1957による)
集団 | 成分 | 測定された分散 |
---|---|---|
ここでは環境分散は遺伝子型が違っても同じであるとして計算していることに注意したい。 違う純系の組み合わせから別のF1雑種集団の分散を求めて、前提が成り立つかどうかを確かめることも必要であろう。 このデータでは遺伝力から個体差の相違のおよそ1/2が遺伝によると判断されよう。
狭義の遺伝力は相加的分散VAと表現型値分散VPの比であるが、前者のVAは血縁間の相関係数から求めることができる(その理論的根拠については次の節で示すことにする)。 相加的分散は遺伝子の平均効果の分散であるから、継世代的に伝わる変異の大きさを表している。 様々な形質についての選抜効果を育種家が評価する際に狭義の遺伝力をその目安とする根拠はこのような理由に基づいているのである。
理論的に遺伝分散は遺伝子頻度の関数であるが、遺伝子頻度は実務上不明のことがむしろ普通である。 したがって、あらかじめ実験計画がなされた場合は別として、通常のデータでは分散成分の分割に留まる。 このことは求められた各分散が与えられたデータについての値であることを意味する。 当然ながら求められた遺伝力もそのデータ固有の値でしか過ぎないから、その一般性を論じるには十分気を付ける必要がある。 ヒトの知能指数の遺伝力はこのような方法で求められるのが普通であるから、その解釈は慎重でなければならない一例である。
Falconer DS & Mackay TFC,1996. Introduction to Quantitative Genetics. 4th edition. Longman, Essex, England.
KashiY,King D,Soller M,1997. Simple sequence repeats as a source of genetic variation. Trends in Genetics 13:74-78.
MacKusick VA, Feb. 2.1997. Selected entries from OMIM -- Online Mendelian Inheritance in Man. 19 entries found, searching for "triplet repeat expansion" .
Robertson FW,1957. Studies in quantitative inheritance. X. Genetic and environmental correlation between body sizeand egg production in Drosophila melanogaster. J Genet 55:428-443.