成長研究と実験動物 第13回

変移点の検出


従来、変移点の存在と位置を決めるにはおおよそ次のような手順をとってきました。 問題を単純化するために変移点が一つ(2相アロメトリー)の場合を想定しますと、まず、1)両対数図上における(Xi、Yi)の点の分布状態から変移点の有無と位置の大体の見当をつけます。 ついで、2)この仮の変移点を境に点(プロット)を前・後半の2群にわけ、各群ごとに一次式を最小二乗法で推定し、3)直線の交点をもって変移点とみなします。 このような手順のうち、1)の仮の変移点をどこに設定するか、2)の変移点近くのデータをどちらの群に入れたらよいかなど判断に苦しみます。

私ども(1976)は、これらを客観的に判断するために以下の方法を考案しました。 その手順は、1)両対数図上におけるプロット(xi、yi)(ただし、xi=logXi、yi=logYi)から全体の一次回帰式y=αx+βを求めます。 ついで、2)プロットを前・後半部に分割しながら各部における一次回帰式を算出し、3)それらのa、bの推定値が全体の一次回帰式のα、βについての95%信頼楕円に含まれるか否かで変移点の有無を検定しようとするものです。 プロットを分割する場合、最初は前半3コ、後半(n−3)コから出発し、分割を前半4コ、後半(n−4)コ……と進めて最後に前半が(n−3)コ、後半が3コになったときにストップします。 ここで何度も繰返される統計処理は一次回帰分析と最小二乗法です。 私どもは上の原理をもとに、多数の動物の多数形質に関する個成長データから各個体ごとのアロメトリー式推定と同時に変移点の検出と位置を短時間で効率よく決める電算機用プログラムを開発しました。 この方式を実際のデータにあてはめたところ、95%信頼楕円から統計的に逸脱する箇所はただ一箇所だけではなくその近辺の複数箇所であることがわかりました。 つまり、変移点は点ではなく幅をもった面でした。 面では直線を引くことができませんからもっとも逸脱した箇所をとって一応変移点とするしかありません。 考えてみれば生物のデータですから変移点といえども幅を持つのは当然のことと思います。

その後、佐賀医大の高井ら(1981)はHudson(1966)が提唱した分割直線法を利用して多相アロメトリー式の推定法を考案しました。 すなわち、多相アロメトリーが成立つとは、xiが大きさの順序に並んでいる(x1<x2<……<xn)ようなp組のデータ(xi、yi)があって、下記の部分モデルが連結点(変移点)x=Pjで連続しているという条件下で次のようなモデルとして表わせます。

    ^
    y=b1+a1x     x1≦x≦P2のとき
      =b2+a2x     P1≦x≦P2のとき
              │
              │
              │
          =br+arx     Pr−1≦x≦xnのとき


変移点Pjが隣接する2点の間にある(I型、xi<P<xi+1)場合は、2相アロメトリーモデルは

	b1+a1P=b2+a2P …………………… (1)


変移点が一点xiの横座標上にある場合(II型、P=xi)はやや複雑な補正が必要となります。 私どもの開発した方法をも含めて、これまではII型のことをまったく考慮していませんでした。

以上の条件を考えながら前モデルのパラメータ(b1、a1)、(b2、a2)およびPを最小二乗法で推定します。 I型の手順は、

  1. 仮の変移点P*(i)を設定して点をその両側で2分、それぞれ最小二乗法でパラメータb1*(i)、a1*(i)およびb2*(i)、a2*(i)を推定します。 ここで、*の記号はi回目の試行でのパラメータの推定値であることをあらわしています。 これらのパラメータを用いて部分モデルの残差平方和ρ1*(i)、ρ2*(i)を求めます。
  2. (1)式より変移点P*(i)を試算します。P*(i)がxi<P<xi+1を満足すれば全モデルの残差平方和T(i)を次式で求めます。
            T(i)=ρ1*(i)+ρ2*(i) ………………………… (2)
    

    満足しないときはP=xi(II型)の場合ですから前述したとおり面倒な補正をしなければなりませんが、その補正法はここで省略します。
  3. 変移点のありそうな箇所について1)、2)を繰返してT(i)を求めます。
  4. II型の場合も1)、2)を繰返しパラメータに補正を加えて全モデルの残差平方和S(i)を求めます。
  5. 3)で求めたいくつかのT(i)と4)で求めたS(i)のなかで最小の値をもつモデルを2相アロメトリーの最良推定式とします。

同氏らは、さらにモデル推定の判断基準として一般に用いられている最小の残差平方和の他に前述した赤池の情報量基準AICを用いています。 最小のAICをもつモデルを選ぶわけでMAICE(minimum AIC estimate)といわれる方法です。 分割直線法では、最小二乗解と最尤解は一致するので次式のAICを用いて最良のアロメトリーモデルを推定できます。

	AIC=n・ln(残差平方和)+4・r …………… (3)


ここで、nはデータの組数、rは部分モデルの数(アロメトリー式の相)をあらわします。 同氏らは、以上全ての手順を電算機用にプログラム化しています。

このプログラムを用いても大変な計算だそうです。 499組の全データを用いた場合実に491,041通りのモデルを考えなければならず、当時の大型計算機(FACOM M-200, OSIV/F4)でも14分36秒あまりの計算時間を要したとのことです。 このようなときは適切な数の階級に分けて階級平均値データを用いることも試みる必要があります。

以上、いろいろ述べましたが、変移点を決めるのにもっとも大切なのは両対数図上の点の分布を、あれこれ考えながらじっくりと観察することです。 変移点は、本来、点というよりは面というべきもので、上記細かい計算はアロメトリー式を定めるための便宜上な手続きというべきものです。


[Previous][Index][Next]