RANKING
にほんブログ村 歴史ブログへ
NEW ENTRIES
RECENT COMMENTS
RECENT TRACKBACK

2010年07月02日

単一起源説vs多地域起源説を切開するvol.6 DNA解析って何?-3~分子進化系統樹

「単一起源説vs多地域起源説」に焦点を当て、それらの学説に孕んでいる問題に切り込む、シリーズ「単一起源説vs多地域起源説を切開する」、今日は第6回をお届けします。
シリーズ「単一起源説vs多地域起源説を切開する」
vol.1 『起源説の概要』
vol.2 『単一起源説を支持する分子遺伝学的証拠とは?』
vol.3 『ネアンデルタール人、現生人類と交配?』
vol.4 『DNA解析って何? 』
vol.5 『DNA解析って何?-2~分子時計』
前回は、DNA解析って何?の続編として、分子時計を取り上げました。分子時計は、無条件に成り立つ性質ではく、限られた条件のもとで成り立つ特殊な性質であることが分かりました。
では、この分子時計を前提にした分子進化系統樹は
・分子時計の前提が成り立たなければ使えないのか?
・それとも、分岐年代が性格ではないとしても系統樹が示す生物の系統進化は変わらないのか?
などなど、疑問がわいてきます。
そこで、今回は、DNA解析って何?の続編として、この「分子進化系統樹」を取り上げます。
◆分子進化系統樹って何?

生物の進化系統関係に基づき、進化的な分岐関係を表した図。系統樹の作成にはいくつかの方法があるが、計算機プログラムが利用可能な近隣結合法、最大節約法、最尤法などがよく使われる。
Weblioより)

<分子進化系統樹の例>
dna07-zu3%5B1%5D.gif
子進化系統樹は、入手したDNAを解析し生物の系統発生の歴史を追跡するものなので、ある程度は正確な系統樹が作れるものだと思っていましたが、調べて見ると、必ずしもそうとは言い切れないことが分かってきました。分子進化系統樹も、分子時計と同様に前提条件があり、その分析手法故の限界もあるようです。
最新の分子進化系統樹は、かなりの専門的な知識の話になってしまうので(素人である私には理解しきれない)ので、今回は「進化系統樹って何?」の基本の基本に絞って、「進化系統樹の作り方」を追いかけて、その背後の考え方に迫ります。
ポチッと応援をよろしくお願いします。 😀

にほんブログ村 歴史ブログへ


■無根系統樹と有根系統樹
系統樹とは、全ての「点」を結ぶ、ループを持たないグラフで、「点」と「枝」で構成されます。系統樹の中で隣り合う2点を結ぶ線分を「枝」と呼びます。「点」には二つのタイプがあり、一つは「端点(●)」と呼ばれるただ一つの枝につながっている点で、端点は全て系統樹の末端にあります。もう一つは「内点(○)」よばれ、二本以上の枝に繋がっている点です。
0-1%E3%81%AE%E3%82%B3%E3%83%94%E3%83%BC.jpg
この系統樹には“共通祖先”を意味する「根」がないので「無根系統樹」と呼ばれます。系統樹作成の最初の段階で作られる系統樹です。
これを、私たちがイメージする「根」をもつ系統樹(「有根系統樹」)にするのは、ある情報を付加的することが必要で、系統樹のいずれかの点を「根(共通祖先)」として指定する必要があります。
ところが、ある生物が他の生物の祖先であると断言することは、ほぼ不可能です。化石生物も「過去にそういう生き物が現実に存在した」証拠であっても「ある特定の生物の祖先である」という証拠にはなりません。つまり、進化的な由来関係=「祖先子孫関係」は原理的に不可知であり、系統樹は先祖子孫関係を表すことが出来ないのです。
では、どうするのか?
まず、得られた生物(現存種、化石種を含む)の情報を全て端点に配置します。一方、内点は現実に観察された生物ではなく、ある系統樹を作るために仮想的に構築された共通祖先を表します。仮定であっても、共通祖先というからには、なんらかの時間軸を導入する必要があります。
そこで、系統推定のための仮定として「外郡」という概念を導入します。対象となる生物群の中には少なくとも一つは「どの生物よりも明らかに遠い時期に枝分かれしたことがはっきりしている生物」を含めるのです。
例えば、A:ヒト、B:チンパンジー、C:ゴリラの間の系統関係を適当な分子を使って推定しようとしたとき、類人猿とはおよそ3000万年前に分岐したと考えられているO:日本ザルを外郡として考えることができます。(他の生物でも可)
この条件で作成した系統樹がしたの無根系統樹と有根系統樹です。
0-2%E3%81%AE%E3%82%B3%E3%83%94%E3%83%BC.jpg
この時、内郡(A,B,C)に対して外郡(O)を仮定したので、内郡と外郡を結ぶ枝のどこかに「根」あることになりますが、この根は実際には存在せず外郡によってその存在が仮定されるものであることに注意が必要です。
■系統樹は複数ある?
いま、三つの生物による内郡(A,B,C)と、外郡(O)に観察された形質Mを考えます。形質Mは「0」「1」のどちらかの状態をとります。それぞれの生物の形質Mは、外郡O=「0」、内郡のA=「1」、B=「1」、C=「0」として系統樹を考えます。共通先祖であるOは形質Mが無く、その子孫であるA,Bは形質Mがあり、Cには無いと観察されたと考えてください。
外郡は状態「0」なので、内郡で状態「1」が生じるには、どこからの枝で「0→1」の形質変化が生じなければなりません。このとき系統樹を作成すると、次の3つの系統樹を作る事ができてしまいます。「」の枝で、0⇒1への変化が生じています。
0-3%E3%81%AE%E3%82%B3%E3%83%94%E3%83%BC.jpg
現実に起こりえた可能性がある点では系統樹1、2、3も同じ、でも、この中から系統樹を最終的に一つに絞り込む必要がある。そのときの「最適化基準」と呼ばれる基準を適用します。
系統樹1、2、3の違いに着目すると、形質変化が起こった回数が異っています。系統樹1、2は形質変化が2回、系統樹3は形質変化が1回。系統樹推定において、系統樹の上での形質状態の変化回数を最小化するという最適化基準は、「最節約基準」と呼ばれ、先の3つの系統樹では、形質状態の変化のもっとも少ない系統樹3が最節約解として判定されます。
ここで「あれ?」と思いませんか?
可能性が否定できなくとも、形質変化が起こった回数が他の系統樹より多いという理由で「系統樹1、2」は採用されないのです。また、さきほど3つの系統樹が出来る、といいましたが、実はさらに多くの系統樹を作成なのですが、それは最初から除外されます。例えば、形質Mが「0→1→0」というような状態変化を起こすことは、はなから検討されません。
しかし、これが系統樹推定なのです。そこでは、数学的処理でベストと思われる系統樹が選定することが主眼でであり、現実に起きたものであるかどうかは検討の外に置かれるのです。
■コンピュータ性能の限界は、系統樹推定の壁
系統樹は、数学的にあるタイプの代数的グラフのひとつと考えられる、与えられた最適化条件のもとで形質データから(数学的に)ベストの解を求めるものです。このベストの系統樹を発見するためには、学問分野を異にする現代数学やコンピュータ科学との連携協力が不可欠になります。
今回はもの“すごく”単純な系統樹を事例としていますが、対象となる生物がもっと多い場合、つまり系統樹のグラフを構成する点の数がもっと多い場合は、系統推定問題は複雑になり、点が増えれば増えるほど解くのが難しくなります。
<網羅的探索>
ベストの系統樹を推論するという問題は、観察されたデータに照らし合わせて、お互いに対立する可能な系統樹のあいだで比較をすることです。そこで、多くの点を含む系統推定問題で、全ての可能性を網羅的に比較(網羅的探索)をしようとすると、可能な系統樹の数が爆発的に大きくなって、その結果、系統樹間の比較が現実的に困難になってしまいます。たとえ高性能コンピュータを使ったとしても、点がせいぜい1十数個までの小さいサイズのデータに限られます。
<発見的探索>
そこで、網羅的探索に替わり発見的探索という手法がとられます。この方法では、最初に全ての端点を含む初期系統樹を与、枝の位置を付け替えることにうより樹形をすこしづつ変えながら、樹長が最小になるまで樹形探索を続けます。全ての可能性をしらみつぶしに調べ上げるのではなく、探索の範囲を限定するので網羅的探索に比べ時間を短縮することが出来ます。そこでDNAによる解析では、「遺伝子マーカーと言われる、容易に検出でき、その座位が特定されていて、個体によって違いがある部分を利用」するのです。
ただし、この方法は一部をかいつまんで調べるだけですので、最適な系統樹であるとは限らない、という欠点もあります。


「進化系統樹って何?」の基本中の基本に絞って、「進化系統樹の作り方」順を追ってみてきました。
その特徴をまとめると、

  • 現在入手可能な生物のデータという限られたデータから、系統発生史を「系統樹」というグラフで表す。
  • 現実に起こりうる複数の系統樹から、数学的処理でベストと思われる系統樹が選定される。(ただし、この系統樹推定は、史実のとしての系統発生史であるかどうかは別の問題)
  • 系統樹が選定されても、実際にはそれが数学的にベストの系統樹に達しているかどうかも確定する事が困難。

分子進化系統樹は、限られたデータを基に生物の系統発生を推定する手法の一つです。その系統樹は現実に起こりえた複数の可能性の一つであることは確かです。しかし、それは必ずしも現実を反映しているものではなく、あくまで数学的な処理に基づき選定されたものなのです。
こうしてみてみると、分子進化系統樹にしろ、その前提条件である分子時計にしろ、じつは非現実空間での「特殊限定事実」に過ぎないのではないでしょうか。
自然の摂理、生物の進化は、決して数字や数式に還元できるものではありません。にもかかわらず、DNA解析により研究成果が、あたかも史実を裏付ける確かな証拠であるように発表され、報道され、教えられるのはなぜなのでしょうか? そもそもそのようなDNA解析を主な根拠として議論される「単一起源説vs多地域起源説」という論争とは、一体なんなのでしょうか? 分子進化系統樹の推定過程で除かれた系統樹がより現実を反映している可能性はないのでしょうか?
何か本質的な部分で違和感を感じてしまいます。
そこで、次回は、「単一起源説vs多地域起源説」という論争の本質とは何か?に迫り、この違和感の正体に迫りたいと思います。それらの学説に孕んでいる問題は何か? いよいよ今回シリーズの核心部です。乞うご期待!
参考
『系統樹思考の世界』三中信宏著
『連続と不連続 mt-DNA解析への疑問』
『「科学的事実」というドグマ』

> List 

trackbacks

trackbackURL:

comments

共同体社会と人類婚姻史 | 女の配置が、集団の成果を決める2~旧石器時代~

comment form
comment form