「ビッグデータ統計植物学」!?
大げさなタイトルをつけてしまいました。私は、植物学は全くの門外漢なので、専門家から見れば笑止千万と笑われそうですが、恥を忍んで問題提起をします。
植物学とコンピューターサイエンス。全くの異領域であるこの2つの分野をドッキングさせることで、新たな可能性が生まれるような気がしています。
明石北高校での「釜谷池周辺の植物の研究」で面白い発見がいくつかありました。
研究に利用しているBPUC Photoアプリでは、同定した植物名を、写真数の多い順にソートして表示する機能あります。
撮影された写真数1297枚のうち、植物名が同定されている写真が現時点で約900枚ですが、その中のそれぞれの植物を、撮影された写真の枚数順に表示しています。
1番多いのがセイタカアワダチソウ。2番目がヨモギ、これは「やっぱり」という感じです。
3番目に多いのがムラサキツメクサなのですが、これは意外な感じがしました。ムラサキツメクサはありふれた植物ではありますが、近隣の地域ではほとんど目にすることがないからです。
なぜ、釜谷池周辺には、こんなに多いのか?
例えば、ため池の護岸保護のために、グランドカバーとして種がまかれた可能性が考えられます。これについては、釜谷池の改修工事に詳しい方に聞くなど、調査を進めています。
他にもたくさんの発見があります。今、調査をした高校生が集計や考察を進めているので、結果が出たら報告します。
個体数推定の近似としての「目撃頻度推定度数」(仮称)
生物学では、個体数推定あるいは密度推定(単純に言えば生物の数を数えること)は基本的課題のひとつとされています。しかし、自然界は広大で、個体数を厳密に数えることは不可能のように思えます。推定するにも、大変骨の折れる厳密な調査が必要なのではないでしょうか。
しかし、色々な感性を持った多くの人が、たくさんの「目につく写真」を撮影して、そこに写っている植物を集計すれば、近似的な個体数推定にならないでしょうか?植物学の専門家から見れば不正確極まりないと非難されそうですが、簡便な目安ぐらいの役割は果たせそうな気がしています。
その植物の写真数を全体の写真数で割った数字を「目撃頻度推定度数」と名付けてはどうかと考えています。
統計学には、「大数の法則」というものがあります。たとえばサイコロを振り、出た目を記録することを考えます。このような試行を厖大に繰り返せば、出た目の平均(標本平均)が出る目の平均である 3.5 にどんどんと近づいていくというものです。たくさんの写真を集めれば、統計的に有意な指標になり得るのではないでしょうか。
もちろん、花があるかないか、大きいか小さいかなど、人の目を引く特徴によって植物が写っている写真の数は大きな影響を受けます。ですから、同じ区域内の植物どうして比較することには、大きなバイアスが生じると考えられます。
しかし、異なった区域間で、「目撃頻度推定度数」を比較することには、意味があるように思います。対象区域が異なっても、それぞれの植物の特徴によるバイアスは同程度と推定できるからです。
もちろん、厳密な指標でないため、学術的には認められないと思いますが、たくさんの人に、自分が目ついた写真を撮影して登録してもらうだけで出てくる指標ですから、とても簡単です。この指標で面白い傾向が出てくれば、厳密な調査を実施して、学術的な研究に発展させることができると思います。
コメント