月曜日, 2月 11, 2008


もし、数学者ガウスの時代に、数式処理ソフトがあったなら、ガウス氏は狂喜したに違いないと、数式処理ソフトに接してから思い込んでいた。それから、十数年後あらためて考えると、違うように思い始めた。

当時は、Mac版のマセマティカでは桁数が19桁であり、ようやくでたウィンドウズ版は、NECのPC98などの倍精度と同じく16桁だったことなども気にいった点であったが、今ではそんなことは問題にはしていない。同じPCで、クラシック環境だと16桁、エミュレーターではコプロ付きで19桁であるのは面白いが、クラシック環境の適当さを感じる。エミュレーターの方が実直なようである。

『ガウスは循環小数の計算を、来る日も来る日も続けそこから整数論の重要な問題を発見した。問題が「最初からそこにあった」わけではない。割る数を順に大きくして行き、そこに現れる「循環節の動き」に身を任せているうちに、漸く問題は彼の頭の中で熟成され具体化したのである。彼は「詰まらない計算は弟子に任せて、先に進めば好いではないか」とのまわりの忠告を、決して聞き入れようとはしなかった。彼が生前公表しなかったノートの中には、様々な自家製の数表や公式が書いてあった。帰納されるべき要素を自らの手で日々造り上げ、”その時”に備えていたのである。』(「虚数の情緒」吉田武、2000、東海大学出版会)

そのあとで、例えば小学校における通分を教えても、実際の問題を大量にこなさなければ身に沁みて来ないことは大人以上である、と指摘されている。大量とは10題20題のことではない、100題1000題の話しである、と。

私は、Basicでプログラムを入力して、同じデータに適用し、200回ぐらい試したが、計算はPCがやってくれるので、計算誤差程度しか最初は気づかなかったが、表計算ソフトに移ってからはいろいろな統計量も出力されるので、だんだんと背後の誤差にも自ずと気になりだした。マセマティカでも乱数を発生させ、データに加えて、回帰分析の結果がどう変わりえるかを、かなりシュミレートしたこともある。

"If among these errors are some which appear too large to be admissible. then these observations which produced these errors will be rejected, as coming from too faulty experiments, and the unknowns will be determined by means of the other observations, which will then give much smaller errors." ---Legendre in 1805,in the first pblication on least squares

"This idea, however,from its nature, involves something vague,... and clearly innumerable different principles can be proposed.... But of all these principles ours is the most simple; by the others we shall be led into the most complicated calculation.---Gauss in 1809, on the least squares criterion

これらは、Peter J.Rousseeuw氏とAnnick M.Leroy氏の共著、”Robustregression and outlier detection"の扉に書かれている最小二乗法の基礎を築いたふたりの数学者の言葉の引用だ。(1987、John Willy & Sons)

この本には、ディスクはついていなかったが、解析プログラムをお願いして分けてもらった。それで、当時はMacしかもっておらず、Virtual PC上で使っていた。昔のDOSの世界に戻ったような使い心地であった。



一般の多変量解析や単なる回帰分析の場合でも、ガウスーマルコフ過程がほぼ満足されるというような理想的な場合は滅多に無く、通常outlier(外れ値)があったり、誤差分布が相互に独立でなく系列相関があったりと、いろいろと「悪条件下」での最小二乗法の適用が大半なのが普通であろう。それで、経済分野(典型的な数学の応用分野と言われる)などでもいまだにこうした論文がでたりするのであろう。

べつにSASやSPSSなどの専用統計解析ソフトが無くても、エクセルなどで工夫すればかなりのデータ解析がこなせる、という指摘もあり、データの外れ値などを落として回帰分析などを試すような場合は、エクセルに頼りっきりになったこともあった。

エクセルは、隠れた数値演算機能も持ち、文字式の行列演算などはしないが、数値データならマトリクス関連の数値処理は問題ないようである。それで、最近、まともに買えばかなり高い測量関連ソフト群のうち厳密平均網処理(データ数に制約があるが)などもこなしてくれるようなエクセルマクロがフリーで公開されていて、驚いた。
http://www.cadcamcube.jp/rakraksokumain.html

ためしに実行したら、以前紹介した『最小二乗法の理論とその応用』(田島稔・小牧和雄、東洋書店)の例題をサンプルデータに貼り付けてあったので、それらを消去して入れ直そうとしたら、何だ同じデータだと気付いたが、必要なデータだけ入力しおわると、バックグラウンドで計算は終わっていて正解が表示されていた。


独力で5年ほどかかって、測量士になられたというMr.Boo氏の尽力に敬意を評する次第。いろいろな注釈も
眼から鱗の指摘も入っていたり、計算理論をマスターするには、プログラムサイズも比較的小さく場所もとらず、エクセル2000が動けば問題なく、私はMacのエクセルでそのまま開いて実行したが、Win版となんら異なる結果は得られなかった。

さらに、測量で通常固定点としてその座標を変えない与点の座標も経年変化などで動いている可能性もあったりするので、自由に変えて、残渣の平方和を最小になるようにするフリー・ネットワークとよばれる方法も試すことができる。この自由網平均において一般逆行列を計算する場合、などというのが加わるが、それにも対応しているらしい。マセマティカでは、PseudoInverse[x]で答え一発で表示されるのだが、・・・。

またMathLinkというのがあって、表示はエクセル、計算機能はマセマティカでという手もあったりしたりする




なかのひと

0 件のコメント: