月曜日, 4月 14, 2008

『過去20年にわたり、経済地理学はその性格と研究範囲を大きく変えてきた。われわれの関心は、依然として、地表に分布する経済諸現象の位置や相互作用の原因を分析することにあるが、分析過程は大きく変化してきている。これらの変化は計量的諸技術の採用と演繹的推論に基づく現実のパターンと相互作用の理論的説明をめぐってあらわれたものであり、・・・』
モーリス・H・イェーツ、「計量地理学序説」1970、好学社、高橋潤一郎訳。日本語版への序文から。

『無数の諸特性がそこに空間的分布している任意の区域において、科学的地理学者が最初になすべき仕事はこれら諸特性測定し、その空間的分布を記録することである。・・』

『変数とはある特性に関する測定値の集合であって、一定の値を持たずにその値の変動するものとして定義することができよう。・・・これら変数が空間的でその値を変動する性格をもつということである。・・・』

『理論とはいくつかの変数間の相互関係を定義、説明する一般的言明である。「理論」という言葉はこれら相互関係の形式が抽象的演繹によって説明され得るということを含意している。・・・「抽象的演繹」という表現は内的合理性をもつ一連の前提条件から一般的な結論を導き得るような推論過程を意味している。』

『データ解析の主要な目的は、前述のように、測定誤差に隠されている真の値を推定し、測定結果の奥にあると考えられる関係を解明することである。このような関係を、自然科学の言葉では、”理論”というが、統計学の言葉では、”モデル”あるいは”構造”という。』
「最小二乗法による実験データ解析」(プログラムSALS)中川徹・小柳義夫、1982年、東大出版会。

『科学的方法とは、理論(モデル)を確立し発展させ一層洗練されたものにする過程を意味する。このような過程の第一段階は問題の提起であり、さまざまな仮説がこれによって設定される。仮説は計量分析の基礎であり、したがって問題の提起はきわめて重要である。』(イェーツ)

『むしろその仮説が真でないという一般的言明を退けようと試みる。この一般的言明を「帰無仮説」と呼ぶが、これは2つないしはそれ以上の変数間に何らの関係も存在しないという言明にほかならない。」(イェーツ)

『経済地理学におけるさまざまな問題の計量的分析はしばしばモデルを利用する。モデルは抽象化の度合いによって次の3つに分けられる。第一のタイプはアイコニックモデルであり、・・・航空写真は現実のアイコニックモデルである。第2のタイプはひとつの特性が他のものによって表現されているアナログモデルである。・・・等高線は地表上の起伏を・・・。第3のモデルはシンボリック(記号)モデルである。数学的モデルとは記号が測定されている場合にほかならない。』(イェーツ)

以上のような前書きないし準備を行い、イェーツはある重回帰モデルの例を上げている。翻訳者は、多重回帰モデルと訳しているが、一般的な重回帰モデルで表現することにする。

単回帰モデルによって、彼は米国の中西部における降水量と農業人口密度との関係をしらべていろいろ考察を行った後、重回帰モデルを試みている。

サウスダコタの東半部においては、雨量(年平均)が1インチ増加するごとに都市農業人口密度が1平方マイルあたり0.598人増加することを示唆している、などの記述がみられる。

降水量と主要な市場中心からの距離の影響はともに重回帰モデルによって結合的に分析できるとして、対象域の東南部に位置する2つの市場中心からの距離は、各カウンティの中心からスーフォールへの距離とス−シティへの距離の平均値と定義して解析した。

PDi=9.72+0.148(Ri)-1.164(ADi)

左辺はカウンティiにおける非都市農業人口密度、右辺第1項はカウンティiの雨量(インチ)、第2項は各カウンティから2つの主要都市への平均距離である。

『パラメーターの符号は仮説で予想した通りである。距離を一定に保つことによって、人口密度は降水量とともに増加し、降水量を一定に保つことによって、人口密度は2つの都市への距離とともに減少する。距離変数を導入することによって多重相関係数は0.91となるが、これは2つの変数が非都市農業人口の統計的変動の83.5(0.91^2)パーセントを「説明」してることを示している。』
としている。

「SASによる回帰分析」(SASでまなぶ統計的データ解析6)竹内啓監修:芳賀敏郎・野澤昌弘・岸本淳司、1996、東大出版会、では、

重回帰分析での、説明変数間に相関がない場合とある場合について詳しく解説されている。説明変数間に相関がないと、重回帰式の偏回帰係数は、各変数だけで回帰した場合の単回帰係数に一致する。しかし、説明変数間に相関があると、話しは単純ではなくなる。

説明変数間に0.766ほどの相関がある場合の例として、単回帰では、回帰係数が有意であったのに、重回帰では、偏回帰係数が有意ではなくなる例を上げている。

このような場合、単回帰係数と、重回帰係数は一致しなくなる。一方の変数を固定すると、もう一方の変数の変化の範囲が狭くなり、偏回帰係数の推定精度が悪くなる、としている。

そして、説明変数間に高い相関があると、どちらの説明変数が目的変数に影響しているかのかがはっきりしなくなる。したがって、重回帰分析を利用するときには、まず相関係数行列を良く眺めておくことが重要である、としている。

さらに、説明変数間に高い相関があると、前述の説明とは逆に、単回帰係数が有意ではなくとも、複数の説明変数が補い合って有意な回帰式が得られることもある、としている。そのような場合はそう多くはないらしいが、重回帰分析が有効である、としている。

イェーツ氏の場合は、各偏回帰係数が予想と一致した符号をとっていたが、説明変数間に相関が高いと、そうした予測とは符号が逆転する例もまれではない。こうした特性を持つ重回帰分析を、どう実際の応用に有効に役立てるかは、ケースバイケースの特殊な対応が必要である場合が大部分であろう。





なかのひと


Firefox meter

0 件のコメント: