逆転の思想-73
              水道公論2008年 12月号


  対数グラフの性格
 
  グラフを作る際、データの変動が1桁くらいならいいが、2桁をこえると普通のグラフでは数値データの小さいところがかたまってしまい分布がよく分からなくなる。
 この場合x軸、Y軸ないし両方を対数表示すると分布状況がけっこう分かりやすくなる。
 一般に対数表示にするとデータの散らばり方が小さくなり、通常のグラフ表示では大きく外れるいくつかの点が近くなって相関があるように見せるために使われると評判はあまり良くない。
 しかしこの世の現象は大体2桁とかそれ以上の変動があるので対数グラフが向いているのが多いのではないだろうか。過去に何回も対数グラフを使って回帰式を作ったことがある。データの範囲は2桁から4桁くらいであり、データ分布の傾向を把握できた。
 3桁くらいにまたがるデータを通常グラフで表示すると、データの大きな1桁くらいは図の9割の範囲に示されるが、小さいデータの1桁はグラフの端っこの1%のところにかたまってしまい、分布が読めない。
 2桁くらいにわたるデータを通常グラフで示して、大きな1桁くらいしか変化が分からないケースが多い。物価、地価など価格の変動グラフが特にそうである。
 具体の数値で考える。領域が2桁の1から100のグラフを考える。グラフの幅を10cmとすると、通常のグラフでは2は2mm、3は3mmと1mmしか離れない。対数では2が15mm、3が24mmと離れる。なお20と30は通常グラフでは2cmと3cm、対数グラフでは6.5cmと7.4cmというようになる。ただし0は対数グラフで表せない。
 感覚的に考えると、通常グラフよりも対数グラフの方が世の中に合っているような気がする。
 重さの感覚を考える。1kgのものを持っても、10gのものを持ってもそれなりの重さを感ずる。また重さの感覚は相対的なもので、重いものの方が正確に重さを言い当てることができるわけでもない。
 数字の大きなデータが信頼できるかというとそうでもないケースも多い。特に計器による測定データでそれを感じる。
 相関を考える場合は、流量、荷重条件など、一般に、X軸がある状態での値の数桁の範囲でも、Y軸に対応した値があって、その間連続的な値をとるはずである。
 またある区間の相関を考える場合、その範囲を超えたデータがあると、安定した式を得られることが多い。ただ実験では、設備の関係で1桁ずれるような設備をつくることは難しいが。
 2桁以上にまたがるデータを解析する場合やはり、対数表示で考えるのがいい。1枚のグラフを見ながら考えることができる。
1桁ないし半桁の変数で解析して係数を求めるより、変数の範囲を大きくした方が大局的な係数を求めやすいと考える。