誤差
出典: フリー百科事典『ウィキペディア(Wikipedia)』
誤差(ごさ、error)とは一般に期待される値に対するずれの大きさのこと。測定値や推定値ついてはその真の値に対する差をさす。誤差は少ないほど望ましい。
一般に精度を表す語として用いられており、定量的に物事を語る場合には忘れることのできないものである。
自動車などの機械類の設計を行うときに製作段階での誤差を考慮して「まち」や「あそび」を作らないとできた機械はうまく動かない。したがって、設計者は常に部品製作上の許容誤差範囲を設計に織り込んでいる。この誤差範囲を公差(寸法公差・幾何公差)という。
本来数値で表されるものには光速のように値が定義そのものであったり、円周率のように定義から値が一意に決まるものを除いて必ず誤差がある。たとえば円周率などは、(直径に対する円周の長さの割合という)定義からは数値が一意に決まるにもかかわらず、それが無理数であるために、それを現実に小数で表示しようとすると必ず誤差(打ち切り誤差)が生じる。科学的な文脈において数値を扱う際には誤差が存在しない場合を除いて必ず誤差が表示されている。台風の予想円などは身近にある誤差表示の一例である。
誤差の発生原因としては、データを測定する際に生じる測定誤差や、データを計算する際に生じる計算誤差、標本調査による標本誤差(統計誤差)等が挙げられる。また実際におきる現象と、数学的なモデルに違いがある場合にも誤差は生じる。
目次 |
[編集] 測定誤差
[編集] 系統誤差
ある測定における測定値に、同じ方法を用いて測定する限り、「真の値」にたいして系統的にずれて測定されるような誤差が存在する場合、それを系統誤差と呼ぶ。系統誤差はその原因と傾向がわかっている場合には測定値から取り除くことができるが、一般的には完全に取り除くことは不可能である。
系統誤差の値は常に一定であるとは限らない。温度、湿度、或いは単に時間の経過など何らかの外的要因が被測定物に対して作用するのとは別に測定器自体に作用して測定結果を狂わせる場合があるが、このようなものも系統誤差のうちに含む。
例として端が磨耗した竹の物差しを使っていろいろな大きさの升の深さを測ることを考える。この場合測定値は真の値に対して磨耗した分だけ常に大きくなることが予想される。大きさがあらかじめわかっているほかの物体を同じ物差しで計ることによってこのずれの大きさを決定することができるので、この物差しを使った先の測定結果から升の深さを求めることができる。
しかし系統誤差の原因と傾向をこのように特定することは一般には難しい。たとえばこの物差しの目盛の間隔が製造上の問題や保管方法の問題によって狂っていた場合、同じ物を図れば同じように測定されるのでこれも系統誤差の一種であるがこの傾向を別の方法によって校正することは先ほどの例に比べて格段に難しい。また測定の繰り返し自体によって物差しの磨耗が進行するかもしれない。この場合先ほどとったような簡単な方法ではもはや系統誤差を取り除くことは不可能である。
一般に測定値における系統誤差は様々な原因による誤差の積み重ねであり、その中には特定することがほとんど不可能であるようなものも含まれる。したがって原因と傾向がわかっているものについて極力取り除く努力をしたとしてもある程度の系統誤差が残ることはやむを得ないことといえる。重要なのは最後に残る系統誤差をできる限り小さくした上で、その上限値を正確に把握していることである。
[編集] 偶然誤差
系統誤差が測定の繰り返しに対して一定であるのに対して、測定ごとにばらつく誤差のことを偶然誤差という。
再び端が磨耗した竹の物差しを考える。一般的には磨耗した端はもはや直線ではないと考えられる。したがって物差しを当てるたびに実際に升と接触する点が変わり或いは物差しがわずかに傾き測定結果をばらつかせると考えられる。
偶然誤差の多くは測定方法自体によって規定されるので測定方法自体を改善しない限り取り除くことはできない。また偶然誤差は毎回ランダムな値をとるので測定後に取り除くことができない。偶然誤差によって測定の精度が決定されることが多い。しかし、繰り返し測定により十分に多くの回数の測定によって特定の分布を得ることができれば、その測定方法に即した最適な方法(平均をとる、最頻値を採用するなど)によって真の値の推定値の精度を上げることができる。
[編集] 偶然誤差の大きさをあらわす指標
- 平均二乗偏差 (RMS: Root Mean Square)
- 標準偏差
- 半値幅
- 分布の最頻値に対して頻度が半分になる点における分布の幅。FWHM(Full Width at Half Maximum)とも呼ばれる。
[編集] 測定対象が一つではないときの測定誤差
上記の議論はある一つの対象物に対する測定に際して起こる誤差について議論してきたが、測定対象となる事象自体がある分布をもっているような対象に対する測定を行う場合がある。工場などで生産する製品の寸法が規格寸法に対してある一定の範囲に収まっているかどうかを測定する場合などである。
この場合、測ろうとしている対象が持つばらつきと、測定方法自体がもつ誤差を区別して考えなければ混乱を生じることになる。たとえば、ある部品の寸法精度が±1%の範囲に収まっているかどうかを検定したいときに、測定方法自体が±1%の誤差を持っていたとすると測定自体が意味をなさなくなってしまったりする。このような測定に用いる測定装置は、あらかじめ測定誤差を検定した上で、測ろうとしている精度に対して誤差が十分に小さいことを確認しておく必要がある。
[編集] 平均値の測定
ばらつきを持つ複数の値の平均値を求めたい場合がある。たとえば、日本人の身長の平均などである。このような測定を行う場合、普通全数を測定することはせず対象とする母集団からランダムに選んだ標本を用いて測定することになる。このような場合求められる平均値の精度は調べた人数等による(推計統計学)が、その他に測定自体の精度も勘案しなければならない。系統誤差が無視できるような測定方法をとるとして、偶然誤差については一つの測定対象を繰り返し測定する場合と同様、測定回数を上げることによって十分に小さくすることが出来る。詳細な議論は避けるが、ほとんどの場合、平均値に統計的な意味があるくらい十分に多くの対象について測定したならば、偶然誤差の影響も十分に小さくなるが、母集団が小さかった場合など誤差が無視できるだけの測定数と統計的に意味のある測定数が異なる場合もある。このような場合には測定誤差による影響を別に考慮する必要がある。
[編集] 真の値
上記のように測定値から誤差を無くすことは不可能である。したがってわれわれが知り得るのは常に誤差付の値でしかない。しかしながら測定すべき量には測定方法とは無関係なある定まった値があると考えるのが合理的である。この値のことを誤差理論において 真の値 とよんでいる。
なお、量子力学によるとそもそも物理量そのものが確定した値を持たず、ある確率分布に従った拡がりを持つ(不確定性)。このことと誤差とは厳密に区別して考える必要がある。
[編集] 誤差の伝播
一般に測定によって最終的に求めたい値がひとつの測定の結果から得られるとは限らず、それぞれ固有の誤差を持つ複数の値から求めなければならない場合が多い。複数回の測定結果の平均を取る場合などもそのうちのひとつである。
[編集] 計算誤差の種類
[編集] 丸め誤差
数値を、どこかの桁で端数処理(切り上げ・切り捨て・四捨五入・五捨六入・丸めなど)をしたときに生じる誤差
[編集] 打ち切り誤差
計算処理を続ければ、精度がよくなるにもかかわらず、途中で計算を止めること(打ち切り)によって生じる誤差。1/3 ≒ 0.33333、円周率の計算など。
[編集] 情報落ち
コンピュータでの計算のときのように有効桁数が限られている条件下で、絶対値の大きい数と絶対値の小さい数の差を加減算したとき、絶対値の小さい数が無視されてしまう現象。以下のような例がある。
- 2.0 × 106 - 1.0 × 10-4 =1.9999999999 × 106であるべきが、
- 有効桁数7桁では
- 2.0 × 106 - 1.0 × 10-4 =2.0 × 106
- となってしまう。
[編集] 桁落ち
絶対値がほぼ等しい数値同士の減算を行った際、正規化の際有効数字が減少すること。 浮動小数点数は、有効桁が減少すると、それ以降の桁を演算結果にはありえない "0" を強制的に挿入するために、数値全体が信頼できないものになる。 本来なら絶対値がほぼ等しい数値同士の減算を行った際は、数値がほぼ 0 なので、この数値で何らかの数値を割り算することは、0 で除算することとほぼ同じであるが、正規化された数値は 0 ではないので、除算はもちろん乗算などのすべての四則演算をこの数値で行えば行うほど、誤差は蓄積されていくものと推測される。 演算式の並びを工夫することで、誤差を減らすことができる。
例えば、有効数字8桁で
を考える。
まともに式の通りに計算すると
有効数字が5桁になってしまう。
式を工夫して、ほぼ等しい数値同士の減算を回避すると
[編集] 各数値形式に発生する誤差
2進浮動小数点数 | 2進固定小数点数 | 2進化10進数 | |
打ち切り誤差 | 起きる | 起きる | 起きる |
丸め誤差 | 起きる | 起きる | 起きる |
情報落ち | 起きる | ||
桁落ち | 起きる | 起きる | 起きる |
桁あふれ | 起きる | 起きる | 起きる |