數據處理基礎(一)
- 2019 年 11 月 24 日
- 筆記

最近要考試,對於成天翹課的我來說,不然不翻來從淘寶買來的舊書,預祝考到 61
《實驗設計與數據處理》是於 2009 年 10 月由化學工業出版社出版的圖書,作者是張成軍。本書通過典型實例介紹了常用實驗設計及實驗數據處理方法在科學研究和工業生產中的實際應用。

在這裡插入圖片描述
最近考了實驗設計與數據處理,雖說這是一本化學實驗數據處理的書,但我更覺得是一本分析化學的書,還不如說是一本數據相關的書,也有概率論的味道,做數據的應該學習下最基本的數據處理基礎
本文採用的 latex 排版公式 (由於很久沒使用),用時有點大
latex:使用
- https://blog.csdn.net/weixin_44510615/article/details/88911347
在 Latex 里打 x 的平均值
overline{x}
要在 latex 中輸入的文字帶有反斜杠和 % 該如何顯示?
百分號可以用 % 來輸入,反斜杠用 backslash 輸入。
誤差
誤差是測量測得的量值減去參考量值。測得的量值簡稱測得值,代表測量結果的量值。所謂參考量值,一般由量的真值或約定量值來表示。對於測量而言,人們往往把一個量在被觀測時,其本身所具有的真實大小認為是被測量的真值。
系統誤差
系統誤差,是指一種非隨機性誤差。如違反隨機原則的偏向性誤差,在抽樣中由登記記錄造成的誤差等。它使總體特徵值在樣本中變得過高或過低。是可以避免的。產生原因主要有:
- 所抽取的樣本不符合研究任務;
- 不了解總體分佈的性質選擇了可能曲解總體分佈的抽樣程序;
- 有意識地選擇最方便的和解決問題最有利的總體元素,但這些元素並不代表總體
隨機誤差
隨機誤差也稱為偶然誤差和不定誤差,是由於在測定過程中一系列有關因素微小的隨機波動而形成的具有相互抵償性的誤差。其產生的原因是分析過程中種種不穩定隨機因素的影響, 如室溫、相對濕度和氣壓等環境條件的不穩定, 分析人員操作的微小差異以及儀器的不穩定等。
精密度、準確度和精確度
- 精密度:測量中所測得數值重現性的程度,稱為精密度。它反映偶然誤差的影響程度,精密度高就表示偶然誤差小。
- 準確度是指你得到的測定結果與真實值之間的接近程度。
- 精確度(精度) 它反映測量中所有系統誤差和偶然誤差綜合的影響程度
雖然精確度高可說明準確度高,但精確的結果也可能是不準確的。例如,使用 1mg/L
的標準溶液進行測定時得到的結果是 1mg/L,則該結果是相當準確的。如果測得的三個結果分別為 1.73mg/L
, 1.74mg/L
和 1.75mg/L
,雖然它們的精確度高,但卻是不準確的。
精密度高的準確度不一定高,準確度高的精密度也不一定高,但精確度高,則精密度和準確度都高。
為了說明精密度與準確度的區別,可用下述打靶子例子來說明。

順序 abc
(a) 中表示精密度和準確度都很好,則精確度高;(b) 表示精密度很好,但準確度卻不高
表示精密度與準確度都不好。在實際測量中沒有像靶心那樣明確的真值,而是設法去測定這個未知的真值。
關於平均值術語
真值是待測物理量客觀存在的確定值,也稱理論值或定義值。通常真值是無法測得的。若在實驗中,測量的次數無限多時,根據誤差的分佈定律,正負誤差的出現幾率相等。再經過細緻地消除系統誤差,將測量值加以平均,可以獲得非常接近於真值的數值。但是實際上實驗測量的次數總是有限的。用有限測量值求得的平均值只能是近似真值,常用的平均值有下列幾種:
(1) 算術平均值 算術平均值是最常見的一種平均值。

在這裡插入圖片描述
(2) 幾何平均值 幾何平均值是將一組 n 個測量值連乘並開 n 次方求得的平均值。即

在這裡插入圖片描述
(3)均方根平均值
它的計算方法是先平方、再平均、然後開方。

在這裡插入圖片描述
(4) 對數平均值
在化學反應、熱量和質量傳遞中,其分佈曲線多具有對數的特性,在這種情況下表徵平均值常用對數平均值。
設兩個量

,

、 ,其對數平均值

在這裡插入圖片描述
變量的對數平均值總小於算術平均值
以上介紹各平均值的目的是要從一組測定值中找出最接近真值的那個值。在化工實驗和科學研究中,數據的分佈較多屬於正態分佈,所以通常採用算術平均值。
有關偏差的術語
偏差:分為絕對偏差、相對偏差、平均偏差、標準偏差和相對標準偏差。
- 極 差:是指某一次測定結果中極大值與極小值之間的差值。
- 絕對偏差:是指某一次測量值與平均值的差異。
- 相對平均偏差:是指某一次測量的絕對偏差佔平均值的比值。
- 平均偏差:是指單項測定值與平均值的偏差(取絕對值)之和,除以測定次數。
- 標準偏差(σ):是指統計結果在某一個時段內誤差上下波動的幅度。
- 相對標準偏差(RSD):是指標準偏差與測量結果算術平均值的比值。
測定某批次 5 袋藥品重量,得到如下數據:37.45、37.20、37.50、37.30、37.25(g),計算測定結果的平均值、極差、絕對偏差、平均偏差、相對平均偏差、標準偏差、相對標準偏差:
- 平 均 值:

- 極 差:

- 絕對偏差:各次測定的絕對偏差分別為 0.11、-0.14、0.16、-0.04、-0.09
- 平均偏差:

- 相對平均偏差:

- 標準偏差:

- 相對標準偏差:

下面是作業(當然不是我的)

在這裡插入圖片描述
有效數字及其運算規則
在科學與工程中,該用幾位有效數字來表示測量或計算結果,總是以一定位數的數字來表示。 不是說一個數值中小數點後面位數越多越準確。
有效數字
一個數據,其中除了起定位作用的 「0」 外,其他數都是有效數字。如 0.0037 只有兩位有效數字,而 370.0 則有四位有效數字。
2、有效數字運算規則
記錄測量數值時,只保留一位可疑數字。
當有效數字位數確定後,其餘數字一律捨棄。捨棄辦法是四捨六入,不是四捨五入,即末位有效數字後邊第一位小於 5,則捨棄不計;大於 5 則在前一位數上增 1;等於 5 時,前一位為奇數,則進 1 為偶數,前一位為偶數,則捨棄不計。這種舍入原則可簡述為:「小則舍,大則入,正好等於奇變偶」。
如:保留 4 位有效數字
- 3.71729→3.717;
- 5.14285→5.143
- 7.62356→7.624
- 9.37656→9.376
在加減計算中,各數所保留的位數,應與各數中小數點後位數最少的相同。
- 例如將

三個數字相加時,應寫為

。
在乘除運算中,各數所保留的位數,以各數中有效數字位數最少的那個數為準;其結果的有效數字位數亦應與原來各數中有效數字最少的那個數相同。
例如:

應寫成

。
上例說明,雖然這三個數的乘積為 0.3281823,但只應取其積為 0.328。
(5)在對數計算中,所取對數位數應與真數有效數字位數相同。