更新時間:2022年11月04日11時24分 來源:傳智教育 瀏覽次數(shù):
在Python中,我們可以通過dropna()方法來刪除含有空值或缺失值的行或列,其語法格式如下:
dropna(axis=0, how='any', thresh=None, subset=None, inplace=False
上述方法中部分參數(shù)表示的含義如下:
(1)axis:確定過濾行或列,取值可以為:
◆0或index:刪除包含缺失值的行,默認(rèn)為0。
◆1或columns:刪除包含缺失值的列。
(2)how:確定過濾的標(biāo)準(zhǔn),取值可以為:
◆any:默認(rèn)值。如果存在NaN值,則刪除改行或該列。
◆all:如果所有值都是NaN值,則刪除改行或該列。
(3)thresh:表示有效數(shù)據(jù)量的最小要求。若傳入了2,則是要求該行或該列至少有兩個非NaN值時將其保留。
(4)subset:表示在特定的子集中尋找NaN值。
(5)inplace:表示是否在原數(shù)據(jù)上操作。如果設(shè)為True,則表示修改原始數(shù)據(jù)的副本,返回新的數(shù)據(jù)。
假設(shè),現(xiàn)在有一張關(guān)于書籍信息的表格,它里面有類別、書名和作者三列數(shù)據(jù)。其中,在索引為0的一行中作者為None,則表明該位置的數(shù)據(jù)是空值。如果刪除這些空值和缺失值,那么刪除前后的效果如圖4-1所示。
圖4-1 刪除空值/缺失值前后的表格