實際生產(chǎn)中同一項目的不同版本可能依賴不同的環(huán)境,這時需要在系統(tǒng)中安裝多個版本的Python。若直接在物理環(huán)境中進(jìn)行配置,多個版本的軟件之間會產(chǎn)生干擾。為了避免這種情況,應(yīng)使用virtualenv命令創(chuàng)建虛擬環(huán)境,以隔離不同版本的Python。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-09-13 |傳智教育 |隔離的python開發(fā)環(huán)境,Python版本干擾
matbtlb庫僅需開發(fā)人員編寫幾行代碼即可繪制一個圖表。下面結(jié)合面向?qū)ο蟮姆绞绞褂胢atpbtib庫繪制一個簡單的圖表,示例代碼如下: 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-09-06 |傳智教育 |matplotlib庫,matplotlib使用,matplotlib
OLTP是操作型處理,叫聯(lián)機事務(wù)處理OLTP(On-LineTransactionProcessing),主要目標(biāo)是做數(shù)據(jù)處理,它是針對具體業(yè)務(wù)在數(shù)據(jù)庫聯(lián)機的日常操作,通常對少數(shù)記錄進(jìn)行查詢、修改。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-08-22 |傳智教育 |OLTP和OLAP有什么區(qū)別
數(shù)據(jù)模型(Data Model)是數(shù)據(jù)庫系統(tǒng)的核心和基礎(chǔ),它是對現(xiàn)實世界數(shù)據(jù)特征的抽象,為數(shù)據(jù)庫系統(tǒng)的信息表示與操作提供一個抽象的框架。邏輯結(jié)構(gòu)設(shè)計是數(shù)據(jù)庫設(shè)計其中的一個環(huán)節(jié),而邏輯結(jié)構(gòu)設(shè)計的產(chǎn)物就是邏輯數(shù)據(jù)模型。邏輯數(shù)據(jù)模型包含以下幾種分類: 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-08-16 |傳智教育 |邏輯數(shù)據(jù)模型,關(guān)系模型和網(wǎng)狀模型
數(shù)據(jù)模型按照數(shù)據(jù)結(jié)構(gòu)主要分為層次模型(Hierarchical Model)、網(wǎng)狀模型(NetworkModel)、關(guān)系模型(Relational Model)和面向?qū)ο竽P?Object Oriented Model)。下面分別對這4種數(shù)據(jù)模型進(jìn)行講解。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-08-01 |傳智教育 |數(shù)據(jù)模型分類
DataFrame對象可以從RDD轉(zhuǎn)換而來,都是分布式數(shù)據(jù)集 其實就是轉(zhuǎn)換一下內(nèi)部存儲的結(jié)構(gòu),轉(zhuǎn)換為二維表結(jié)構(gòu)。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-07-28 |傳智教育 |基于RDD方式完成DataFrame的代碼構(gòu)建
時間序列(或稱動態(tài)數(shù)列)是指將同一統(tǒng)計指標(biāo)的數(shù)值按其發(fā)生的時間先后順序排列而成的數(shù)列,如某股票上半年的收盤價、某城市近10年的降雨量等。時間序列中的時間段可以是一組固定頻率或非固定頻率的時間值,時間形式可以是年份、季度、月份或其他時間形式。 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-07-25 |傳智教育 |時間序列,修改生成時間序列
內(nèi)部表(CREATE TABLE table_name ......)未被external關(guān)鍵字修飾的即是內(nèi)部表,即普通表。內(nèi)部表又稱管理表,內(nèi)部表數(shù)據(jù)存儲的位置由hive.metastore.warehouse.dir參數(shù)決定(默認(rèn):/user/hive/warehouse),刪除內(nèi)部表會直接刪除元數(shù)據(jù)(metadata)及存儲數(shù)據(jù)... 查看全文>>
Python+大數(shù)據(jù)技術(shù)文章2023-07-21 |傳智教育 |內(nèi)部表和外部表的區(qū)別,什么是內(nèi)部表