天才教育網(wǎng)合作機構 > 小語種培訓機構 > 法語培訓機構 >

全國python學習中心

歡迎您!
朋友圈

400-850-8622

全國統(tǒng)一學習專線 9:00-21:00

位置:小語種培訓資訊 > 法語培訓資訊 > python基礎教程數(shù)據(jù)分析,【連載2】:python數(shù)據(jù)分析——python基礎教程掌握

python基礎教程數(shù)據(jù)分析,【連載2】:python數(shù)據(jù)分析——python基礎教程掌握

日期:2021-06-13 13:17:46     瀏覽:107    來源:全國python學習中心
核心提示:不管你是待業(yè)還是失業(yè),在這個被互聯(lián)網(wǎng)圍繞的時代里,選擇python基礎教程數(shù)據(jù)分析,就多了一項技能,還怕找不到工作?,還怕不好找工作?小編就來告訴你這個專業(yè)的優(yōu)勢到底體現(xiàn)在哪里:Python數(shù)據(jù)分析步驟,Pyth

不管你是待業(yè)還是失業(yè),在這個被互聯(lián)網(wǎng)圍繞的時代里,選擇python基礎教程數(shù)據(jù)分析,就多了一項技能,還怕找不到工作?,還怕不好找工作?小編就來告訴你這個專業(yè)的優(yōu)勢到底體現(xiàn)在哪里:Python數(shù)據(jù)分析步驟,Python數(shù)據(jù)分析學習路徑圖(120天Get新技能),【連載2】:python數(shù)據(jù)分析——python基礎教程掌握,利用Python進行數(shù)據(jù)分析(附詳細案例)??。

1.Python數(shù)據(jù)分析步驟

不管是用excel還是用Python, 數(shù)據(jù)分析過程都遵循一樣的套路。在學習完Python的基礎知識之后,我把用Python進行數(shù)據(jù)分析過程中涉及的函數(shù)都標注了出來以方便后來回憶查看。

2.Python數(shù)據(jù)分析學習路徑圖(120天Get新技能)

Python是一種面向對象、直譯式計算機程序設計語言,由Guido van Rossum于1989年底發(fā)明。由于他簡單、易學、免費開源、可移植性、可擴展性等特點,Python又被稱之為膠水語言。下圖為主要程序語言近年來的流行趨勢,Python受歡迎程度扶搖直上。 圖片來源用Python玩轉數(shù)據(jù)由于Python擁有非常豐富的庫,使其在數(shù)據(jù)分析領域也有廣泛的應用。由于Python本身有十分廣泛的應用,本期Python數(shù)據(jù)分析路線圖主要從數(shù)據(jù)分析從業(yè)人員的角度講述Python數(shù)據(jù)分析路線圖。整個路線圖計劃分成16周,120天左右。主要學習內容包括四大部分:1)Python工作環(huán)境及基礎語法知識了解(包括正則表達式相關知識學習);2)數(shù)據(jù)采集相關知識(python爬蟲相關知識);3)數(shù)據(jù)分析學習;4)數(shù)據(jù)可視化學習。PYTHON學習路徑計劃圖Python 工作環(huán)境及基礎語法知識了解對于Python基礎語法學習部分,學習周期大概為4周,需要的相關資源在網(wǎng)絡上都能找到免費的資源,而且質量都不錯。相關中文資源如下:1、python工作集成環(huán)境包Python(x,y):下載地址( )如果安裝了上面集成工作包,則下面的包不需要重新安裝了。關于包的安裝方法在學習資源圖書中都有介紹,通常安裝庫采用pip方法,也可以用pip list查詢系統(tǒng)安裝了哪些庫。3、學習資源圖書1)Python基礎教程(第2版)[電子版圖書自行百度]2)深入淺出Head First python(中文版)[電子版圖書自行百度]在線教程1)廖雪峰的python教程(

3.【連載2】:python數(shù)據(jù)分析——python基礎教程掌握

目錄1、為什么要學習PYTHON2、如何安裝PYTHON3、快速學會PYTHON的四個關鍵4、什么是模塊5、數(shù)據(jù)結構6、如何學編程最有效1、為什么要學習PYTHON許多大型網(wǎng)站它就是用它來開發(fā)的,例如我們知道的視頻網(wǎng)站又YouTube,還有國內的豆瓣,谷歌雅虎,甚至美國航天局都會大量的使用Python。由于大數(shù)據(jù)人工智能的出現(xiàn),使得數(shù)據(jù)分析的需求非常的火爆,這也是為什么python現(xiàn)在很流行的主要原因2、如何安裝PYTHON網(wǎng)上教程很多,但是要專職數(shù)據(jù)分析,基本的就是python3+jupyter notebook+Anaconda,Anaconda的很多數(shù)據(jù)包已經(jīng)打包好了,基本夠用,如果需要用到新的包,可以用pip方式下載,需要的時候再說。Anaconda:是包管理器和環(huán)境管理器,Jupyter notebook:可以將數(shù)據(jù)分析的代碼、圖像和文檔全部組合到一個web文檔中。3、快速學會PYTHON的四個關鍵數(shù)據(jù)類型、函數(shù)、條件判斷、循環(huán)【3.1】數(shù)據(jù)類型【3.1.1】什么是數(shù)據(jù)我現(xiàn)在看什么數(shù)據(jù)呢?數(shù)據(jù)是非常重要的,可以把數(shù)據(jù)看作是一切程序運行所需的原材料,有的數(shù)據(jù)呢,他來自程序本身,有的數(shù)據(jù)來自于用戶的輸入,比如使用程序過程中的輸入,我們使用編程語言來操作數(shù)據(jù),我們可以把程序看作那是一個大型的數(shù)據(jù)加工廠。其實微信公眾號對于我們來說也是個程序,如果你在個人微信公眾號輸入資料這兩個字,程序理解了你的輸入命令后,他就會把數(shù)據(jù)處理結果返回給你。那么程序中的數(shù)據(jù)是放在哪里的?【3.1.2】用什么存放數(shù)據(jù)在代碼里,我們用變量存放數(shù)據(jù),并用等號為變量賦值,變量概念,基本上和*代數(shù)的方程變量它是一樣的,只是在計算機程序中,變量不僅可以是素據(jù),還可以是任意的數(shù)據(jù)類型,比如,我這里定義了一個人的姓名叫馬云,把它放在這個變量,這個變量取了一個名字,叫string,他是變量的名稱,右邊的是變量的值,這樣你就可以在代碼的其他地方使用這個變量,它里面重換了就是,請教馬云這個人的數(shù)據(jù)。【3.1.2】什么是變量?所以呢,變量在代碼中就是用一個變量名來表示,前半部分名稱,還要能代表數(shù)據(jù)的意義,后半部分名稱呢,它能代表數(shù)據(jù)的類型,這樣當我們使用著的時候,可以方便的通過變量名稱,知道這個變量里面他是存放了什么數(shù)據(jù),而且還能根據(jù)這個變量名稱知道這個變量的類型。就像剛才圖片里name表示人的姓名,那么后面的str是最表示變量的數(shù)據(jù)類型,只要你通過這個變量名稱就知道俺這個變量里面他們放的是人的姓名。注意:就是數(shù)字不能作為變量名稱的開頭;同時我們要注意python,它是對大小寫敏感的,如果寫出了大小寫程序就會報錯。如下圖的nameStr:就是變量名稱+數(shù)據(jù)類型【3.1.3】注釋的兩種方法#單行注釋'''多行注釋……………………………………………………….'''【3.1.4】python數(shù)據(jù)類型分類分為字符串、數(shù)字、容器、布爾、none1、字符串*種字符串是:Python中最常見的數(shù)據(jù)類型,我們可以用單引號或雙引號來創(chuàng)建字符串,你可以用加號合并字符串,*個例子我例舉了你覺得怎樣,合并字符串,合并之后的字符串是馬云有錢?!咀址?s格式化】nameStr='我叫%s,我爹是%s'%('王思聰','王健林') print(nameStr) 我叫王思聰,我爹是王健林注意點:print后面的小引號,你竟然打成了‘,中英文環(huán)境一定要注明另外你原本的變量名是money,后面的變量名變味了moneyStr2,要注意前后的問題,否則也會出現(xiàn)問題3.2、數(shù)字數(shù)值類型分為三種:int(整數(shù))、float(浮點數(shù))、complex(復數(shù)),它們與數(shù)學中的概念相同,如3.2.1)int(整數(shù))age = 50即年齡為503.2.2)float(浮點數(shù))money = 3.53即錢為3.53元3.3、容器Python中為了存放不同的數(shù)據(jù)有4種容器,分別是列表(List)、元組(Tuple)、集合(Sets)、字典()首先說下:列表、元組、集合、字典的應用場景列表和元組有很多相似的地方,操作也差不多。不過列表是可變序列,元組為不可變序列。也就是說列表主要用于對象長度不可知的情況下,而元組用于對象長度已知的情況下,而且元組元素一旦創(chuàng)建變就不可修改。例如我們在打開一個文本時,并不知道里面有多少行文字,所以用列表來保存。而我們在儲存一個人的信息(名字,年齡,性別,假定只需要這三種信息,所以對象長度為3)的時候,就可以用元組來實現(xiàn)。字典主要應用于需要對元素進行標記的對象,這樣在使用的時候便不必記住元素列表中或者元組中的位置,只需要利用鍵來進行訪問對象中相應的值。集合中的元素不可重復的特點使它被拿來去重。比如我在爬去糗事百科全站的文章鏈接(存放與列表中)的時候,不可避免的會遇到重復的鏈接。這是我們只需將列表轉換為集合便能有效的去除重復部分。比如上面的例程。id = {'name': 'kyda', 'age': 19, ‘sex': 'man') print(id['age']) # 結果: # 193.3.1列表(list):列表用 [ ]表示,一看見方括號[ ]就要知道,哦,這是個列表,可重復哦列表的長度,用函數(shù)lenappend從列表*增加函數(shù),不去重del函數(shù)刪除列表中下標為1的元素,下標是從0開始數(shù)的查詢列表name的*個元素,也就是列表下標為0的元素,記得再次變量name_1首先指定列表name下標為2的元素,賦予新值wc,打印輸出修改后的結果3.3.2元組(tuple):元組使用小括號(),一看見(),就該知道,哦,這是一個元組,元組和列表的區(qū)別是元組的元素是不可更改的。查詢元組name_1的長度查詢元組name_1中下標為3的元素,打印出來3.4、集合用花括號{ }表示,它是不能重復有重復元素的容器,一看見花括號{ },哦,這是個集合上邊的結合,我在元素中定義了重復字符串亞馬遜,當打印輸出時,它自動只輸出*的重復值首先定義一個空的集合,往里面添加集合,使用update函數(shù),打印輸出用discard函數(shù)刪除集合daqiye中的阿里元素,需要注意的是要記住不同容器的操作方式,因為每個容器有不同的性質,沒有統(tǒng)一的標準,只能死記硬背,這樣更扎實一些查找一個元素在不在集合里,查完之后返回的是布爾值,true返回的意思,你查的對,它在里面呢先使用.discard函數(shù)刪除集合里面的阿里元素,再使用,update函數(shù)添加新的元素阿里3.4、字典它是存貯映射關系的容器,如賬號密碼。用花括號表示,需要注意的是要和集合區(qū)分來,看里面的元素是否有對應關系(字典里的映射關系用 :號表示),如果有 :,那么這就是,反之為集合,key值必須是*的,value可以。字典中左側部分為*的值key,右側可以是重復的3.5、布爾值用True和Falase 表示 ,要嚴格區(qū)分大小寫,主要應用在條件判斷上。3.6、空值None如圖:它是特殊的空值,就相當于占了個位置,但是它又沒有值,所以用None表示四、條件判斷 if ...:else:...這里就多了個elif,就是多了個條件判斷,注意格式,就是冒號:,別忘了,縮進已經(jīng)要對齊,可以用tab鍵進行操作,就是縮進4個空格,一定要對其哦邏輯 and 、or、not的用法五、循環(huán),批量處理數(shù)據(jù),把容器中的每個數(shù)據(jù)都按照規(guī)則進行重復處理,代碼塊格式:for i in 容器:(轉到下一行,縮進)要做的事情??梢赃@樣理解,i把所有的 eatlist列表里的數(shù)據(jù)都循環(huán)過一遍,簡單的循環(huán)將字典里的key,value轉換成大寫的,這在數(shù)據(jù)清洗中很重要,批量同一格式,這里用到了items()方法語法:返回值:返回可遍歷的(鍵, 值) 元組數(shù)組。countine循環(huán)break循環(huán),就是不再執(zhí)行這個循環(huán)了,退出python中break和continue的區(qū)別 - 人則魚 - 博客園六、函數(shù),函數(shù)就是別人已經(jīng)寫好的工具,可以重復使用,就是套路。也可以自己編寫函數(shù)自定義函數(shù)使用剛才定義好的add函數(shù),函數(shù)傳遞,一是按照定義的順序如上圖,二是使用參數(shù)名稱如下圖3.7、模塊,在py模塊。注意輸入地址時要用到雙\\,因為python導入文件時將\符號當做Tab鍵輸入導致語法錯誤,加入\\就可以解決以上是解決方式的連接八、數(shù)據(jù)結構隊列(queue)隊列就像你去餐廳外婆家吃飯排隊,新來的人在隊列尾部加入,叫做入隊。取完票的人從隊列首部離開隊列,叫做出隊官網(wǎng)使用操作文檔:介紹Python的包,了解常用的數(shù)據(jù)結構5. Data - Python 2.7.18 使用中daque的函數(shù),相當于在隊列后邊加了個數(shù)我們可以看見隊列的001沒有,道理很簡單,在隊列頭,使用popleft函數(shù)讓頭出去了棧(stack)棧這種數(shù)據(jù)結構有點像像生活中的木桶。你往棧中加入新的元素,就是入棧,新的元素總是放在木桶的最上面排序字典計數(shù)器Counter

4.利用Python進行數(shù)據(jù)分析(附詳細案例)

一、前期準備分析要用到兩個包:NumPy和Pandas,首先確保jupyter中成功安裝了這兩個包。#導入numpy包 import numpy as np #導入pandas包 import pandas as pd二、基礎知識2.1 一維數(shù)據(jù)分析:NumPy2.2 一維數(shù)據(jù)結構:Pandas2.3 二維數(shù)據(jù)分析:numpy對應array2.4 二維數(shù)據(jù)分析:pandas對應數(shù)據(jù)框DateFrame此處遇到一個問題:讀取Excel文件報錯。解決方法:1 查看Excel文件存放路徑具體操作:點擊文件名,鼠標右鍵,選擇“屬性”,找到下面標紅的兩個地方。2 將上面標紅的兩處合成文件的路徑,格式為文件夾\文件名,比如F:\ann\Untitled1.ipynb3 *把路徑中全部的斜杠(/)或者反斜杠(\)替換為雙反斜杠(\\)*的路徑為F:\\ann\\Untitled1.ipynb三、Python具體案例分析:藥店銷售數(shù)據(jù)3.1 提出問題分析指標:月均消費次數(shù)月均消費金額客單件消費趨勢3.2 理解數(shù)據(jù)3.3 清洗數(shù)據(jù)3.3.1 選擇子集3.3.2 列名重命名3.3.3 缺失數(shù)據(jù)處理(dropna()函數(shù))Python缺失值有3種:None,NA,NaN。(分析數(shù)據(jù)時,如果遇到什么錯誤,比如float錯誤,就要考慮是否為缺失值,若是,則需要處理掉)。Python內置的None值;pandas中,將缺失值表示 為NA,表示不可用not available;對應數(shù)值數(shù)據(jù),pandas使用浮點值NaN(Not a Number)表示缺失數(shù)據(jù);None和NaN的區(qū)別:None是Python的一種數(shù)據(jù)類型(NoneType),NaN是浮點類型(float),兩個都用作空值。3.3.4 數(shù)據(jù)類型轉換3.3.5 數(shù)據(jù)排序3.3.6 異常值處理3.4 構建模型3.4.1 指標1:月均消費次數(shù)=總消費次數(shù)/月份數(shù)3.4.2 指標2:月均消費金額=總消費金額/月份數(shù)3.4.3 指標3:客單價=總消費金額/總消費次數(shù)客單價(per customer ):商場(超市)每位顧客平均購買商品的金額,即是平均交易金額。3.4.3 消費趨勢End.

就拿大數(shù)據(jù)說話,優(yōu)勢一目了然,從事IT行業(yè),打開IT行業(yè)的新大門,找到適合自己的培訓機構,進行專業(yè)和系統(tǒng)的學習。

本文由 全國python學習中心 整理發(fā)布。更多培訓課程,學習資訊,課程優(yōu)惠,課程開班,學校地址等學校信息,可以留下你的聯(lián)系方式,讓課程老師跟你詳細解答:
咨詢電話:400-850-8622

如果本頁不是您要找的課程,您也可以百度查找一下: