位置:首頁 > 軟件操作教程 > 辦公軟件 > Excel > 問題詳情

學(xué)習(xí)教程:如何利用Excel來進(jìn)行數(shù)據(jù)分析

提問人:周麗平發(fā)布時(shí)間:2021-07-08

1、數(shù)據(jù)分析步驟:

提出問題→理解數(shù)據(jù)→數(shù)據(jù)清洗→構(gòu)建模型→數(shù)據(jù)可視化

2、實(shí)踐案例:

利用一份招聘網(wǎng)站的數(shù)據(jù)作為實(shí)戰(zhàn)案例。

第一步提出問題:

1)在哪些城市找到數(shù)據(jù)分師工作的機(jī)會(huì)比較大?

2)數(shù)據(jù)分師的薪水如何?

3)根據(jù)工作經(jīng)驗(yàn)的不同,薪酬是怎樣變化的?

第二步理解數(shù)據(jù):

初始數(shù)據(jù)有6875條,14項(xiàng)內(nèi)容。

image.png

設(shè)置表格列寬(步驟如下圖),顯示全部內(nèi)容,方便后續(xù)操作,最后保存。

image.png

第三步清洗數(shù)據(jù):

image.png

這一步需要花費(fèi)的時(shí)間占大部分,把數(shù)據(jù)處理成自己想要的樣子。

1、選擇子集:選擇公司全名和公司ID兩列并隱藏(取消隱藏方法:全選表格→開始→格式→隱藏和取消隱藏→取消隱藏列)

image.png

2、列名重命名:雙擊列名可以修改成自己想要的列名。

3、刪除重復(fù)值:選擇職位ID將其重復(fù)值刪除(步驟如下圖)


image.png

4、缺失值處理:選擇職位ID列計(jì)數(shù)5032,選擇城市列計(jì)數(shù)5030,城市列缺失兩個(gè)數(shù)據(jù)。

image.png

查找并定位城市列的缺失值(步驟如下圖),缺失值填上海。

image.png                                          image.png

缺失值處理的4種方法,根據(jù)情況靈活使用:

1)通過人工手動(dòng)補(bǔ)全;

2)刪除缺失的數(shù)據(jù);

3)用平均值代替缺失值;

4)用統(tǒng)計(jì)模型計(jì)算出的值去代替缺失值。

5、一致化處理:對“公司所屬領(lǐng)域”進(jìn)行一致化處理(步驟如下圖)

image.png

將原來的“公司所屬領(lǐng)域”列隱藏,并將復(fù)制的列進(jìn)行分列:

image.png

6、數(shù)據(jù)排序:

7、異常值處理:

第四步構(gòu)建模型

第五步數(shù)據(jù)可視化

通過上面的分析,我們可以得到的以下分析結(jié)論有:

1)數(shù)據(jù)分析這一崗位,有大量的工作機(jī)會(huì)集中在北上廣深以及新一線城市,如果你將來去這些城市找工作,可以提高你成功的條件概率。

2)從待遇上看,數(shù)據(jù)分析師留在深圳發(fā)展是個(gè)不錯(cuò)的選擇,其次是北京、上海。

3)數(shù)據(jù)分析是個(gè)年輕的職業(yè)方向,大量的工作經(jīng)驗(yàn)需求集中在1-3年。

對于數(shù)據(jù)分析師來說,5年似乎是個(gè)瓶頸期,如果在5年之內(nèi)沒有提升自己的能力,大概以后的競爭壓力會(huì)比較大。

4)隨著經(jīng)驗(yàn)的提升,數(shù)據(jù)分析師的薪酬也在不斷提高,10年以上工作經(jīng)驗(yàn)的人,能獲得相當(dāng)豐厚的薪酬。

3、劃重點(diǎn):

1)分列功能會(huì)覆蓋掉右列單元格,所以我們記得先要復(fù)制這一列到最后一個(gè)空白列的地方,再進(jìn)行分列操作。

image.png

2)上面圖片中的函數(shù):IF(COUNT(FIND({"數(shù)據(jù)運(yùn)營","數(shù)據(jù)分析","分析師"},L2)),"是","否")。

3)Ctrl+Eneter快捷鍵,在不連續(xù)的單元格中同時(shí)輸入同一個(gè)數(shù)據(jù)或公式時(shí)很好用。

4)精確查找和近似查找(模糊查找)的區(qū)別

(1)精確查找是指從第一行開始往最后一行逐個(gè)查找。一找到匹配項(xiàng)就停止查詢,所以返回找到的第一個(gè)值。

(2)當(dāng)你要近似查找的時(shí)候,它就會(huì)苦逼地查遍所有的數(shù)據(jù),返回的是最后一個(gè)匹配到的值。

5)在使用vlookup函數(shù)時(shí),在很多情況下使用的是精確匹配,而在進(jìn)行分組時(shí)需要用模糊匹配,所以這里要輸入“1”來進(jìn)行模糊匹配。

6)Excel設(shè)置了快捷鍵F4幫助用戶迅速切換相對引用、絕對引用和混合引用,步驟如下:

(1)選定包含該公式的單元格;

(2)在編輯欄中選擇要更改的公式內(nèi)容,并按 F4 鍵;

(3)以引用單元格A1為例,每次按 F4 鍵時(shí),Excel會(huì)依次在以下組合間切換:

按一次F4是絕對引用

按兩次、三次F4是混合引用

按四次F4是相對引用

7)使用這個(gè)函數(shù)過程中,如果出現(xiàn)錯(cuò)誤標(biāo)識(shí)“#N/A”,一般是3個(gè)原因?qū)е拢?/p>

(1)第2個(gè)參數(shù):查找范圍里第一列的值必須是要查找的值。

比如這個(gè)案例里第2個(gè)參數(shù)選定的的范圍里第一列是姓名,是要查找值的列。

(2)數(shù)據(jù)存在空格,此時(shí)可以嵌套使用TRIM函數(shù)將空格批量刪除。

(3)數(shù)據(jù)類型或格式不一致,此時(shí)將數(shù)據(jù)類型或格式轉(zhuǎn)為一致即可。

繼續(xù)查找其他問題的答案?

回復(fù)(0)
返回頂部