新人入職場,會經常聽到老員工或者leader說,“這個業務我們要看XXX數據”“這個需求出個數據”等話題,很多新人初入職場的時候會很迷茫——數據是什么數據?哪些數據重要?我要怎么去分析數據才是有價值的?實際上,隨著大數據的發展,現在似乎越來越多的業務需要“數據意識”“數據分析”的能力,特別是大企業更是如此。簡單的來講,就是大企業的用戶多,產生的數據多,因此除了傳統的問卷調研、訪談等手段,還能通過大量的數據進行分析。這樣同樣能夠起到了解用戶反饋、產品效益的目的,甚至在很多情況下還會更準確、更省時間。
也因此,許多企業在招聘時會偏好有“數據分析”能力的候選人;同時很多打工人也發現,原有的Excel技能很難滿足自己的工作需求,有一定的數據能力能夠大大提升自己的辦公效率,開始自學數據分析。
今天,小助手就和大家分享下,除了常規的Excel,還有什么數據分析的工具值得用、值得學,主要分了三個等級
1.入門級:非數分方向的同學,如果僅是有一定的數據分析需求的話,學會這個就非常夠用了;
2.進階級:非數分方向的同學,如果對自己要求較高,又經常需要匯報演講,那這個就很合適;
3.專業級:數分方向的同學可以研究,非專業人士沒什么太大必要。
入門級:MySQL/ORACLE/POSTGRESQL
SQL基本上是數據方向上所有崗位的必備技能,重要程度和Excel不相上下。做數據分析專業的同學常常會稱自己為SQL民工也是因為同樣的原因。對于非數分崗位的同學,其實能夠掌握sql就非常足夠了。
SQL入門比較容易,概括起來就是在數據庫里搜索調取想要的數據,在數據庫里增刪改查新舊數據。總而言之,要想入行數據分析,SQL是必要技能。
進階級:TABLEAU/POWERBI:
作為可視化工具的Tableau和PowerBI在數據分析中也是不可或缺的一部分。Tableau的上手非常快,只要拖拽處理過的數據后便會產出很多精美的可視化圖像。
數據可視化簡單明了,用圖表來識別問題,在做數據分析和演講時都會讓你在工作上非常加分。適合有數據分析需求,又需要做匯報的同學。
專業級:PYTHON:
除了SQL外,如果需要更成熟的數分技能,Python也一定會要求(當然大多數非數分崗的打工人還不需要這么專業)。Python也是一款比較容易上手的數據分析軟件。寫作語法和英語比較相似,比起Java,C++等SDE必須要會的軟件更容易上手。
用Python清理數據和處理數據時往往比較方便快捷,同時,有很多數據科學家也會在Python中編寫模型。Python可以進行爬蟲,寫游戲,可以說是數據分析師一定要會的數據分析工具了。
專業級:R Programming:
隨著Python的廣泛應用,用R的分析師近幾年好像有所減少,但R多數被用于統計計算和圖形的編程語言的免費軟件。
R語言在統計學家和數據挖掘者中廣泛用于開發統計軟件和數據分析,同時R語言作為一個老牌分析軟件,其Library做的非常的完善,如果同學們在使用R語言時遇到任何問題都基本可以在Library里找到答案。
專業級:APACHE SPARK
Apache Spark是大數據分析軟件,用于大規模數據處理的統一分析引擎。
它提供Java,Scala,Python和R中的高級API,以及支持常規執行圖的優化引擎。 和Hadoop MapReduce一樣,用于在集群上使用并行的分布式算法來處理和生成大數據集。但Spark的執行速度比MapReduce快100倍,如果你想要進入大數據領域的分析師,Spark是一定要會的技能之一。
專業級:BIGML:
BigML是另一種廣泛使用工具,它提供了一個完全可交互的,可用于處理機器學習算法。
BigML提供了使用云計算滿足行業需求的標準化軟件。通過它,公司可以在公司的各個部門中使用機器學習算法。
例如,它可以將這一軟件用于銷售預測,風險分析和產品創新。 BigML專門從事預測建模。它使用各種各樣的機器學習算法,例如聚類,分類,時間序列預測等。