1. 麻煩哪位發一下《R語言初學者指南》《數據挖掘導論》或《R語言實戰-機器學習與數據分析》的pdf,謝謝您!
2. 怎麼學慣用r語言進行數據挖掘
首先R是一種專業性很強的統計語言,如果想學得快一些的話,基本的統計學知識要懂,不然很多東西會掌握的比較慢。
掌握基本語法和操作,推薦國內的已經翻譯的比如《R語言實戰》《R語言編程藝術》,這個過程中最好結合一些小例子來做一些分析的東西。如果需要可視化的話,強烈不推薦學習R本身的作圖系統,實在是太不友好了.....還是用ggplot2吧。
掌握了上面的,就可以深入一些了,如果是做數據分析和可視化,推薦《ggplot2:數據分析與圖形藝術》,這個才是作圖的神器啊.....如果是空間分析相關的,推薦《Applied Spatial Data Analysis with R》,這個如果可以的話看英文版,而且要有地學的一些知識背景,中文版翻譯的太次了,盡量不要看。數據挖掘機器學習之類的,可以看看比如《數據挖掘與R語言》、《機器學習——實用案例解析》,不過我覺得這幾本書沒上面的那幾本好,但是可以大概看看是咋回事,最好還是看看專門的相關書籍,熟悉各種演算法和流程,到時候搜索R的package,照著文檔和例子搞定,不是特別難。
-
3. 《基於R語言數據挖掘的統計與分析》pdf下載在線閱讀全文,求百度網盤雲資源
《基於R語言數據挖掘的統計與分析》網路網盤pdf最新全集下載:
鏈接:https://pan..com/s/1XUAtM1-Fb-igAVYq_nZtlQ
4. 求《R語言實戰》全文免費下載百度網盤資源,謝謝~
《R語言實戰》網路網盤pdf最新全集下載:
鏈接: https://pan..com/s/1l4j98ELscMCHhfUd9Qxn2w
5. 老師有沒有 R語言與數據挖掘最佳實踐和經典案例 的電子版
不知不覺我跟R已經認識1年了,在這一周年的日子裡,寫篇紀念文章。
以前我並未對統計軟體有特殊的偏好,spss、sas、eviews都在用,三個中稍傾向於spss,主要因為它比較簡單,sas的學習難度和應用條件(模塊很多,文件太大)是我所難以接受的,eviews只在時間序列里用。那時更關注於具體的理論學習,不過在往深了學的時候,會有一個疑問,如果我在現實中要實現這些比較新的內容該怎麼辦?(商業軟體一般沒那麼新的前沿的內容),這些復雜的公式對於沒什麼編程基礎的我來說要實現起來真是難上加難。也是去年這時候,有一個曾經在學院任教的老師(現在是加拿大英屬哥倫比亞大學終身教授)回來給我們上了一個月的課,在這一個月的時間里,我接觸了R語言。
接下來的一年裡(現在依然如此),我始終處在自學R的階段,雖然辛苦也受益良多,一方面是終於可以擺脫傻瓜軟體的束縛(用了R之後,我基本不用spss了),另一方面也是最重要的是R鏡像站的文檔讓我學了太多以前沒接觸的前沿知識並通過R語言進行了實踐,這一切在以前都是不可想像的。
說實在的我的R水平還是處於基礎階段(雖然我已掌握了幾乎所有傳統統計學方法和數據挖掘演算法的R語言實現),目前在文本挖掘,高級編程上與專業人士還存在很大的差距,不過我會繼續努力。
R語言在中國的普及程度與國外簡直是沒法比,據我所知,目前高校用R作分析少之又少,企業普及率也低。不過,R的影響正在不斷擴大,統計之都舉辦的R語言會議已經到第5屆了,而且去年的參會陣容已經相當豪華了(謝邦昌都去了),我相信R的前景會越來越好,當然也希望我的R能力能更快的提高。
下面是轉的數據挖掘研究院的一篇文章(是篇翻譯文章),是講facebook和google的研究人員如何用R的。
在R用戶組織的主題為「R與預測分析科學」的panel會議上,有來自工業界的四位代表發表了講話,介紹各自在工業界是如何應用R進行數據挖掘。他們分別是:
Bo Cowgill, Google
Itamar Rosenn, Facebook
David Smith, Revolution Computing
Jim Porzak, The Generations Network
他們分別介紹了在各個公司是如何使用R進行預測分析,R作為分析工具的優勢和劣勢,並且提供了學習案例,以下是對他們的介紹的相關總結。
Panel介紹
R作為一門編程語言在以下三個方面具有很強的優勢:數據處理,統計和數據可視化。和其他數據分析工具不同的是,它是由統計學家開發的,它是免費的軟體,並且可以通過用戶開發的包進行擴展,目前大約有2000多個包在CRAN中。
很多包可以應用在預測分析中。Jim重點介紹了 Max Kuhn 的caret包,它提供了大量的分類和回歸模型,包括神經網路和樸素貝葉斯模型。
Bo Cowgill, Google
根據Bo Cowgill 的介紹,R是google最流行的統計分析包,事實上,google也是R基礎的捐助者。他講述道:R最好的事情是,它是統計學家發明的。它最糟糕的事情是,它是統計學家發明的。無論如何,他很樂觀地看待R開發者社區的發展,R文檔也逐步在改進,它的性能也在逐步提高。
Google主要使用R進行數據探索和構建模型原型,它並不是應用在生產系統,在Bo的團隊中,R主要運行在桌面環境中。Bo主要根據以下的流程使用R:(1)使用其他的工具提取數據;(2)將數據載入到R中;(3)使用R建模分析;(4)在生產環境中使用c 或者python實現結果模型。
Itamar Rosenn, Facebook
Itamar介紹了facebook數據團隊使用R的情況,他回答了新用戶提數的兩個問題:預測用戶是否保持在某個數據點,如果他們停留,如何預測他們在三個月之後是否還會停留。
對於第一個問題,Itamar的團隊使用遞歸劃分推斷出僅僅兩個數據點被預測出來用戶是否保留在facebook上:(1)新用戶擁有多個會話;(2)輸入用戶基本信息時。
對於第二個問題,他們使用最小角度回歸方法建立邏輯回歸模型(lars包),根據三個類別的行為發現用戶三個月的活動:(1)用戶被其他用戶訪問的頻率;(2)第三方應用程序使用的頻率;(3)即將訪問該站點的用戶。
David Smith, Revolution Computing
David的公司,R改革計算,不僅僅使用R,而且R是他們的核心業務。David描述道:他們對R的貢獻類似於redhat對linux 的貢獻。他的公司處理使用R遇到的一些問題,例如,(1)支持老版本軟體,即向下兼容;(2)通過他們的ParallelR套件可以支持並行計算。
David展示了他們的生命科學客戶是如何使用R通過randomForest包對基因組數據集進行分類處理,以及如何使用他們的foreach包對分類樹分析進行並行處理。
他還提到他們和其他公司合作將R應用在生產環境中,將特定的腳本放在伺服器上,用戶通過客戶端調用該腳本進行數據處理。
Jim Porzak, The Generations Network
Jim簡單介紹了如何使用R進行市場分析。尤其是,Jim還使用flexclust為sun公司的客戶數據進行聚類分析,並且應用該結果數據識別高價值銷售的主導業務。
在Q&A環節,還有很多提問,並且進行了回答。
1在使用R的過程中,如何解決內存限制問題?
R工作區是在RAM上,因此他的大小是受到限制的。
辦法:
(1) 使用R的資料庫連接功能(例如RMySQL),對數據進行切片處理
(2) 抽樣處理
(3) 在獨立的伺服器或者在amazon的雲計算環境中運行腳本
2R如何與其他工具和語言進行交互?
CRAN裡面有一些包提供了和matlab,splus,SAS,excel的交互介面,另外,還提供了與python和java的介麵包(Rpy和RJava)。
6. 《Python數據分析與挖掘實戰》epub下載在線閱讀全文,求百度網盤雲資源
《Python數據分析與挖掘實戰》(張良均)電子書網盤下載免費在線閱讀
鏈接:https://pan..com/s/1WwF3Vi3vszdZYBKKw7Y0HQ
書名:Python數據分析與挖掘實戰
作者:張良均
豆瓣評分:7.6
出版社:機械工業出版社
出版年份:2016-1
頁數:335
內容簡介:
10餘位數據挖掘領域資深專家和科研人員,10餘年大數據挖掘咨詢與實施經驗結晶。從數據挖掘的應用出發,以電力、航空、醫療、互聯網、生產製造以及公共服務等行業真實案例為主線,深入淺出介紹Python數據挖掘建模過程,實踐性極強。
本書共15章,分兩個部分:基礎篇、實戰篇。基礎篇介紹了數據挖掘的基本原理,實戰篇介紹了一個個真實案例,通過對案例深入淺出的剖析,使讀者在不知不覺中通過案例實踐獲得數據挖掘項目經驗,同時快速領悟看似難懂的數據挖掘理論。讀者在閱讀過程中,應充分利用隨書配套的案例建模數據,藉助相關的數據挖掘建模工具,通過上機實驗,以快速理解相關知識與理論。
基礎篇(第1~5章),第1章的主要內容是數據挖掘概述;第2章對本書所用到的數據挖掘建模工具Python語言進行了簡明扼要的說明;第3章、第4章、第5章對數據挖掘的建模過程,包括數據探索、數據預處理及挖掘建模的常用演算法與原理進行了介紹。
實戰篇(第6~15章),重點對數據挖掘技術在電力、航空、醫療、互聯網、生產製造以及公共服務等行業的應用進行了分析。在案例結構組織上,本書是按照先介紹案例背景與挖掘目標,再闡述分析方法與過程,最後完成模型構建的順序進行的,在建模過程的關鍵環節,穿插程序實現代碼。最後通過上機實踐,加深讀者對數據挖掘技術在案例應用中的理解。
作者簡介:
張良均 ,資深大數據挖掘專家和模式識別專家,高級信息項目管理師,有10多年的大數據挖掘應用、咨詢和培訓經驗。為電信、電力、政府、互聯網、生產製造、零售、銀行、生物、化工、醫葯等多個行業上百家大型企業提供過數據挖掘應用與咨詢服務,實踐經驗非常豐富。此外,他精通Java EE企業級應用開發,是廣東工業大學、華南師范大學、華南農業大學、貴州師范學院、韓山師范學院、廣東技術師范學院兼職教授,著有《神經網路實用教程》、《數據挖掘:實用案例分析》、《MATLAB數據分析與挖掘實戰》《R語言數據分析與挖掘實戰》等暢銷書。
7. 《R語言實戰(第2版)》pdf下載在線閱讀,求百度網盤雲資源
《R語言實戰(第2版)》([美] Robert I. Kabacoff)電子書網盤下載免費在線閱讀
資源鏈接:
鏈接:https://pan..com/s/1LGgzzjw4XSz159P0dCubFA
書名:R語言實戰(第2版)
作者:[美] Robert I. Kabacoff
譯者:王小寧
豆瓣評分:9.1
出版社:人民郵電出版社
出版年份:2016-5
頁數:556
內容簡介:
本書注重實用性,是一本全面而細致的R指南,高度概括了該軟體和它的強大功能,展示了使用的統計示例,且對於難以用傳統方法處理的凌亂、不完整和非正態的數據給出了優雅的處理方法。作者不僅僅探討統計分析,還闡述了大量探索和展示數據的圖形功能。新版做了大量更新和修正,新增了近200頁內容,介紹數據挖掘、預測性分析和高級編程。
作者簡介:
作者簡介:
Robert I. Kabacoff
R語言社區著名學習網站Quick-R的維護者,現為全球化開發與咨詢公司Management研究集團研發副總裁。此前,Kabacoff博士是佛羅里達諾瓦東南大學的教授,講授定量方法和統計編程的研究生課程。Kabacoff還是臨床心理學博士、統計顧問,擅長數據分析,在健康、金融服務、製造業、行為科學、政府和學術界有20餘年的研究和統計咨詢經驗。
譯者簡介:
王小寧
中國人民大學統計學院14級碩士,16級博士,統計之都副主編,中國人民大學數據挖掘中心分布式計算負責人,研究興趣包括統計機器學習和缺失數據。
劉擷芯
中國人民大學統計學院13級碩士,愛荷華大學商學院16級博士,中國人民大學數據挖掘中心核心成員之一,研究興趣包括統計機器學習和文本分析。
黃俊文
2014年畢業於中山大學數學系,2016年畢業於加州大學聖地亞哥分校統計學專業,統計之都成員,易易網創始人之一,目前關注計算機科學和統計學的結合與應用,包括機器學習方法等。他致力於成為一個有趣的人。
8. 求《R語言與大數據編程實戰》全文免費下載百度網盤資源,謝謝~
《R語言與大數據編程實戰》網路網盤pdf最新全集下載:
鏈接: https://pan..com/s/1VfVGvlRcVRwfPleEqKLJkQ
9. 求R語言實戰書籍電子版百度雲資源
《R語言實戰》網路網盤txt 最新全集下載:
鏈接:
書名:R語言實戰
作者:卡巴科弗 (Robert I.Kabacoff)
譯者:高濤
豆瓣評分:8.8
出版社:人民郵電出版社
出版年份:2013-1
頁數:388
內容簡介:
數據時代已經到來,但數據分析、數據挖掘人才卻十分短缺。由於「大數據」對每個領域的決定性影響,相對於經驗和直覺,在商業、經濟及其他領域中基於數據和分析去發現問題並作出科學、客觀的決策越來越重要。開源軟體R是世界上最流行的數據分析、統計計算及制圖語言,幾乎能夠完成任何數據處理任務,可安裝並運行於所有主流平台,為我們提供了成千上萬的專業模塊和實用工具,是從大數據中獲取有用信息的絕佳工具。 本書從解決實際問題入手,盡量跳脫統計學的理論闡述來討論R語言及其應用,講解清晰透澈,極具實用性。作者不僅高度概括了R語言的強大功能、展示了各種實用的統計示例,而且對於難以用傳統方法分析的凌亂、不完整和非正態的數據也給出了完備的處理方法。通讀本書,你將全面掌握使用R語言進行數據分析、數據挖掘的技巧,並領略大量探索和展示數據的圖形功能,從而更加高效地進行分析與溝通。想要成為倍受高科技企業追捧的、炙手可熱的數據分析師嗎?想要科學分析數據並正確決策嗎?不妨從本書開始,挑戰大數據,用R開始炫酷的數據統計與分析吧! 本書內容: R安裝與操作
10. 數據挖掘與R語言的中文電子版 急求!!!
這本書沒有電子版呀,大家都是看英文版的,看著看著就習慣了。要不你買一本叫做《數據挖掘與R語言》的書,這本書有中文版的,是一個葡萄牙的作者寫的。