Hadoop + R 應用於資料分析

講者:李仁鐘, 華梵大學
時段:14:20~15:10
地點:4F國際會議廳
講題:Hadoop + R 應用於資料分析

摘要:

Hadoop 可以將運算的程式和放置的資料在每一個可以運行的節點間進行複製和自動化的備份,可以避免執行中的程式或存放的資料,因為電腦的硬體或系統的上的損壞而使程式無法執行或檔案損毀;Hadoop 可藉由分散處理,將資料和處理程序分散到可以使用的電腦上,而且這些電腦的數量可以達到上千台之多,它可用來可靠地儲存和處理PB級巨量資料。R 是常用的資料分析語言,可應用於巨量資料分析、統計分析、資料探勘、機器學習等等。R 與 Hadoop 結合可擴大 R 處理資料能力,使用 R 語言就可輕易使用 Hadoop 功能。本講題中將分享使用 R 與 Hadoop 來收集與分析 LOG 資料、將 MS SQL server 導入 Hadoop 中並使用文字雲來分析資料。

講者簡介:

華梵大學資管系教授/圖書資訊長
Tagged on: ,