性xx色动画xx无尽,国产精品三级av三级av三级 ,中文在线√天堂,亚洲国产成人久久一区久久,亚洲熟妇色l20p

當前位置 : 首頁  圖書 正文

互聯(lián)網(wǎng)大數(shù)據(jù)處理技術與應用/大數(shù)據(jù)技術與應用專業(yè)規(guī)劃教材簡介,目錄書摘

2019-12-13 18:13 來源:京東 作者:京東
處理大數(shù)據(jù)
互聯(lián)網(wǎng)大數(shù)據(jù)處理技術與應用/大數(shù)據(jù)技術與應用專業(yè)規(guī)劃教材
暫無報價
100+評論 99%好評
編輯推薦:  1.針對互聯(lián)網(wǎng)大數(shù)據(jù),從大數(shù)據(jù)的獲取到可視化展示與發(fā)布的整個過程,幫助讀者建立完整的知識體系。側重于非結構化數(shù)據(jù)處理與分析,有助于讀者接觸到更多的大數(shù)據(jù)核心關鍵技術。
  2.各章節(jié)融入了作者在教學和科研中所積累的一些值得深入探討的問題和觀點,具有一定的啟發(fā)性。
  3.理論與實踐相結合,各個章節(jié)包含有技術原理介紹,也包含實現(xiàn)技術、開源架構等方面的敘述,使得讀者能從中掌握技術應用及實現(xiàn)方法。
  4.注重產學結合,基于阿里云及其大數(shù)據(jù)平臺,構建了綜合應用實例,有效地集成運用了本書的一些關鍵技術,幫助讀者深入理解大數(shù)據(jù)處理技術。
內容簡介:  本書內容分為三個部分,第一部分為互聯(lián)網(wǎng)大數(shù)據(jù)的概述;第二部分為互聯(lián)網(wǎng)大數(shù)據(jù)的獲取與存儲,包括了靜態(tài)或動態(tài)WEB頁面內容獲取技術、結構化或非結構化數(shù)據(jù)的存儲、常見的開源系統(tǒng)等;第二部分為處理與分析技術,包括了文本數(shù)據(jù)預處理、數(shù)據(jù)內容的語義分析技術、文本內容分類技術、聚類分析、大數(shù)據(jù)中的隱私保護、大數(shù)據(jù)可視化等內容;第三部分為綜合應用。
目錄:第1部分概述
第1章互聯(lián)網(wǎng)大數(shù)據(jù)
1.1從IT走向DT
1.1.1信息化與Web時代
1.1.2大數(shù)據(jù)時代
1.2互聯(lián)網(wǎng)大數(shù)據(jù)及其特點
1.3互聯(lián)網(wǎng)大數(shù)據(jù)處理的相關技術
1.3.1技術體系構成
1.3.2相關技術研究
1.4互聯(lián)網(wǎng)大數(shù)據(jù)技術的發(fā)展
1.5本書內容安排
思考題
第2部分互聯(lián)網(wǎng)大數(shù)據(jù)的獲取
第2章Web頁面數(shù)據(jù)獲取
2.1網(wǎng)絡爬蟲技術概述
2.2爬蟲的內核技術
2.2.1Web服務器連接器
2.2.2頁面解析器
2.2.3爬行策略搜索
2.3主題爬蟲技術
2.3.1主題爬蟲模塊構成
2.3.2主題定義
2.3.3鏈接相關度估算
2.3.4內容相關度計算
2.4動態(tài)Web頁面獲取技術
2.4.1動態(tài)頁面的分類
2.4.2動態(tài)頁面的獲取方法
2.4.3模擬瀏覽器的實現(xiàn)
2.4.4基于腳本解析的實現(xiàn)
2.5微博信息內容獲取技術
2.6DeepWeb數(shù)據(jù)獲取技術
2.6.1相關概念
2.6.2DeepWeb數(shù)據(jù)獲取方法
2.7反爬蟲技術與反反爬蟲技術
2.7.1反爬蟲技術
2.7.2反反爬蟲技術
2.7.3爬蟲技術的展望
思考題
第3章互聯(lián)網(wǎng)大數(shù)據(jù)的提取技術
3.1Web頁面內容提取技術
3.1.1Web頁面內容提取的基本任務
3.1.2Web頁面解析方法概述
3.1.3基于HTMLParser的頁面解析
3.1.4基于Jsoup的頁面解析
3.2基于統(tǒng)計的Web信息抽取方法
3.3其他互聯(lián)網(wǎng)大數(shù)據(jù)的提取
3.4阿里云公眾趨勢分析中的信息提取應用
3.5互聯(lián)網(wǎng)大數(shù)據(jù)提取的挑戰(zhàn)性問題
思考題
第3部分互聯(lián)網(wǎng)大數(shù)據(jù)的結構化處理與分析技術
第4章結構化處理技術
4.1互聯(lián)網(wǎng)大數(shù)據(jù)中的文本信息特征
4.2中文文本的詞匯切分
4.2.1詞匯切分的一般流程
4.2.2基于詞典的分詞方法
4.2.3基于統(tǒng)計的分詞方法
4.2.4歧義處理
4.3詞性識別
4.3.1詞性標注的難點
4.3.2基于規(guī)則的方法
4.3.3基于統(tǒng)計的方法
4.4新詞識別
4.5停用詞的處理
4.6英文中的詞形規(guī)范化
4.7開源工具與平臺
4.7.1開源工具及應用
4.7.2阿里分詞器
思考題
第5章大數(shù)據(jù)語義分析技術
5.1語義及語義分析
5.2詞匯級別的語義技術
5.2.1詞匯的語義關系
5.2.2知識庫資源
5.2.3詞向量
5.2.4詞匯的語義相關度計算
5.3句子級別的語義分析技術
5.4命名實體識別技術
5.4.1命名實體識別的研究內容
5.4.2人名識別方法
5.4.3地名識別方法
5.4.4時間識別方法
5.4.5基于機器學習的命名實體識別
5.5大數(shù)據(jù)語義分析技術的發(fā)展
思考題
第6章大數(shù)據(jù)分析的模型與算法
6.1大數(shù)據(jù)分析技術概述
6.2特征選擇與特征提取
6.2.1特征選擇
6.2.2特征提取
6.2.3基于深度學習的特征提取
6.3文本的向量空間模型
6.3.1向量空間模型的維
6.3.2向量空間模型的坐標
6.3.3向量空間模型中的運算
6.3.4文本型數(shù)據(jù)的邏輯存儲結構
6.4文本的概率模型
6.4.1Ngram模型
6.4.2概率主題模型
6.5分類技術
6.5.1分類技術概要
6.5.2經典的分類技術
6.6聚類技術
6.7回歸分析
6.7.1回歸分析的基本思路
6.7.2線性回歸
6.7.3加權線性回歸
6.7.4邏輯回歸
6.8大數(shù)據(jù)分析算法的并行化
6.8.1并行化框架
6.8.2矩陣相乘的并行化
6.8.3經典分析算法的并行化
6.9基于阿里云大數(shù)據(jù)平臺的數(shù)據(jù)挖掘實例
6.9.1網(wǎng)絡數(shù)據(jù)流量分析
6.9.2網(wǎng)絡論壇話題分析
思考題
第7章大數(shù)據(jù)隱私保護
7.1隱私保護概述
7.2隱私保護模型
7.2.1隱私泄露場景
7.2.2k匿名及其演化
7.2.31多元化
7.3位置隱私保護
7.4社會網(wǎng)絡隱私保護
思考題
第8章大數(shù)據(jù)技術平臺
8.1概述
8.2大數(shù)據(jù)技術平臺的分類
8.3大數(shù)據(jù)存儲平臺
8.3.1大數(shù)據(jù)存儲需要考慮的因素
8.3.2HBase
8.3.3MongoDB
8.3.4Neo4j
8.3.5云數(shù)據(jù)庫
8.3.6其他
8.4大數(shù)據(jù)可視化
8.4.1大數(shù)據(jù)可視化的挑戰(zhàn)
8.4.2大數(shù)據(jù)可視化方法
8.4.3大數(shù)據(jù)可視化工具
8.5Hadoop
8.5.1Hadoop概述
8.5.2Hadoop生態(tài)圈及關鍵技術
8.5.3Hadoop的版本
8.6Spark
8.6.1Spark的概述
8.6.2Spark的生態(tài)圈
8.6.3SparkSQL
8.6.4Spark Streaming
8.6.5Spark機器學習
8.7阿里云大數(shù)據(jù)平臺
8.7.1飛天系統(tǒng)
8.7.2大數(shù)據(jù)集成平臺
思考題
第4部分綜 合 應 用
第9章基于阿里云大數(shù)據(jù)技術的個性化新聞推薦
9.1目的與任務
9.2系統(tǒng)架構
9.3存儲設計
9.3.1RDS
9.3.2OSS
9.3.3OTS
9.3.4MaxCompute
9.4軟件架構
9.4.1ECS
9.4.2爬蟲
9.4.3模型訓練
9.4.4分類過程
9.4.5開源代碼
9.5阿里云大數(shù)據(jù)的應用開發(fā)
9.5.1開發(fā)環(huán)境
9.5.2部署
9.5.3運行與測試
思考題
參考文獻
熱門推薦文章
相關優(yōu)評榜
品類齊全,輕松購物 多倉直發(fā),極速配送 正品行貨,精致服務 天天低價,暢選無憂
購物指南
購物流程
會員介紹
生活旅行/團購
常見問題
大家電
聯(lián)系客服
配送方式
上門自提
211限時達
配送服務查詢
配送費收取標準
海外配送
支付方式
貨到付款
在線支付
分期付款
郵局匯款
公司轉賬
售后服務
售后政策
價格保護
退款說明
返修/退換貨
取消訂單
特色服務
奪寶島
DIY裝機
延保服務
京東E卡
京東通信
京東JD+