中文字幕在线视频第一页,黄色毛片在线看,日本爱爱网站,亚洲系列中文字幕一区二区

您當前的位置是:  首頁 > 資訊 > 國際 >
 首頁 > 資訊 > 國際 >

AWS正式推出數(shù)據(jù)湖管理工具Lake Formation

2019-08-12 13:56:20   作者:   來源:CTI論壇   評論:0  點擊:


  Lake Formation可以將不同來源的數(shù)據(jù)移入數(shù)據(jù)湖中,并對數(shù)據(jù)進行爬梳、編目和整理,以利後續(xù)分析使用
  AWS在去年re:Invent 2018大會上介紹的數(shù)據(jù)湖管理工具AWS Lake Formation,現(xiàn)在推出正式版,用戶可以使用AWS Lake Formation對數(shù)據(jù)進行擷取、清理、分類、轉(zhuǎn)換以及保護的工作,方便後續(xù)分析或是機器學(xué)習(xí)使用。
  AWS提到,只要企業(yè)開始使用數(shù)字格式的數(shù)據(jù),那就可能需要建立一個數(shù)據(jù)倉儲,從CRM或是ERP等營運系統(tǒng)收集數(shù)據(jù),并給其他決策支援系統(tǒng)使用,這些數(shù)據(jù)包括未組織的原始數(shù)據(jù)、日志、圖片、影片或是掃描的文件等,而這也是數(shù)據(jù)湖的概念,將所有數(shù)據(jù)以各種規(guī)模與形式,儲存在中央儲存庫中。
  而AWS新推出的數(shù)據(jù)湖服務(wù)Lake Formation,能簡化數(shù)據(jù)湖的管理工作,用戶可以使用中央控制臺,處理建置和配置數(shù)據(jù)湖繁雜的工作,包括載入不同來源的數(shù)據(jù)、監(jiān)控數(shù)據(jù)流、設(shè)定數(shù)據(jù)分區(qū)、加密和管理金鑰,以及格式轉(zhuǎn)換與監(jiān)控營運等工作。
  只要在Lake Formation中指定數(shù)據(jù)來源,系統(tǒng)就會自動從數(shù)據(jù)庫和物件儲存擷取數(shù)據(jù),并將這些數(shù)據(jù)儲存到Amazon S3數(shù)據(jù)湖中,以適當?shù)拇笮∨c方式整理,增加存取效能,并以機器學(xué)習(xí)演算法清理和分類數(shù)據(jù),為敏感數(shù)據(jù)提供存取保護。
  用戶還可以使用Glue ML Transforms刪除數(shù)據(jù)湖中重復(fù)的數(shù)據(jù),提高後續(xù)分析數(shù)據(jù)的效率,避免因為重復(fù)的數(shù)據(jù),造成分析工作的混淆。AWS提到,這項工作并非單純透過鍵值比對,就能找出重復(fù)的數(shù)據(jù),很多情況需要進行模糊比對,像是當用戶需要在不同表格查詢類似的項目時,就需要使用模糊連接(Fuzzy Join),在不共用唯一鍵值的兩個數(shù)據(jù)庫表格查詢相似數(shù)據(jù)。
  在保護數(shù)據(jù)存取方面,用戶可以在Lake Formation中,定義精細的存取政策,保護Glue Data Catalog中的元數(shù)據(jù),以及儲存在Amazon S3的數(shù)據(jù),AWS提到,在數(shù)據(jù)湖中管理存取權(quán)限是一件復(fù)雜的任務(wù),因為數(shù)據(jù)的各種特性,包括結(jié)構(gòu)化與否、敏感性或是可存取的數(shù)據(jù)范圍不一,而Lake Formation賦予用戶以IAM使用者、角色、群組和AD來管理數(shù)據(jù)存取,也能夠拒絕表格特定的科目被存取。
【免責(zé)聲明】本文僅代表作者本人觀點,與CTI論壇無關(guān)。CTI論壇對文中陳述、觀點判斷保持中立,不對所包含內(nèi)容的準確性、可靠性或完整性提供任何明示或暗示的保證。請讀者僅作參考,并請自行承擔全部責(zé)任。

專題

CTI論壇會員企業(yè)

福泉市| 汝州市| 离岛区| 邮箱| 莱州市| 新巴尔虎右旗| 鄯善县| 吴堡县| 琼中| 博湖县| 通辽市| 蓬莱市| 海林市| 文登市| 彝良县| 永靖县| 尉氏县| 皋兰县| 吉安县| 钦州市| 克山县| 杭州市| 松潘县| 东乡县| 宣武区| 合江县| 汝城县| 温州市| 吐鲁番市| 西藏| 肥东县| 邮箱| 高邑县| 永吉县| 攀枝花市| 宝丰县| 邵武市| 辽宁省| 措美县| 五峰| 宣恩县|