Categories
程式開發

AWS re:Invent第二天:SageMaker開發者工俱全家桶閃亮登場


拉斯維加斯時間2019年12月3日,AWS re:Invent大會進入第二天。在早上的主題演講環節,AWS CEO Andy Jassy再次發布了一連串新服務,簡單挑選部分、總結如下,供各位讀者參考。

基礎架構層

新的EC2實例:M6g、R6g與C6g

這三款新實例採用了第二代AWS定制的ARM芯片——graviton2。有意思的是這次的實例不再以A系列命名(第一代使用graviton的實例名稱叫做A1),而是直接放入了M系列、R系列與C系列。

新的EC2實例:Inf1

這款實例專門針對機器學習過程中的推斷(inference)負載進行了優化。

新的容器服務:Amazon Fargate for Amazon EKS

Fargate首次在去年發布,可以讓上層用戶以serverless的方式使用容器。去年僅支持ECS,今年增加了對EKS的支持。

新的網絡服務

網絡服務的增強目前看來是今年AWS re:Invent的重頭,不過Andy Jassy表示後面幾天才會深入介紹這一系列的網絡服務。目前看到的產品名稱有AWS Transit Gateway Multicast、AWS Accelerated Site to Site VPN、AWS Transit Gateway Inter-Region Peering、AWS Transit Gateway Network Manager,有助於客戶建立全球性的私有網絡。

數據層

Amazon S3 Access Points

配合IAM,管理員可以更加精準的控制哪些應用有權限訪問S3上的哪些數據。

Amazon Redshift RA3 Instances with Managed Storage

這個RA3實例的特點是可以把計算資源的使用與存儲資源的使用分別計費,那些只使用存儲的部分就只需要為存儲空間付費,不需要為計算資源付費。

AQUA for Amazon Redshift

這是一個非常有意思的新發布!可以說它是AWS團隊為應對未來的性能優化趨勢的一個嘗試。對於雲計算三大核心組件——計算、存儲、網絡,目前網絡是一個很大的性能瓶頸,所以AWS做了nitro系統在這方面做了很多優化。但是除了網絡之外,我們看到自從2012年以來至今,CPU的吞吐能力僅僅增加了2倍,而SSD存儲的吞吐能力已經增長了12倍,按照這個趨勢下去,下一個性能瓶頸將會出現在CPU上,而SSD的吞吐能力將有冗餘。這個AQUA的全稱叫做Advanced Query Accelerator,是一個查詢加速器,加速器的工作原理是把原本放在CPU上處理的查詢放到SSD上運行——這也是一種因為nitro系統而成為可能的操作方式。

UltraWarm

數據有冷數據,也有熱數據。 S3有Glacier針對冷數據的低成本存儲,而這次發布的UltraWarm則是針對ElasticSearch上的熱數據——那些新鮮的日誌文件。因為企業用戶常有分析日誌的需求,一直放在ElasticSearch上成本又太高,這種情況就可以把這些數據放到UltraWarm上,成本可以降低90%。

數據庫產品線新成員:Amazon Managed Cassandra Service

如果你需要在AWS上用Cassandra,那麼這個服務可以幫你省下不少維護的功夫。坦白講在2019年看到這個服務的發布讓小編有點吃驚——這說明現在在AWS上運行Cassandra的客戶不會在少數。

機器學習

TensorFlow、PyTorch、mxnet

AWS對這三個機器學習框架在AWS上的性能做了全面優化,號稱比山景城某司的私有部署環境的性能還要超出20%以上。

Amazon SageMaker Studio全家桶

開發者對集成開發環境(IDE)不陌生,但目前看來針對機器學習的開發者還沒有特別合適的IDE。這一次發布的SageMaker Studio號稱是針對機器學習開發者的IDE,並且從本次發布的陣營來看,遠遠不僅僅是一個在線代碼編輯器而已!本次發布已經包含如下組件:

  • Amazon SageMaker Notebooks – 用來存放機器學習工作流、代碼片段、文檔、運行結果等信息

  • Amazon SageMaker Experiments – 一個項目裡可以保存多個實驗(experiments),不同的實驗可以有不同的配置,可以方便的對不同實驗進行搜索、比對。

  • Amazon SageMaker Debugger – 一個調試工具,調試結果可以在Notebooks裡面查看。

  • Amazon SageMaker Model Monitor – 有的時候,一個模型在2016年、2017年都能做出很好的預測,到2018年卻不行了,因為外部環境改變了——比如銀行利率的影響因子、乃至於影響方式的改變。這個Monitor工具可以自動檢測模型是否仍然可以準確預測,在預測變得不准確的時候發出提醒以及給出可能的猜測。

  • Amazon SageMaker Autopilot – 在春天,你把訓練數據列表放到一個csv文件裡;到秋天,你收穫了一堆模型,可以選一個最好的進行部署。這個自動化機器學習工具是不是像它描述的這麼神奇?試試看大概會知道吧。

如果說今天的主題演講最熱門的發布是啥,小編覺得一定就是這套Amazon SageMaker開發者工俱全家桶了。

AWS re:Invent第二天:SageMaker開發者工俱全家桶閃亮登場 1

AI應用層服務

Amazon Fraud Detector

如果你有一個用戶的歷史登錄行為數據與購買數據,你把這個數據告訴這個Web服務,這個服務就會告訴你這個用戶是不是騙子。

Amazon CodeGuru

如果你在Github或者CodeCommit上做開發,你可以在發pull request的時候同步給這位CodeGuru,然後它就會給你做自動化的代碼審查(code review),並且把審查結果發佈到評論裡。對那些缺乏reviewer的項目來說,這個CodeGuru簡直像是一大神器!具體效果如何,還要等那些具體用過的同學們反饋了才知道。無論如何,有code review總是比沒有強。而且這個CodeGuru號稱自己最擅長做的事情是“找到代碼中最拖累效率的那一行”,非常有助於提升整體代碼的性能。

Contact Lens for Amazon Connect

Amazon Connect智能客服服務已經上線運行了幾年,於是有客戶提出各種意見:能不能自動分析客戶的通話?客戶對我們生氣的地方是什麼?我能不能搜索客戶的歷史通話?等等。於是AWS就把一系列服務打了個包,做成了這個Contact Lens數據分析服務。同時,AWS團隊意識到這麼一個服務其實也可以用在企業的內部數據上、產生新的價值,於是又同時做了另一個服務:

Amazon Kendra

這個Kendra服務的用法是,企業可以把自己過去的內部文檔——無論是word還是pdf還是在線文檔——授權給該服務,然後添加一些FAQ(常見問題)。之後,該服務會巡邏這些文檔、建成索引,生成能聽懂人話的問答服務。

至此,AWS在人工智能領域的服務能力又往前走了一大截。

不同部署環境下的AWS

私有云部署AWS Outposts

AWS在去年發布的Outposts服務回應了企業對私有化部署的需求,不過當時還是一個Preview,本次則正式可用了,這意味著以後用私有云的企業客戶也可以在私有云環境裡使用跟AWS公有云上一樣體驗的API。另外,VMware Cloud on AWS的部署將在2020年可用。

讓沒有AZ的城市也能低延遲用上AWS服務的Local Zones

AWS目前雖然在全球已經做了22個區域(Region)、69個可用區(AZ),但全球一共有一萬多城市,很多城市用AWS的延時還是比較高的,有一定的用戶數量。於是就有了Local Zones:這是一個Region的延伸單元,可以由AWS原有基礎架構中就存在的邊緣站點(Placement Group)改造而成,也可以新建,配備了EC2、EBS、FSx、VPC、 ELB、RDS等最基本的AWS服務,放置在一個城市的周邊為該城市的用戶提供服務。

讓5G用戶也能低延遲用上AWS服務的AWS Wavelength

AWS把基礎架構延伸到運營商合作夥伴的5G網絡邊緣,作為一個Wavelength Zone,給5G網絡覆蓋的用戶就近提供Web服務。目前公開的運營商合作夥伴,在美國是Verizon,歐洲是Vodafone,日本是KDDI,韓國是SK Telecom。

延展閱讀

AWS re:Invent 第一日新品發布一覽