Categories
程式開發

银行的云计算应用

导读:这是系列文章之一。本系列梳理了国内外银行信息化历程,包含区块链、云计算、物联网、移动端、人工智能各方面的应用情况。

一、云计算发展简介

1963年,DARPA(美国国防高级研究计划局)向麻省理工学院提供了约200万美元的津贴,启动了著名的MAC项目,要求麻省理工开发“多人可同时使用的电脑系统”技术。当时麻省理工就构想了“计算机公共事业”,即让计算成为像电力一样供应。这个项目产生了“云”和“虚拟化”技术的雏形。

然而,有趣的是,尽管思想萌芽出现的很早,但直到将近40年后的2006年,“云计算”这一术语才出现在商业领域,Google、亚马逊和IBM先后提出了云端应用。

Google一开始是为了将大量廉价的服务器组合起来支持其庞大的搜索业务;亚马逊则是因为自建数据中心后,为了将多余的空间出租出去,而推出了EC2 (Elastic Compute Cloud)云服务;IBM则是在从硬件制造商转型为企业级软硬件整体解决方案供应商的过程中,逐渐形成云服务能力,与2007年推出了Blue Cloud服务,但是最终,起步并不晚的IBM却错失了“云计算”的快车;2008年,微软在其开发者大会上发布了PaaS云计算平台──Azure Service …

Categories
程式開發

未編譯Python代碼比Go慢100倍

我是編譯型編程語言的忠實粉絲,一直都是。雖然解釋型編程語言可以讓開發者更快地編寫和測試代碼,但我仍然認為編譯器是值得長期投入的。在我看來,編譯型代碼有兩個明顯的優勢:

  • 每次修改代碼都可以得到驗證,甚至是在開始運行代碼之前。

  • 更快的執行速度。根據具體情況,代碼可能被編譯成非常底層的運行指令。

我之所以要寫這篇文章,是想比較一下編譯型代碼的執行速度會比解釋型快多少。

因為我偏愛編譯型編程語言,所以現在有個問題:我手頭有很多感興趣的代碼,但它們都是用 Python 寫的,我該怎麼辦?全部重寫?部分重寫?完全不重寫?

先入之見

Categories
程式開發

把阿里巴巴的核心系統搬到雲上,架構上的挑戰與演進是什麼?

阿里巴巴核心系統作為全球最大規模、峰值性能要求最高的電商交易系統,在 2018 年之前只通過混合雲彈性上雲方式,為雙 11 節約大量成本。直到 2019 年,阿里巴巴實現了核心交易系統全面上雲並經歷了雙 11 峰值的考驗。

在今天由極客邦科技舉辦的 …

Categories
程式開發

專訪騰訊秦振華:全球 IPv4 地址正式耗盡,我們該如何應對IPv6改造?

11 月25 日,負責英國、歐洲、中東和部分中亞地區互聯網資源分配的歐洲網絡協調中心(RIPE NCC)宣布,其最後的IPv4 地址空間儲備池已經完全耗盡,所有43 億個IPv4 地址已分配完畢。這意味著沒有更多的 IPv4 地址可以分配給 ISP …

Categories
程式開發

视频质量机器过滤技术浅析(一):系统与算法概述

短视频信息流产品是目前最炙手可热的互联网产品之一,每天会有海量的UGC与PGC视频被生产出来。如何平衡人工成本,高效地审核视频质量,挑出真正好的视频?基于AI算法准确识别视频质量并进行机器过滤,可以提高视频生产效率和生产质量,并最终提升用户体验。本专题具体介绍阿里文娱基于视频封面、标题、内容等多个维度的质量评价算法、系统与平台架构,以及业务落地与应用结果等。本文是专题的第一篇文章。

1 技术背景:为什么需要机器过滤?

在优酷,每天有大量的新增短视频产生,经过预处理或基础过滤后,仍有数十万量级的短视频进入视频质量审核链路,更是有海量的存量视频,而每日人工审核资源是有限的,如何平衡人工成本,高效地审核视频质量,挑出真正“好”的视频并呈现给终端用户?。

我们将结合阿里文娱摩酷实验室的实践,将AI进行海量视频筛选与低质视频机器过滤工作进行总结,希望对视频质量多维评价算法方向有启发,提升视频质量审核效率。

2 机器过滤概述:基于算法进行视频多维度的质量评价

视频审核是一条复杂链路,但基本可以简化为红线审核、机器过滤和人工审核等主要步骤。如下图所示,每个步骤都可能涉及到视频安全的审核和视频质量的审核(广义来讲,视频安全也是视频质量的一部分),人工审核过程也可能包含有基于不同业务要求或分类场景下的精细化机器审核等前置流程。

视频质量机器过滤技术浅析(一):系统与算法概述 22

图1: 视频审核链路简化流程…

Categories
程式開發

AWS將Amazon SageMaker Opeartors正式引入Kubernetes,開發者可輕鬆訓練模型

美國時間2019年12月2日,AWS在 AWS re:Invent 大會現場宣布將Amazon SageMaker Opeartors正式引入Kubernetes,這項新功能將幫助使用Kubernetes的開發人員與數據科學家輕鬆在Amazon SageMaker當中訓練、調整以及部署機器學習模型。

客戶現在可以在Kubernetes集群上安裝這些Amazon SageMaker Operators,並通過Kubernetes …

Categories
程式開發

複製粘貼一時爽:傳播最廣的一段Java代碼曝出Bug

複製粘貼一時爽,頻出bug火葬場。對開發者而言,Stack Overflow和GitHub是最為熟悉不過的兩大平台,這些平台充斥著大量開源項目信息和解決各類問題的代碼片段。最近,一位叫做Aioobe的開發者在一項調查中發現了一段自己十年前寫的代碼,這段代碼成為了Stack Overflow上複製次數最多、傳播範圍最廣的答案,GitHub的眾多項目中也存在這段代碼。然而,這位開發者表示這段代碼其實是有bug的,並於近日更新了答案並作出說明。

這段代碼是乾啥的?

2010年的時候,我整天泡在Stack Overflow上回答問題,希望可以提高自己的知名度。當時,有一個問題吸引了我的注意:如何以人類可讀的格式輸出字節數?舉個例子,將“123456789字節”轉換為“123.5 MB”的格式輸出。

複製粘貼一時爽:傳播最廣的一段Java代碼曝出Bug 31

這是現在的截圖,但問題確實是這個

這裡的隱含範式在於所得到的字符串值應該在1到999.9之間,後面再跟上一個大小合適的單位。當時已經有人給了一條回應。答案中的代碼以循環為基礎,基本思路非常簡單:嘗試所有單位,從最大(EB,即1018字節)到最小(B,即1字節),而後使用一種顯示數量小於實際字節數量的單位。用偽代碼寫出來,基本是這麼個意思:

suffixes   
Categories
程式開發

智能家居再曝漏洞:FBI警告用戶防範電視受到黑客攻擊

2018年5月,InfoQ曾報導過智能音箱竊聽事件,亞馬遜智能音箱Echo不僅偷錄了用戶的對話,還將這段對話隨機發給了用戶聯繫人列表中的一位朋友。事件曝光後引發了公眾對於智能設備的擔憂,然而就在近日,類似的事件再次發生了。

2019年11月26日,美國俄勒岡州聯邦調查局(FBI)發布了一篇文章,告知家中裝有智能電視的用戶注意隱私安全問題,不法分子有可能透過智能電視自帶的攝像頭、麥克風觀察甚至記錄用戶家中情況,雖然尚不清楚有哪些品牌的電視受到了影響,但該事件又一次將智能設備的安全性問題推上了風口。

FBI報告:智能電視也不安全

內置攝像頭成為黑客的“後門”

“雙十一”過去了,“黑五”過去了,家電產品想必是不少人下單的對象,然而大洋彼岸的FBI卻對這一設備發出了警告:你有可能正在被不法分子偷窺。

之所以將其稱為“智能電視”,是因為它們可以連接到互聯網,方便用戶使用流媒體服務和應用程序。而隨著AI技術的應用,對於有些懶得使用遙控器的用戶,只需要對著電視說出指令就可以完成一系列的操作。…

Categories
程式開發

宜信智能監控平台建設實踐

本文整理自宜信技術學院第6期技術沙龍,宜信智能監控平台負責人謝知求介紹宜信智能運維平台UAVStack的設計思想、技術架構和核心功能,及落地實踐經驗。

一、UAVStack平台的產生背景

宜信智能監控平台建設實踐 33

目前業界常用的監控軟件有很多,主流產品或以監控深度見長、或以監控廣度見長。

  • 關注監控廣度的代表產品是Prometheus,其特點是生態圈活躍,針對常見的互聯網中間件(如MySQL、Redis、Kafka、RocketMQ、MongoDB、ElasticSearch等)均提供了現成的指標採集插件來進行監控。類似產品還有Zabbix、Nagios和Open-Falcon。
  • 關注監控深度的產品也有很多,如聽雲、OneAPM、PinPoint、SkyWalking。這類軟件一般是探針型的,在應用性能監控方面提供了更深入的監控能力。

這些產品各有優勢,也存在不足之處:

  • 無法兼顧監控的廣度和深度;
  • 無法同時支持實時指標、調用鍊和日誌三類類數據的採集,未考慮這三類功能的集成連通性,無法解決數據的時效、品控、對齊等問題。

為了克服上述不足,同時滿足公司多樣化和智能化的監控需求、降低二研的成本和難度,我們自主研發了全維監控與智能運維基礎平台(UAVStack)。

宜信智能監控平台建設實踐 34

作為智能監控平台,監控僅僅是智能化運維的第一環。我們認為,智能運維(AIOps)可以分三步走:全維監控、全維關聯和全維智能。…

Categories
程式開發

日处理数据量超10亿:友信金服基于Flink构建实时用户画像系统的实践

引言

当今生活节奏日益加快,企业面对不断增加的海量信息,其信息筛选和处理效率低下的困扰与日俱增。由于用户营销不够细化,企业App中许多不合时宜或不合偏好的消息推送很大程度上影响了用户体验,甚至引发了用户流失。在此背景下,友信金服公司推行全域的数据体系战略,通过打通和整合集团各个业务线数据,利用大数据、人工智能等技术构建统一的数据资产,如ID-Mapping、用户标签等。友信金服用户画像项目正是以此为背景成立,旨在实现“数据驱动业务与运营”的集团战略。目前该系统支持日处理数据量超10亿,接入上百种合规数据源。

一、技术选型

传统基于Hadoop生态的离线数据存储计算方案已在业界大规模应用,但受制于离线计算的高时延性,越来越多的数据应用场景已从离线转为实时。这里引用一张表格对目前主流的实时计算框架做个对比。

日处理数据量超10亿:友信金服基于Flink构建实时用户画像系统的实践 75

Apache Storm的容错机制需要对每条数据进行应答(ACK),因此其吞吐量备受影响,在数据大吞吐量的场景下会有问题,因此不适用此项目的需求。

Apache Spark总体生态更为完善,且在机器学习的集成和应用性暂时领先,但Spark底层还是采用微批(Micro Batching)处理的形式。

Apache …