Categories
程式開發

用PyTorch單挑全世界,特斯拉是如何實現自動駕駛的?

概要

  • 特斯拉的工程師們正致力於開發一種發展自動駕駛技術的方法,這種方法能夠真正適應數據的擴展,而不用因為數據規模擴展而增加工程師的人力。
  • 工程師們還在試圖盡可能有效地利用打標工人。這意味著要將數十億英里駕駛過程中出現的計算機視覺錯誤樣本都積累起來。
  • 人類輸入是一種信號源。人類行為能夠告訴機器哪些地方做錯了,在一些場景下還能夠告訴機器怎樣做是對的。
  • 不管特斯拉是否會在全自動駕駛技術領域取得成功,但有一點是肯定的,特斯拉會在城市環境中部署半自動駕駛汽車。

Andrej Karpathy是特斯拉(TSLA,https://seekingalpha.com/symbol/TSLA)的AI高級總監,他最近發表了一次演講(https://youtu.be/oBklltKXtDE

Categories
程式開發

飛行中換發動機:金融數倉架構轉型的最佳實踐

中國建設銀行有著將近20 年的數據倉庫建設歷史,其技術平台的轉型和應用建設過程,既是引領國內各大銀行數據倉庫建設的標杆和榜樣,同時也可以說是國內銀行業數倉建設歷程的一個縮影。

2000 年初,建行開始啟動數據倉庫的規劃和構建,最早採用了Teradata 一體機平台,為業務提供了集成、統一的數據倉庫平台,但隨著數據量和分析應用數量的快速增長,一體機平台成本昂貴、技術封閉等痛點開始顯現。

2012 年,建行啟動新一代架構建設,在數據線引入基於 X86 架構的 MPP …

Categories
程式開發

银行的云计算应用

导读:这是系列文章之一。本系列梳理了国内外银行信息化历程,包含区块链、云计算、物联网、移动端、人工智能各方面的应用情况。

一、云计算发展简介

1963年,DARPA(美国国防高级研究计划局)向麻省理工学院提供了约200万美元的津贴,启动了著名的MAC项目,要求麻省理工开发“多人可同时使用的电脑系统”技术。当时麻省理工就构想了“计算机公共事业”,即让计算成为像电力一样供应。这个项目产生了“云”和“虚拟化”技术的雏形。

然而,有趣的是,尽管思想萌芽出现的很早,但直到将近40年后的2006年,“云计算”这一术语才出现在商业领域,Google、亚马逊和IBM先后提出了云端应用。

Google一开始是为了将大量廉价的服务器组合起来支持其庞大的搜索业务;亚马逊则是因为自建数据中心后,为了将多余的空间出租出去,而推出了EC2 (Elastic Compute Cloud)云服务;IBM则是在从硬件制造商转型为企业级软硬件整体解决方案供应商的过程中,逐渐形成云服务能力,与2007年推出了Blue Cloud服务,但是最终,起步并不晚的IBM却错失了“云计算”的快车;2008年,微软在其开发者大会上发布了PaaS云计算平台──Azure Service …

Categories
程式開發

未編譯Python代碼比Go慢100倍

我是編譯型編程語言的忠實粉絲,一直都是。雖然解釋型編程語言可以讓開發者更快地編寫和測試代碼,但我仍然認為編譯器是值得長期投入的。在我看來,編譯型代碼有兩個明顯的優勢:

  • 每次修改代碼都可以得到驗證,甚至是在開始運行代碼之前。

  • 更快的執行速度。根據具體情況,代碼可能被編譯成非常底層的運行指令。

我之所以要寫這篇文章,是想比較一下編譯型代碼的執行速度會比解釋型快多少。

因為我偏愛編譯型編程語言,所以現在有個問題:我手頭有很多感興趣的代碼,但它們都是用 Python 寫的,我該怎麼辦?全部重寫?部分重寫?完全不重寫?

先入之見

Categories
程式開發

把阿里巴巴的核心系統搬到雲上,架構上的挑戰與演進是什麼?

阿里巴巴核心系統作為全球最大規模、峰值性能要求最高的電商交易系統,在 2018 年之前只通過混合雲彈性上雲方式,為雙 11 節約大量成本。直到 2019 年,阿里巴巴實現了核心交易系統全面上雲並經歷了雙 11 峰值的考驗。

在今天由極客邦科技舉辦的 …

Categories
程式開發

專訪騰訊秦振華:全球 IPv4 地址正式耗盡,我們該如何應對IPv6改造?

11 月25 日,負責英國、歐洲、中東和部分中亞地區互聯網資源分配的歐洲網絡協調中心(RIPE NCC)宣布,其最後的IPv4 地址空間儲備池已經完全耗盡,所有43 億個IPv4 地址已分配完畢。這意味著沒有更多的 IPv4 地址可以分配給 ISP …

Categories
程式開發

视频质量机器过滤技术浅析(一):系统与算法概述

短视频信息流产品是目前最炙手可热的互联网产品之一,每天会有海量的UGC与PGC视频被生产出来。如何平衡人工成本,高效地审核视频质量,挑出真正好的视频?基于AI算法准确识别视频质量并进行机器过滤,可以提高视频生产效率和生产质量,并最终提升用户体验。本专题具体介绍阿里文娱基于视频封面、标题、内容等多个维度的质量评价算法、系统与平台架构,以及业务落地与应用结果等。本文是专题的第一篇文章。

1 技术背景:为什么需要机器过滤?

在优酷,每天有大量的新增短视频产生,经过预处理或基础过滤后,仍有数十万量级的短视频进入视频质量审核链路,更是有海量的存量视频,而每日人工审核资源是有限的,如何平衡人工成本,高效地审核视频质量,挑出真正“好”的视频并呈现给终端用户?。

我们将结合阿里文娱摩酷实验室的实践,将AI进行海量视频筛选与低质视频机器过滤工作进行总结,希望对视频质量多维评价算法方向有启发,提升视频质量审核效率。

2 机器过滤概述:基于算法进行视频多维度的质量评价

视频审核是一条复杂链路,但基本可以简化为红线审核、机器过滤和人工审核等主要步骤。如下图所示,每个步骤都可能涉及到视频安全的审核和视频质量的审核(广义来讲,视频安全也是视频质量的一部分),人工审核过程也可能包含有基于不同业务要求或分类场景下的精细化机器审核等前置流程。

视频质量机器过滤技术浅析(一):系统与算法概述 27

图1: 视频审核链路简化流程…

Categories
程式開發

AWS將Amazon SageMaker Opeartors正式引入Kubernetes,開發者可輕鬆訓練模型

美國時間2019年12月2日,AWS在 AWS re:Invent 大會現場宣布將Amazon SageMaker Opeartors正式引入Kubernetes,這項新功能將幫助使用Kubernetes的開發人員與數據科學家輕鬆在Amazon SageMaker當中訓練、調整以及部署機器學習模型。

客戶現在可以在Kubernetes集群上安裝這些Amazon SageMaker Operators,並通過Kubernetes …

Categories
程式開發

複製粘貼一時爽:傳播最廣的一段Java代碼曝出Bug

複製粘貼一時爽,頻出bug火葬場。對開發者而言,Stack Overflow和GitHub是最為熟悉不過的兩大平台,這些平台充斥著大量開源項目信息和解決各類問題的代碼片段。最近,一位叫做Aioobe的開發者在一項調查中發現了一段自己十年前寫的代碼,這段代碼成為了Stack Overflow上複製次數最多、傳播範圍最廣的答案,GitHub的眾多項目中也存在這段代碼。然而,這位開發者表示這段代碼其實是有bug的,並於近日更新了答案並作出說明。

這段代碼是乾啥的?

2010年的時候,我整天泡在Stack Overflow上回答問題,希望可以提高自己的知名度。當時,有一個問題吸引了我的注意:如何以人類可讀的格式輸出字節數?舉個例子,將“123456789字節”轉換為“123.5 MB”的格式輸出。

複製粘貼一時爽:傳播最廣的一段Java代碼曝出Bug 36

這是現在的截圖,但問題確實是這個

這裡的隱含範式在於所得到的字符串值應該在1到999.9之間,後面再跟上一個大小合適的單位。當時已經有人給了一條回應。答案中的代碼以循環為基礎,基本思路非常簡單:嘗試所有單位,從最大(EB,即1018字節)到最小(B,即1字節),而後使用一種顯示數量小於實際字節數量的單位。用偽代碼寫出來,基本是這麼個意思:

suffixes   
Categories
程式開發

智能家居再曝漏洞:FBI警告用戶防範電視受到黑客攻擊

2018年5月,InfoQ曾報導過智能音箱竊聽事件,亞馬遜智能音箱Echo不僅偷錄了用戶的對話,還將這段對話隨機發給了用戶聯繫人列表中的一位朋友。事件曝光後引發了公眾對於智能設備的擔憂,然而就在近日,類似的事件再次發生了。

2019年11月26日,美國俄勒岡州聯邦調查局(FBI)發布了一篇文章,告知家中裝有智能電視的用戶注意隱私安全問題,不法分子有可能透過智能電視自帶的攝像頭、麥克風觀察甚至記錄用戶家中情況,雖然尚不清楚有哪些品牌的電視受到了影響,但該事件又一次將智能設備的安全性問題推上了風口。

FBI報告:智能電視也不安全

內置攝像頭成為黑客的“後門”

“雙十一”過去了,“黑五”過去了,家電產品想必是不少人下單的對象,然而大洋彼岸的FBI卻對這一設備發出了警告:你有可能正在被不法分子偷窺。

之所以將其稱為“智能電視”,是因為它們可以連接到互聯網,方便用戶使用流媒體服務和應用程序。而隨著AI技術的應用,對於有些懶得使用遙控器的用戶,只需要對著電視說出指令就可以完成一系列的操作。…