Categories
程式開發

在線廣告,新的互聯網泡沫?

我們生活在一個數字化的時代裡,互聯網前所未有地將世界上每個角落裡的人緊緊聯繫在一起。在這個時代,你真正地可以做到”用我的晚安陪你吃早餐“,也可以坐在北京的大雪紛飛裡,跟馬爾代夫海邊的旅行的朋友視頻 Say Hello。

那些傳統行業、傳統概念也搭上了“互聯網+”的概念,從此煥然一新。這其中,就包括在線廣告,這個互聯網時代的新廣告形式,也是互聯網時代的新泡沫。

2018年全年,全球數字廣告的支出高達2730億美元,折合人民幣約1.9萬億。你的每一次點擊,都為平台方帶去了數額不等的商業收入,然而對於付費的企業主來說,在線廣告的效果真有那麼好嗎?

在線廣告——巨頭們的天下

2018年全球數字廣告市場規模2730億美元,Google和Facebook佔了一半。移動廣告又成了在線廣告的主要來源,以Facebook為例:今年8月份,Facebook發布的季度財報顯示,該公司2019 年第二季度的移動廣告收入佔其廣告總收入的94%,比2018 年第二季度增長3%。根據 Facebook …

Categories
程式開發

難倒全球最強計算機視覺模型,ObjectNet讓識別準確率從90%下降至50%

在過去的十年裡,對象識別模型取得了長足的進步,但在精度方面,還有很長的路要走。如今的計算機視覺模型已經學會如何準確識別出照片中的對象,甚至能夠在某些數據集中獲得優於人類的識別表現。但是,這類對象檢測系統在真實場景中的表現卻仍然不夠理想。為了解決上述問題,近日,麻省理工學院和IBM組成的聯合團隊發布了一個最新的對象識別數據集—ObjectNet,旨在說明機器學習算法與人類之間的性能差距。

MIT和IBM提出最新數據集ObjectNet

與許多現有的數據集(現有的數據集往往直接提取Flickr及其他社交媒體網站上拍攝的照片)不同,ObjectNet的數據樣本是由自由職業者提供的付費照片。照片中的橘子、香蕉和衣服等物體被傾斜在一邊,以奇怪的角度拍攝,並展示在雜亂的房間裡。即使是能夠在ImageNet上獲得97%準確率的目前最先進對象檢測模型,在“迎戰”ObjectNet時,準確率也會迅猛下降至50%— 55%。

ObjectNet有一種新型的視覺數據集,它藉鑑了其他科學領域的控制思想。它甚至沒有培訓集,只提供測試集以加快流程。與其他常規圖像數據集相比,ObjectNet不包含訓練圖像。大多數數據集將自身素材分為兩個部分,分別為模型訓練數據,外加性能測試數據。但是,訓練集與測試集之間往往具有某種微妙的關聯或者說相似之處,在某些情況下無法進行精準的準確性驗證。

麻省理工學院計算機科學與人工智能實驗室(CSAIL)以及人腦、意識與機器中心(CBMM)研究科學家Boris Katz介紹,整個數據集從設計構思、標準紀數據收入流程外加應用程序開發,總共耗費了三年時間。…

Categories
程式開發

國信證券開源自研的微服務開發框架 Zebra

Zebra 為國信證券自主研發的一個高性能微服務開發框架,應用於國信證券金太陽 App 各個業務的後端,已穩定運行 2 年多。

發展歷程如下:

  • 2017.10 – 2018.04:完成首版本的設計與開發。
Categories
程式開發

地理文本处理技术在高德的演进(下)

四、query分析技术演进

4.1 城市分析

在高德地图的检索场景下,从基础的地图数据索引、到在线召回、最终产品展示,均以市级别行政单位为基础粒度。一次完整的检索需求除了用户输入的query外,还会包含用户的图面城市以及用户位置城市两个城市信息。

通常,大多数的搜索意图都是在图面或者用户位置城市下,但是仍存在部分检索意图需要在其他城市中进行,准确的识别出用户请求的目标城市,是满足用户需求的第一步,也是极其重要的一步。

地理文本处理技术在高德的演进(下) 5

在query分析策略流程中,部分策略会在城市分析的多个结果下并发执行,所以在架构上,城市分析的结果需要做到少而精。同时用户位置城市,图面城市,异地城市三个城市的信息存在明显差异性,不论是先验输出置信度,还是用后验特征做选择,都存在特征不可比的问题。…

Categories
程式開發

架構週報:Pornhub使用PHP建站;Nginx 之父被捕,前公司:版權應該歸我們;“通人性”Bug拖欠員工加班費7年…

「架構視點」是架構頭條公眾號新開設的內容欄目,試圖以新奇、有趣的視角,去觀察軟件架構乃至軟件開發中的那些不為人知的秘密。在這裡,你可以看到知名互聯網公司技術實踐中為人所忽略的方面,也可以看到軟件開發領域的那些奇談怪論,金玉良言。本期是第 0 期,我們打個樣,慢慢精進,也歡迎各位讀者朋友多提寶貴意見和線索來源。

萬萬沒想到系列

成人網站 Pornhub 公佈技術棧,使用 PHP 建站

成人網站在推動 …

Categories
程式開發

Q資訊:nginx 之父被告項目侵權;三星宣布已售出100萬部可折疊手機Galaxy Fold;孫宇晨微博新號再次被封;…

公司員工表示nginx 之父被警方帶走;甲骨文第二財季營收96億美元,淨利潤同比降1%; Facebook承諾投入1.3億美元建立內容監督委員會;三星稱其首款折疊機銷量破百萬,售價高昂近2000美元;三星擬將中國芯片工廠投資增至80億美元;微軟Visual Studio 2019 for Mac 8.4 Preview 4發布;瑞信:蘋果11月中國iPhone出貨量同比大降35%;孫宇晨微博新號再次被封。

Categories
程式開發

如何用WebAssembly將桌面遊戲編輯器移植到瀏覽器上

本文要點

  • 儘管WebAssemly還在積極開發當中,並且仍然比較小眾,但這項技術本身已經足夠成熟,足以用來將諸如桌面平台遊戲編輯器之類的複雜應用程序移植到Web上。
  • 將桌面平台軟件移植到WebAssembly的好處包括:移植的軟件可以跨平台交付,可能會吸引更多的目標受眾等。
  • 與原生桌面應用程序相比,前端框架和工具可簡化UI開發並縮短反饋週期。
  • Web還帶來了新的可能性,例如深層鏈接以及豐富的UI生態系統的幫助,這些可能會極大改善用戶體驗。
  • 開發人員必須特別注意內存管理、測試和鍵盤操作,以減少移植過程中出現的問題。

谷歌軟件工程師和GDevelop遊戲編輯器的創建者Florian

Categories
程式開發

如何使用Redis TimeSeries和Grafana實現實時分析

本文要點

  • 時序數據管理對於組織中的數據分析至關重要,舉例來說,股票價格或CPU性能指標都是時序數據。
  • 像RedisTimeSeries這樣專門構建的數據庫解決了處理時序數據的需求,同時擺脫了關係型數據庫強加給我們的限制。
  • 其他專門為此構建的數據庫包括InfluxDB和Prometheus。
  • 通過將Grafana和RedisTimeSeries集成在一起,我們可以實時放大或縮小圖表。

時序數據可以廣義地定義為按照時間順序存儲的一系列數據,舉例來說,多年內的股票價格變動或過去幾個小時CPU性能指標都是時序數據。時序數據廣泛用於很多垂直行業,因為關係型、面向文檔的以及流式數據庫都不能滿足這種特殊類型的數據的需求。

時序數據的特點

時序數據庫有著獨特的特點(如下面列表所示),如果與其他數據庫一起管理的話,通常會是非常低效的:

  1. 高速的數據攝入:不管是IoT使用場景還是市場分析數據,我們都會有一個穩定的數據流,數據以很快的速度抵達,而且常常是爆發性的。對於大多數解決方案,一年中365天,24/7之內都有數據抵達。
Categories
程式開發

Pinterest是如何基于Flink做实时分析的?

在Pinterest,我们每天都要进行数千个实验。我们主要依靠日常实验指标来评估实验效果。日常实验管道运行一次可能会花费10多个小时,有时还会超时,因此想要验证实验设置、触发的正确性以及预期的实验性能时就没那么方便了。当代码中存在一些错误时这个问题尤为突出。有时可能要花几天时间才能发现错误,这对用户体验和重要指标造成了更大的损害。我们在Pinterest开发了一个近实时实验平台,以提供更具时效性的实验指标,从而帮助我们尽快发现这些问题。

可能出现的问题有:

  1. 实验导致impression的统计数据显著下降,因此需要尽快关闭实验。
  2. 与对照组相比,实验导致搜索的执行次数显著增加。

Pinterest是如何基于Flink做实时分析的? 38

图1-带有置信区间的实时实验指标

上图的面板显示了所选事件的实验组和对照组的流量(也就是动作数)和倾向(也就是unique user的数量)。自实验开始以来,这些计数已经累计了3天时间。如果在3天后发生了re-ramp(分配给实验组和对照组的用户数量增加),则计数会归零0并重新开始累计3天时间。

为了确保实验组与对照组之间的对比在统计上是有效的,我们做了一些统计检验。由于指标是实时交付的,因此每次按顺序收到新记录时,我们都必须进行这些检验。这需要与传统的固定视野检验不一样的方法,否则会带来较高的假正率。我们考虑过几种顺序测试方法,包括赌徒破产、…

Categories
程式開發

五年了,Heartbleed漏洞仍未修復

五年了,Heartbleed漏洞仍未修復 49

五年了,Heartbleed安全漏洞補丁仍未全面普及。

Heartbleed安全漏洞在2012年被正式引入OpenSSL加密庫,但直到2014年才被發現並得到修復。但直到五年之後的今天,仍有眾多系統未能有效安裝修復補丁。

本文希望為IT團隊提供必要的信息,幫助大家判斷是否要使用Heartbleed漏洞的修復補丁。但這裡要提醒一句:即使安裝補丁,您的用戶數據仍有可能受到其他攻擊的影響。

Heartbleed安全漏洞是怎麼回事?

Heartbleed是OpenSSL加密庫中的一項代碼缺陷,具體如下:

memcpy(bp, pl, payload);

2014年,研究人員在流行密碼庫OpenSSL當中發現一項安全漏洞。順帶一提,OpenSSL負責為開發人員提供用於實現安全套接字層(SSL)與傳統層安全性(TLS)協議的工具與資源。

目前,各類網站、電子郵件、即時消息(IM)應用程序以及虛擬專用網絡(VPN)都依賴SSL與TLS協議,用以保障互聯網上通信內容的安全性與私密性。因此,只要使用OpenSSL組件,您的應用程序就會受到Heartbleed漏洞的影響。在漏洞曝光之時,已經有高達17%的SSL服務器被劃入影響範圍。…