Categories
程式開發

程序員技術選型:寫Go還是Java?


老實說,我很喜歡Java。我在Spiral Scout 工作的那幾年,使用了EJB2、DB2 和Oracle 等後端技術,積累了很多軟件開發方面的專業知識。過去幾年,我轉向基於自然語言處理的機器人項目,涉及的技術包括Spring Boot、Redis、RabbitMQ、Open NLP、IBM Watson 和UIMA。一直以來,我選擇的語言是Java,它一直很高效,有時還會覺得它很有趣。

初遇Go

2017 年初,我接手了一個非常有趣的項目,一個用於監控和種植水培植物的自動化編程系統。項目的原始代碼裡包含了一個使用CGo 開發的支持三個不同系統(Windows、MacOS 和ARM)的網關。

因為對Go 不熟悉,我一邊學習,一邊用它來實現功能。因為已有代碼庫的結構非常複雜,對我來說是難上加難。用Go 開發的支持三種不同操作系統的程序意味著需要針對三種不同的系統進行部署、測試和運行維護。此外,代碼採用了單例設計模式,導致系統嚴重相互依賴,難以預測會出現什麼問題,而且難以理解。最後,我選擇使用Java 來實現新版本,但最終也變得非常醜陋和令人困惑。

在加入Spiral Scout 後,我嘗試停止使用Java。我決定擁抱Go,並儘可能多地使用Go 來開發。我發現它是一種創新且全面的語言,我們的團隊現在仍然每天在各種項目中使用它。

但是,與任何一門編程語言一樣,Go 也有它的缺點,而且我不想撒謊——有時候我真的很想念Java。

如果說我的編程經驗教會了我什麼,那一定是——軟件開發沒有銀彈。我將在這篇文章裡詳細分享我使用一門傳統語言和一門新語言的經歷。

簡潔性

Go 和Java 都是C 家族語言,所以它們具有相似的語法。因此,Java 開發人員可以很容易讀懂Go 代碼,反之亦然。 Go 不需要在語句末尾使用分號(’;’),只有少數情況例外。對我來說,Go 的行分隔方式更清晰,更易讀。

Go 和Java 都使用了我最喜歡的功能之一,即垃圾收集器(GC),用來幫助防止內存洩漏。與C++ 不同,C 家族的程序員需要處理內存洩漏問題。垃圾回收器是自動化內存管理的一個特性,減輕了程序員的負擔。

Go 的GC 並未使用“弱世代假設”,但它的表現仍然非常出色,並且STW(Stop-the-World)的時間非常短。在1.5 版中,STW 降得更多,並且很穩定,而在1.8 版中,它降到了1 毫秒以下。

程序員技術選型:寫Go還是Java? 1

Go 的GC 只有少量的一些選項,即用於設置初始垃圾回收目標百分比的GOGC 變量。而Java 有4 個不同的垃圾回收器,每個垃圾回收器都有大量的選項。

儘管Java 和Go 都被認為是跨平台的,但Java 需要Java 虛擬機(JVM)來解釋編譯後的代碼,而Go 是將代碼編譯成目標平台的二進製文件。但我認為,與Go 相比,Java 對平台的依賴程度更低,因為Go 每次都需要為新平台編譯二進製文件。從測試和DevOps 的角度來看,分別為不同的平台編譯二進製文件非常耗時,並且跨平台的Go 編譯在某些情況下不起作用,尤其是在使用CGo 時。而對於Java,你可以在安裝了JVM 的任何地方使用相同的jar。 Go 需要的RAM 更小一些,並且不需要安裝和管理虛擬機。

反射。 Java 的反射更方便、更流行也更常用,而Go 的反射似乎更複雜。 Java 是一種面向對象的編程語言,因此除原始類型之外的所有東西都被視為對象。如果要使用反射,可以創建一個類,並從類中獲取所需的信息,如下所示:

Class cls = obj.getClass(); 
Constructor constructor = cls.getConstructor(); 
Method[] methods = cls.getDeclaredFields();

這樣就可以訪問構造函數、方法和屬性,然後調用或對它們賦值。

Go 沒有類的概念,並且結構體只包含了已聲明的字段。因此,我們需要藉助“reflection”包來獲得所需的信息:

type Foo struct {     
  A int `tag1:"First Tag" 
  tag2:"Second Tag"`     
  B string 
}
 
f := Foo{A: 10, B: "Salutations"} 
fType := reflect.TypeOf(f) 
switch t.Kind(fType) 
    case reflect.Struct:         
        for i := 0; i < t.NumField(); i++ {             
          f := t.Field(i)             
          // ...         
        }     
}

我覺得這不是一個大問題,但由於Go 中沒有結構體的構造函數,所以很多原始類型必須單獨處理,並且需要考慮到指針。在Go 中,我們可以進行指針傳遞或值傳遞。 Go 的結構體可以將函數作為字段。所有這些都讓Go 的反射變得更加複雜。

可訪問性。 Java 有private、protected 和public 修飾符,為數據、方法和對象提供了不同的訪問作用域。 Go 有與Java 的public 和private 相似的exported/unexported,但沒有修飾符。以大寫字母開頭的所有內容都將被導出,對其他包可見,未導出(小寫)的變量或函數僅在當前包中可見。

Go 與Java 的大不同

Go 不是面向對象編程語言。 Go 沒有類似Java 的繼承機制,因為它沒有通過繼承實現傳統的多態性。實際上,它沒有對象,只有結構體。它可以通過接口和讓結構體實現接口來模擬一些面向對象特性。此外,你可以在結構體中嵌入結構體,但內部結構體無法訪問外部結構體的數據和方法。 Go 使用組合而不是繼承將一些行為和數據組合在一起。

Go 是一種命令式語言,Java 是一種聲明式語言。 Go 沒有依賴注入,我們需要顯式地將所有東西包裝在一起。因此,在使用Go 時盡量少用“魔法”之類的東西。一切代碼對於代碼評審人員來說都應該是顯而易見的。 Go 程序員應該了解Go 代碼如何使用內存、文件系統和其他資源。

Java 要求開發人員更多地地關注程序的業務邏輯,知道如何創建、過濾、修改和存儲數據。系統底層和數據庫方面的東西都是通過配置和註解來完成的(比如通過Spring Boot 等通用框架)。我們盡可能把枯燥乏味的東西留給框架去做。這樣做很方便,但控制也反轉了,限制了我們優化整個過程的能力。

變量定義的順序。在Java 中,你可以這樣定義變量:

String name;

而在Go 中,你得這麼寫:

name string

在我剛開始使用Go 時,這也是令我感到困惑的一個地方。

Go 好的方面

簡單優雅的並發。 Go 具有強大的並發模型,叫作“通信順序進程”或CSP。 Go 使用n-to-m 分析器,允許在n 個系統線程中執行m 個並發。啟動並發例程非常簡單,只需使用Go 的一個關鍵字即可,例如:

go doMyWork()

這樣就可以並發執行doMyWork()。

進程之間的通信可以通過共享內存(不推薦)和通道來完成。我們可以使用與環境變量GOMAXPROCS 定義的進程數一樣多的核心,並帶來非常健壯和流暢的並行性。默認情況下,進程數等於核心數。

Go 提供了一種特殊模式來運行二進製文件,並可以檢測執行竟態條件。我們可以通過這種方式測試並證明自己的程序是不是並發安全的。

go run -race myapp.go

應用程序將在競態檢測模式下運行。

Go 提供了很多開箱即用且非常有用的基本功能,例如用於並發的“sync”包。 “Once”類型的單例可以這麼寫:

package singleton 
import ("sync")
type singleton struct { }
var instance *singleton 
var once sync.Once 
func GetInstance() *singleton {    
  once.Do(func() {        
    instance = &singleton{}    
  })    
  return instance 
}

sync 包還為並發map 實現、互斥鎖、條件變量和WaitGroup 提供了一種結構體。atomic 包支持並發安全轉換和數學運算——它們基本上是編寫並發代碼所需的一切。

指針。借助指針,Go 可以更好地控制如何分配內存、垃圾回收器負載以及其他在Java 中無法實現的性能調優。與Java 相比,Go 更像是一種低級的語言,並且支持更容易、更快的性能優化。

鴨子類型(Duck Typing)。 “如果它走路像鴨子,並且像鴨子一樣嘎嘎叫,那它一定就是鴨子”。在Go 中就是這樣的:無需定義某種結構體是否實現了給定的接口,只要這個結構體具有與給定接口相同的方法簽名,那它就是實現了這個接口。這非常有用,作為代碼庫的調用端,你可以定義外部庫結構體所需的任意接口。而在Java 中,對象必須顯式聲明實現了哪些接口。

性能分析器。 Go 的性能分析工具讓性能問題分析變得便捷和輕鬆。 Go 的分析器可以揭示程序的內存分配和CPU 使用情況,並在可視化圖形中展示出來,讓性能優化變得非常容易。 Java 也有很性能分析器,比如Java VisualVM,但它們都比Go 的複雜,而且依賴JVM 的運行情況,因此它們提供的統計信息與垃圾回收器的運行相關。

CGO。 Go 可以與C 語言集成,因此你可以在Go 項目中開髮帶有C 代碼片段的應用程序。開發人員可以使用CGo 創建調用C 代碼的G​​o 程序包。 Go 為exclude/include 給定平台的C 代碼片段提供了各種構建選項。

將函數作為參數。 Go 函數可以作為變量傳遞給另一個函數或作為結構體的字段。這種多功能性令人耳目一新。 Java 8 引入了lambda,但它們不是真正的函數,只是單函數對象。

清晰的代碼風格準則。 Go 社區提供了很多示例和說明

函數可以返回多個參數,這個也非常有用。

package main 
import "fmt" 
func returnMany() (int, string, error) {     
  return 1, "example", nil 
}
func main() {     
  i, s, err := returnMany()     
  fmt.Printf("Returned %s %s %v", i, s, err) 
}

Go 不好的方面

沒有多態性(除非通過接口來實現)。在Go 中,如果在同一個包中有兩個函數具有不同的參數但含義相同,必須給它們指定不同的名字。例如這段代碼:

func makeWorkInt(number int) {   
  fmt.Printf(“Work done number %d”, number) 
}
func makeWorkStr(title string) {   
  fmt.Printf(“Work done title %s”, title) 
}

這樣一來,你就會得到很多方法,它們做的事情差不多,但名字都不一樣,而且看起來很“醜”。

另外,Go 也沒有繼承多態性。被嵌入到結構體裡的結構體只知道其自己的方法,對“宿主”結構體的方法一無所知。對於像我這樣的開發人員來說,這尤其具有挑戰性,因為我們是從其他OOP 語言(最基本的概念之一就是繼承)過渡到Go 的。

不過,隨著時間的推移,我開始意識到這種處理多態性的方法只是另一種思維方式,而且是有道理的,因為組合比繼承更加可靠,並且運行時間是可變的。

錯誤處理。在Go 中,完全由你來決定返回什麼錯誤以及如何返回錯誤,因此作為開發人員,你需要負責返回和傳遞錯誤。毫無疑問的是,錯誤可能會被隱藏掉,這是一個痛點。時刻要記得檢查錯誤並把它們傳遞出去,這有點煩人,而且不安全。

當然,你可以使用linter 來檢查隱藏的錯誤,但這只是一種輔助手段,不是真正的解決方案。在Java 中,處理異常要方便得多。如果是RuntimeException,甚至不必將其添加到函數的簽名中。

public void causeNullPointerException() {   
  throw new NullPointerException("demo"); 
}
/*
...
*/
try {   
  causeNullPointerException(); 
} catch(NullPointerException e) {   
  System.out.println("Caught inside fun().");   
  throw e; // rethrowing the exception
}

沒有泛型。雖然泛型很方便,但它會增加複雜性,而且從類型系統和運行時方面來看,泛型的成本很高。在構建Go 代碼時,你需要處理各種不同的類型或使用代碼生成。

沒有註解。儘管可以用代碼生成替換一部分編譯時註解,但運行時註解是不能替換的。這是有道理的,因為Go 不是聲明式的,並且代碼裡不應該包含任何“魔法”。我喜歡在Java 中使用註解,因為它們讓代碼更優雅、簡單和簡約。

在為HTTP 服務器端點生成swagger 文件時,註解會非常有用。目前在Go 中需要手動編寫swagger 文件,或者為端點提供特別的註釋。每次API 發生改動時,這都是一件很痛苦的事情。但是,Java 中的註解就像是一種魔法一樣,人們通常都不用去關心它們是怎麼實現的。

Go 的依賴管理。我之前曾寫過一篇關於如何使用vgo 和dep 在Go 中進行依賴管理的文章。 Go 的依賴管理的演變之路充滿了坎坷。最初,除了“ Gopgk”之外沒有其他依賴管理工具,後來發布了實驗性的“Vendor”,後被“vgo”取代,然後又被1.10 版“go mod”取代。如今,我們可以手動或者使用各種Go 命令(例如“go get”)來修改go.mod 文件描述符,但這也讓依賴關係變得不穩定。

Java 有Maven 和Gradle 之類的聲明式工具,用來進行依賴關係管理,也用於構建、部署和處理其他CD/CI 任務。但是,在Go 中,我們必須使用Makefile、docker-composes 和bash 腳本自定義構建所需的依賴管理,這只會使CD/CI 的過程和穩定性變得更加複雜。

包的名稱裡包括了託管域名。例如:

import "github.com/pkg/errors"

這真的很奇怪,而且很不方便,因為你不能在不修改項目代碼庫導入的情況下用自己的實現替換別人的實現。

在Java 中,導入通常以公司名稱開頭,例如:

import by.spirascout.public.examples.simple.Helper;

區別在於,在Go 中,go get 會向by.spirascout.public 獲取資源。在Java 中,包名和域名不一定是相關聯的。

我希望所有與依賴管理有關的問題都是暫時的,將來會得到妥善的解決。

寫在最後

Go 最有趣的一個地方是它所遵循的代碼命名規則——基於代碼可讀性心理學

你可以用各種方法寫出清晰且可維護的代碼,儘管Go 是多單詞的編程語言,但寫出來的代碼仍然很清晰。

Go Web 開發經驗讓我看到了Go 的快速、強大和易於理解,它非常適用於小型服務和並發處理。對於大型複雜的系統、功能複雜的服務以及單服務器系統,Java 目前仍然是王者。

英文原版

何時使用Go與Java 一位程序員對兩種主要語言的理解