Golang 中 []byte 与 string 转换详解

见解分享

2023-10-24 16:49:40

从 []byte 到 String：Go 中的转换揭秘

在 Go 编程中，字符串和字节数组是我们日常使用的两个基本数据结构。它们之间轻松转换的能力对编写高效、可维护的代码至关重要。让我们深入探讨 []byte 和 string 之间的转换机制，解锁它们的强大功能。

了解字符串和字节数组的本质

string： 不可变的 Unicode 字符序列（使用 UTF-8 编码）。
[]byte： 可变长度的字节数组。

UTF-8 将 Unicode 字符表示为一到四个字节，这意味着 string 实际上是 []byte 的底层表示，只不过它提供了字符操作的高层抽象。

标准转换：快速且高效

最常用的转换方法是使用内置函数：

string(bytes []byte)：将 []byte 转换为 string。
[]byte(str string)：将 string 转换为 []byte。

这些函数通过底层内存操作直接转换，非常高效。

代码示例：

package main

import "fmt"

func main() {
    bytes := []byte{104, 101, 108, 108, 111}
    str := string(bytes)
    fmt.Println(str) // 输出：hello
}

通过 unsafe 和 reflect：精细控制

除了标准转换，我们还可以使用 unsafe 和 reflect 包进行手动转换：

unsafe： 允许直接访问底层内存，但存在内存安全问题。
reflect： 提供类型信息和运行时反射，可以更安全地访问底层表示。

代码示例：

package main

import "unsafe"
import "reflect"

func main() {
    bytes := []byte{104, 101, 108, 108, 111}
    str := *(*string)(unsafe.Pointer(&bytes))
    fmt.Println(str) // 输出：hello

    sh := (*reflect.StringHeader)(unsafe.Pointer(&str))
    bytes2 := *(*[]byte)(unsafe.Pointer(sh.Data))
    fmt.Println(bytes2) // 输出：[104 101 108 108 111]
}

何时使用哪种方法？

性能优先： 标准转换最快。
手动控制： 考虑 unsafe 或 reflect，例如直接访问字节。
可读性： 标准转换更易读。

进阶转换：编码/解码

除了直接转换，encoding/binary 和 encoding/json 等包提供了更高层次的抽象，用于处理复杂数据结构和二进制格式。

代码示例：

package main

import "encoding/binary"

func main() {
    bytes := []byte{1, 0, 0, 0}
    var i int32
    binary.Read(bytes, binary.LittleEndian, &i) // 读取 little-endian 二进制数据
    fmt.Println(i) // 输出：1
}