今天被一道题目恶心到了, 发现不研究这些东西可能真的活不下去了, 狠下心来读了一个多小时的源码, 写下些自己对 Slice
的见解吧.
先说说那个题目.
// https://play.golang.org/p/2fA3BylTgtf
// 请问 s1 和 s2 的值分别是?
func main() {
s1 := []int{1, 2, 3}
s2 := s1[:0]
s2 = append(s2, 4)
fmt.Println(s1)
fmt.Println(s2)
}
//==========
// [4 2 3]
// [4]
先看看 Slice
在 Go
底层的定义
// https://github.com/golang/go/blob/master/src/reflect/value.go#L1806
type sliceHeader struct {
Data unsafe.Pointer // Array pointer
Len int // slice length
Cap int // slice capacity
}
s1 := []int{1, 2, 3}
是将 [1, 2, 3]
的首地址 存入了 Data
中,
设置了 Len
为 3, 设置了 Cap
为 3.
// https://play.golang.org/p/bjP8BKtwQQl
// 验证代码.
func main() {
s1 := []int{1, 2, 3}
// 我们可以先将它转成 *reflect.SliceHeader 类型.
// *reflect.SliceHeader
// 定义: https://github.com/golang/go/blob/master/src/reflect/value.go#L1800
// 顺带着再说一句 uintptr: uintptr 是整型, 可以足够保存指针的值得范围,
// 在 32 平台下为 4 字节,在 64 位平台下是 8 字节
sliceHeader1 := (*reflect.SliceHeader)((unsafe.Pointer)(&s1))
fmt.Printf("data address: %#0x, len: %d, cap: %d\n",
sliceHeader1.Data, sliceHeader1.Len, sliceHeader1.Cap)
}
//=====
// data address: 0x10414020, len: 3, cap: 3
s2 := s1[:0]
是将 s1
的 Data
中的值, 赋值给了 s2
的 Data
中,
设置 Len
为 0, s1
的 Cap
赋值给了 s2
的 Cap
.
上面这一段有可能不太好理解, 我直接拿出源码来说.
// https://github.com/golang/go/blob/master/src/reflect/value.go#1559
func (v Value) Slice(i, j int) Value {
// ... 略过无用代码
switch kind := v.kind(); kind {
// ...
case Slice:
typ = (*sliceType)(unsafe.Pointer(v.typ))
s := (*sliceHeader)(v.ptr)
base = s.Data
cap = s.Cap
}
// ...
// Declare slice so that gc can see the base pointer in it.
var x []unsafe.Pointer
// Reinterpret as *sliceHeader to edit.
s := (*sliceHeader)(unsafe.Pointer(&x))
// 这里是给 s2.Len 进行赋值. s1[:0] i 没有传所以为 0, j 也为 0, 所以 j - i ...
s.Len = j -
// 这里是给 s2.Cap 进行赋值. cap 在上面的 case 中 被赋值为 3, 3 - 0 emmm...
s.Cap = cap - i
// if 为真
if cap-i > 0 {
// 所以这里是给 s2.Data 进行赋值.
// arrayAt 的 4 个参数类型:
// p unsafe.Pointer, i int, eltSize uintptr, whySafe string
// base 是 s1.Data, i 是 0, eltSize 这个值是根据类型来的,
// 在当前例子里是 []int, int 在根据系统, 32 平台下为 4 字节,在 64 位平台下是 8 字节
// 最后一个参数 whySafe 可能是为了做个记录吧... 而且必须说明为啥安全...
s.Data = arrayAt(base, i, typ.elem.Size(), "i < cap")
} else {
// do not advance pointer, to avoid pointing beyond end of slice
s.Data = base
}
}
// https://github.com/golang/go/blob/master/src/reflect/value.go#1826
func arrayAt(p unsafe.Pointer, i int, eltSize uintptr, whySafe string) unsafe.Pointer {
// 以系统 64 位 为例
// 传的值分别是 s1.Data(0x10414020), 0*8, "i < len"
return add(p, uintptr(i)*eltSize, "i < len")
}
// https://github.com/golang/go/blob/master/src/reflect/type.go#1079
func add(p unsafe.Pointer, x uintptr, whySafe string) unsafe.Pointer {
// 所以这里就相当于 0x10414020+0
return unsafe.Pointer(uintptr(p) + x)
}
// https://play.golang.org/p/pA6coJh2bSg
// 验证代码
func main() {
s1 := []int{1, 2, 3}
s2 := s1[:0]
sliceHeader2 := (*reflect.SliceHeader)((unsafe.Pointer)(&s2))
fmt.Printf("data address: %#0x, len: %d, cap: %d\n",
sliceHeader2.Data, sliceHeader2.Len, sliceHeader2.Cap)
}
//=====
// data address: 0x10414020, len: 0, cap: 3
可以看见 s1.Data
和 s2.Data
地址都是 0x10414020
到了这里你可能会问如果地址一样, 为什么 访问 s2[2]
会报错. runtime error: index out of range
其实猜也能大概猜到, 因为你获取数据的时候 程序是判断了 s2.Len
的.
代码位置在: https://github.com/golang/go/blob/master/src/reflect/type.go#870
这个函数里面有写.
emm.. 不知道....
1
hawken 2018-03-08 22:40:43 +08:00
mark
|
2
polythene 2018-03-08 23:28:52 +08:00
安利一下这篇文章,里面讲解了你遇到的问题: https://jiajunhuang.com/articles/2017_07_18-golang_slice.md.html
|
4
herozem 2018-03-09 00:29:55 +08:00 via iPad
😸
|
5
popbones 2018-03-09 06:56:07 +08:00
预料到是这样的结果,没预料到的是并不总是这样的结果(如二楼文章所说的,取决于 append 是否扩容),这有点蛋疼。
|
6
iRiven 2018-03-09 09:48:01 +08:00 via Android
遇到过坑,中间插入
array = append (append (array [0: index],item), array [index:]...) 然而这段代码能运行却不能实现中间插入的效果 |
7
lovejoy 2018-03-09 10:04:59 +08:00
看来还是得老老实实用 copy
|
8
VinllenChen 2018-03-09 11:02:50 +08:00
对 slice 的修改是可能会修改原 array 的,需要特别注意。
|
10
xrlin 2018-03-09 12:52:36 +08:00 via iPhone
使用 slice 时要时刻提醒自己 slice 只是指向底层数组的一部分,即便是以 slice 做参数,也知识传递一个 slice 的 header 的复制,在涉及添加操作时一定要使用指针。不得不说确实容易导致 bug。
|
11
kirigaya 2018-03-09 13:38:10 +08:00
一楼
|