void memory_xor(uint64_t *dst, const uint64_t *src, uint32_t len)
{
for (uint32_t i = 0; i<len; i++)
{
*dst++ ^= *src++;
}
}
len 集中在 100-200,dst,src 已经考虑 8 字节对齐,函数多次重复调用,消耗时间占总时间大概在 60-70%还有没有优化空间?
{
for (uint32_t i = 0; i<len; i++)
{
*dst++ ^= *src++;
}
}
len 集中在 100-200,dst,src 已经考虑 8 字节对齐,函数多次重复调用,消耗时间占总时间大概在 60-70%还有没有优化空间?