当前位置:   article > 正文

实现一个高效率的内存拷贝函数memcpy_memcpy怎么实现让它效率更高?

memcpy怎么实现让它效率更高?

内存拷贝函数memcpy

memcpy是memory copy的缩写,意为内存复制,在写C语言程序的时候,我们常常会用到它。它的函原型如下:

void *memcpy(void *dest, const void *src, size_t n);
  • 1

它的功能是从src的开始位置拷贝n个字节的数据到dest。如果dest存在数据,将会被覆盖。memcpy函数的返回值是dest的指针。memcpy函数定义在string.h头文件里。

自己实现的时候,最简单的方法是用指针按照字节顺序复制即可。但是性能太低,因为其一,一次一个字节效率太低,地址总线一般是32位,能搬运4字节,一次一个肯定慢的不行;其二,当内存区域重叠时会出现混乱情况。
一下根据以上两方面考虑提高memcpy函数的性能。首先考虑速度,可以按照CPU位宽搬运数据,效率更高,代码如下:

void * Memcpy1(void *dst,const void *src,size_t num)
{
	int nchunks = num/sizeof(dst);   /*按CPU位宽拷贝*/

	cout<<"sizeof(dst)是:"<<sizeof(dst)<<endl;

	int slice =   num%sizeof(dst);   /*剩余的按字节拷贝*/
	
	unsigned long * s = (unsigned long *)src;
	unsigned long * d = (unsigned long *)dst;
	
	while(nchunks--)
	    *d++ = *s++;
	    
	while (slice--)
	    *((char *)d++) =*((char *)s++);
	    
	return dst;
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19

sizeof(dst)是4,即大部分数据每次按照4字节拷贝,最后不足4字节的再分别拷贝。但是内存区域出现重叠时,这种方法无法规避内存混乱问题。
下面的方法能够规避内存重叠的bug,代码如下:

void *Memcpy2(void *dest, const void *src, size_t count)  
{  
 char *d;  
 const char *s;  
   
 if (((int)dest > ((int)src+count)) || (dest < src))  
    {  
    d = (char*)dest;  
    s = (char*)src;  
    while (count--)  
        *d++ = *s++;          
    }  
 else /* overlap */  
    {  
    d = (char *)((int)dest + count - 1); /* 指针位置从末端开始,注意偏置 */  
    s = (char *)((int)src + count -1);  
    while (count --)  
        *d-- = *s--;  
    }  
    
 return dest;  
}  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22

如果检测到内存区域有重叠部分,则从末端开始对每个字节进行拷贝。但数据量大时速度慢,将两种方法结合后能够提高拷贝函数性能,代码如下:

void *Memcpy(void *dest, const void *src, size_t count)  
{  
   cout<<"sizeof(dest)是:"<<sizeof(dest)<<endl;
	int bytelen=count/sizeof(dest);	/*按CPU位宽拷贝*/
	int slice=count%sizeof(dest);	/*剩余的按字节拷贝*/
	unsigned int* d = (unsigned int*)dest;  
    unsigned int* s = (unsigned int*)src;  

 if (((int)dest > ((int)src+count)) || (dest < src))  
    {  
    while (bytelen--)  
        *d++ = *s++;  
	while (slice--)  
        *(char *)d++ = *(char *)s++; 
    }  
 else /* overlap重叠 */  
    {  
    d = (unsigned int*)((unsigned int)dest + count - 4); /*指针位置从末端开始,注意偏置 */  
    s = (unsigned int*)((unsigned int)src + count -4);  
    while (bytelen --)  
        *d-- = *s--;  
	d++;s++;
	char * d1=(char *)d;
	char * s1=(char *)s;
	d1--;s1--;
	while (slice --)  
        *(char *)d1-- = *(char *)s1--; 
    }  
 return dest;  
}  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30

对比一下,测试代码如下:

int main(){
	char a[20]="1133224466558877990";
//	Memcpy1(a+2,a,5);
//	Memcpy2(a+2,a,5);
	Memcpy(a+2,a,5);
	cout<<a<<endl;
	cin.get();
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8

运行结果:
Memcpy1:
1111333466558877990
Memcpy2:
1111332466558877990
Memcpy:
1111332466558877990
后两种方法正确,第一种方法拷贝时无法规避内存重叠的bug。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家小花儿/article/detail/997098
推荐阅读
相关标签
  

闽ICP备14008679号