Java IO 如何实现零拷贝?

什么是零拷贝

在操作系统中,从内核的形态区分,可以分为内核态(Kernel Space)和用户态(User Space)。

在传统的IO中,如果把数据通过网络发送到指定端的时候,数据需要经历下面的几个过程:

io

  1. 当调用系统函数的时候,CPU执行一系列准备工作,然后把请求发送给DMA处理(DMA可以理解为专门处理IO的组件),DMA将硬盘数据通过总线传输到内存中。
  2. 当程序需要读取内存的时候,这个时候会执行CPU Copy,内存会有内核态写入用户的缓存区。
  3. 系统调用write()方法时,数据从用户态缓冲区写入到网络缓冲区(Socket Buffer), 由用户态编程内核态。
  4. 最后由DMA写入网卡驱动中,传输到网卡的驱动。

可以看到,传统的IO的读写,数据会经历4次内存的拷贝,这种拷贝拷贝会带来资源的浪费和效率的底下。


如何实现零拷贝


内存映射方式I/O

在顺序IO中有一个mmap的机制,具体数据是怎么流转的呢?

io

  1. 数据通过DMA读取写入的内核空间的内存,通过内存共享的方式,把这块数据与用户空间的进行共用,减少了一次CPU的拷贝
  2. 然后数据直接写入到网络的缓存区
  3. 最后由DMA写入的网卡的驱动的缓存。

从上面的图可以看出,内存映射的方式减少了CPU的读写次数,但是拷贝的次数还是有四次。


通过sendfile实现的零拷贝I/O

通过sendfile()系统调用,可以做到内核空间内部直接进行I/O传输。

io

与内存映射方法不同,sendfile的方式用户态是无法看到真正的内存,是无法修改的。仅仅是一个指令,让内存从内核空间拷贝到socket buffer中。

同样sendfile也会有一次CPU的拷贝。

真正的零拷贝

io

上图中的数据流转,都是通过DMA的来进行处理的,没有经过CPU Copy操作,这个需要硬件支持,具体的操作系统会根据硬件条件来选择实现的方式。


Java实现

Java的实现是FileChanneltransferTo方法的调用

0