0%

APUE

1. UNIX 标准

  • ISO C
    • 历史
      • ANSI C89
      • C99
        • restrict
        • long long
        • 单行注释
        • 分散代码与声明
      • C11
  • POSIX
    • 提升各种应用程序在Unix系统环境之间的可移植性
  • SUS POSIX超集
  • 实现
    • FreeBSD
    • Linux
    • Mac OS X
    • Solaris
  • 限制
    • 编译时限制
    • 运行时限制

2. 无缓冲IO

  • fd (标准输入、输出、标准错误占用了0,1,2)
    • 进程有process table entry表,对应了fd 到file pointer的关系(在PCB中存)
    • 每个文件描述符表项指向一个已打开文件的指针
    • 文件指针指向一个file结构体,如下图
      • File Status Flag:只读,读写,写
      • 当前读写位置f_pos
      • f_count 引用计数(dup、fork等系统调用会导致多个文件描述符指向同一个file结构体)
      • f_op 文件函数指针
      • f_dentry 指向目录项的指针,即指向/home/akaedu/a的指针,目录项保存inode指针
1
2
3
#define STDIN_FILENO 0 /* Standard input. */
#define STDOUT_FILENO 1 /* Standard output. */
#define STDERR_FILENO 2 /* Standard error output. */

API

open

  • int open(const char *path, int oflag, /* mode_t mode */);
  • oflag
    • O_RDONLY
    • O_WRONLY
    • O_RDWR
    • O_APPEND
    • O_CLOEXEC 把FD_CLOEXEC常量设置为1(默认为0)
    • O_CREAT
    • O_EXCL 若同时制定O_CREAT,而文件存在,则出错,若不存在则创建。
    • O_DIRECTORY
    • O_SYNC 同步写,等IO操作完成
    • O_DSYNC 数据同步写,文件属性不同步
    • O_TRUNC 截断,长度先为0
1
2
3
4
5
6
7
result = open(argv[1], O_RDWR);
if(result == -1)
err_sys("open %s failed\n", argv[1]);

result = open(argv[1], O_RDWR, S_IRUSR | S_IWUSR);
if(result == -1)
err_sys("open %s with mode S_IRUSR|S_IWUSR failed\n", argv[1]);

openat
int openat(int fd, const char *path, int oflag, /* mode_t mode*/) 相对路径

create
创建文件,之前的open无法创建

lseek

1
2
3
4
#include <unistd.h>
off_t lseek(int fd, off_t offset, int whence);
// example
if(lseek(fd, 16384, SEEK_SET) == -1) exit(2);

read/write

1
2
ssize_t read(int fd, void *buf, size_t count);
ssize_t wirte(int fd, void *buf, size_t count);

pread/pwrite
原子的lseek + read/write

sync/fsync/fdatasync
提交文件系统的cache到disk上

  • void sync(void) 将data和metadata的cache写到disk
  • int syncfs(int fd) 将fd对应的data和metadata的cache写到disk,-1表示错误, 0成功
  • fsync
  • fdatasync

dup/dup2
创建一个新的fd,是原fd的副本,会打上FD_CLOEXEC的标志。和old fd共同指向同一个file table entry。dup2是原子的。

1
2
int dup(int oldfd);
int dup2(int oldfd, int newfd); //先关newfd, 再开复制

fcntl
操纵文件描述符

1
2
#include <unistd.h>
#include <fcntl.h>

3. 有缓冲IO

  • 无缓冲的IO围绕fd展开: 用户Buffer<->kernel buffer<-> disk I/O
  • 有缓冲的IO围绕stream展开: 用户buffer<-> stream buffer <-> kernel buffer <-> disk I/O

流的概念

stream buffer 在刚开始的时候被malloc出来,通过fread,fwrite可以读写,缓冲区满或者可以手动flush将stream buffer写回到kernel buffer。

流的定向:

  • 单字节 ASCII byte flow
  • 多字节 国际字符集

流缓冲

  • 全缓冲 block buffer,最大4096
  • 行缓冲 line buffer,最大1024
  • 无缓冲

Linux下stdin当不指向交互设备时,全缓冲,指向终端设备,行缓冲。stderr一般是无缓冲的。

FILE 对象

FILE对象维护fd,buffer指针,buffer尺寸,buffer当前字符数,出错标志,等等。

例如

1
2
3
4
// in <stdio.h>
extern FILE *stdin; /* Standard input stream. */
extern FILE *stdout; /* Standard output stream. */
extern FILE *stderr; /* Standard error output stream. */

API

流的定向

1
2
// 得到流的定向,wide-character定向 则返回正数,返回0是初始状态, byte导向则返回负数
int fwide(FILE *stream, int mode);

设置流的行为

1
2
3
4
5
6
7
8
9
// 改变流的行为,buf不为空则为FBF,为空则为 NBF
// 相当于setvbuf(stream, buf, buf ? _IOFBF : _IONBF, BUFSIZ);
void setbuf(FILE *stream, char *buf);

// 改变流的行为,_IONBF, _IOLBF, _IOFBF
void setvbuf(FILE* stream, char *buf, int type, size_t size)

// 刷新,NULL表示刷新所有open stream
int fflush(FILE* stream);

打开

1
2
3
4
5
6
7
8
9
10
11
// 打开流
FILE* fopen(const char *pathname, const char *type);

// 指定的流上打开一个文件,如果已经打开,就关了
FILE* freopen(const char *pathname, const char *type, FILE* fp);

// 打开文件描述符,变成一个stream
FILE* fdopen(const char *pathname, const char *type);

// 关闭流
int fclose(FILE *fp);

读写

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
#include <stdio.h>
// 从stream读一个char,返回unsigned char, 读错则EOF
int fgetc(FILE *stream);

// 可能被实现成宏
int getc(FILE *stream);

// getc(stdin)
int getchar(void);

// 返回c,错误则EOF
int fputc(int c, FILE* stream);

// 宏实现,需要考虑参数的问题
int putc(int c, FILE* stream);

// 行读写
// 从stream里读size-1字节,或者读到newline,EOF
char *fgets(char *str, int size, FILE* stream);
// 从stdin中读直到newline
char *gets(char *str);

// 写
int fputs(char *str, FILE* stream);
int puts(char *str)

通用读写

1
2
3
// 从stream读nmemb个size 大小的块,返回写了多少个item的值(nmemb)
size_t fread(void *ptr, size_t size, size_t nmemb, FILE* stream);
size_t fwrite(void *ptr, size_t size, size_t nmemb, FILE* stream);

错误处理

1
2
3
int feof(FILE* stream);
int ferror(FILE* stream);
clearerr(FILE* stream);

流偏移

1
2
3
4
5
6
7
8
9
10
// fseek(fp, 0, SEEK_SET);
int fseek(FILE* fp, long sz, int whence);
int fseek(FILE* fp, off_t sz, int whence);

// 返回偏移
long ftell(FILE* fp);
off_t ftello(FILE* fp);

// 设置偏移为0
void rewind(FILE *_stream_);

格式化输入输出

1
2
3
4
5
// 返回print的字符数
int printf(const char * format ...);
int fprintf(FILE *fp, const char* format...);
int dprintf(int fd, const char* format...);
int sprintf(char *str, ...);

标准IO到无缓冲IO的adapter

1
int fileno(FILE* fp);

4. 文件和目录

struct stat

  • st_size 文件长度
  • st_blksize 文件IO合适的块长度
  • st_blocks 分配的合适块数
  • st_atime 数据最后访问时间
  • st_mtime 数据的最后修改时间
  • st_ctime inode数据最后修改时间
  • st_mode
    • 文件类型
      • 普通文件
      • 目录文件
      • 符号连接
      • 块特殊文件
      • 字符特殊文件
      • FIFO 命名管道
      • socket
      • 消息队列
      • 信号量
      • 共享内存
    • mode
      • set user id bit : S_ISUID
      • set group id bit: S_ISGID
      • 权限位
        • RWX

文件系统

Linux用VFS(virtual File System)去抽象具体的File system,只存在内存中。

  • superblock 文件系统的超级块,保存了文件系统的各个参数
  • inode 索引节点,指定一个特定的文件
  • denty 目录项,保存子目录、文件的inode信息,维护inode层级关系
  • file object

API

状态

1
2
3
4
5
6
#include <sys/stat.h>
// 获取文件的stat结构,需要父目录的执行权限
int stat(const char* restrict pathname, struct stat *restrict buf);
int fstat(int fd, struct stat *buf);
// 软连接有自己的inode,存的是路径,lstat不会跟随软连接,返回软连接本身的信息
int lstat(const char *restrict pathname, struct stat *restrict buf, int flag);

软链接有自己的inode,存的是路径
权限

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
#include <unistd.h>
// 调用进程是否有权限,mode 执行对应的访问权限检查。
// F_OK检查是否存在, R_OK X_OK W_OK R_OK
// 用的是实际用户ID,实际组权限ID
int access(const char *pathname, int mode);
int faccessat(int fd, const char *pathname, int mode, int flag);

// 设置程序的文件权限掩码,把置1的权限关掉
mode_t umask(mode_t cmask);

int chmod(const char *pathname, mode_t mode);
int fchmod(int fd, mode_t mode);
int fchmodat(int fd, const char *pathname, mode_t mode, int flag);

int chown(const char *pathname, uid_t owner, gid_t group);
int fchown(int fd, uid_t owner, gid_t group);
int fchownat(int fd, const char *pathname, uid_t owner, gid_t group, int flag);
int lchown(const char *pathname, uid_t owner, gid_t group);

截断

1
2
3
4
#include <unistd.h>
// 对于普通文件进行截断,保留前length字节
int truncate(const char *pathname, off_t length);
int ftruncate(int fd, off_t length);

链接

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
#include <unistd.h>
// 创建硬链接
int link(const char *existingpath, const char *newpath);
int linkat(int efd, const char *existingpath, int nfd, const char *newpath, int flag);
// 删除一个名称,有可能删除file(如果只有一个link)
// 如果是符号连接,则删除软链接的inode而不是指向的文件
// 标准库的remove
int unlink(const char *pathname);
int unlinkat(int fd, const char *pathname, int flag);

#include <stdio.h>

int rename(const char *oldname, const char *newname);
int renameat(int oldfd, const char *oldname, int newfd, const char *newname);

#include <unistd.h>

int symlink(const char *actualpath, const char *sympath);
int symlinkat(const char *actualpath, int fd, const char *sympath);
ssize_t readlink(const char *restrict pathname, char *restrict buf, size_t bufsize);
ssize_t readlinkat(int fd, const char *restrict pathname, char *restrict buf, size_t bufsize);

#include <sys/stat.h>
int mkdir(const char *pathname, mode_t mode);
int mkdirat(int fd, const char *pathname, mode_t mode);

#include <unistd.h>
// 要保证目录下没有文件
int rmdir(const char *pathname);

硬链接计数和进程计数都为0才可能删除文件

控制相关

1
2
3
4
5
6
7
8
9
10
11
12
13
14
#include <dirent.h>
struct direnct *readdir(DIR *dirp*);
DIR *fdopendir(int fd);
struct dirent *readdir(DIR *dp);
void rewinddir(DIR *dp);
int closedir(DIR *dp);
long telldir(DIR *dp);

#include <unistd.h>
int chdir(const char *pathname);
int fchdir(int fd);

#include <unistd.h>
char *getcwd(char *buf, size_t size);

时间相关

1
2
3
4
5
6
#include <sys/stat.h>
int futimens(int fd, const struct timespec times[2]);
int utimesat(int fd, const char *path, const struct timespec times[2], int flag);

#include <sys/time.h>
int utimes(const char *pathname, const struct timeval times[2]);