C语言必学系列:字符函数和字符串函数
字符与字符串函数是C语言处理文本数据的核心工具。字符函数可判断字符类型、转换大小写,如 isalpha 、 tolower ;字符串函数能实现拷贝、拼接、比较等操如 strcpy 、 strcat 、 strcmp 。使用时需注意缓冲区溢出问题,合理搭配头文件 <ctype.h> 与 <string.h> ,可高效完成文本处理任务。
目录
一、字符分类函数
字符函数:针对单个字符进行操作的函数,核心处理单位是“单个字符”(如字符的ASCII码转换、大小写转换、字符判断等),输入/输出通常为单个字符或字符对应的数值(如ASCII码)。
C语言中有⼀系列的函数是专门做字符分类的,也就是⼀个字符是属于什么类型的字符的。这些函数的使用都需要包含⼀个头文件是ctype.h
| 函数 | 如果他的参数符合下列条件就返回真 |
|---|---|
| iscntrl | 任何控制字符 |
| isspace | 空白字符:空格‘ ’,换行‘\n’,换页‘\f’,回车‘\r’,制表符‘\t’或者垂直制表符‘\v’ |
| isdigit | 十进制数字‘0’~‘9’字符 |
| isxdigit | 十六进制数字,包括所有十进制数字字符,小写a ~ f,大写A ~ F |
| islower | 小写字母a~z |
| isupper | 大写字母A~Z |
| isalpha | 字母a~ z或字母A~Z |
| isalnum | 字母或者数字,a~ z、A~ Z 、0~9 |
| ispunct | 标点符号,任何不属于数字或者字母的图形字符(可打印) |
| isgraph | 任何图形字符 |
| isprint | 任何可打印字符,包括图形字符和空白字符 |
这些函数的使用方法非常类似,我们就讲解⼀个函数的事情,其他的非常类似:
int islower ( int c );
islower 是能够判断参数部分的c是否是小写字母的。通过返回值来说明是否是小写字母,如果是小写字母就返回非0的整数,如果不是小写字⺟=母,则返回0。
1.1 例题
写一个代码,将字符串中的小写字母转大写,其他字符不变。
#include <stdio.h>
#include <ctype.h>
int main()
{
int i = 0;
char str[] = "Test String.\n";
char c;
while (str[i])
{
c = str[i];
if (islower(c))
c -= 32;
putchar(c);
i++;
}
return 0;
}
二、字符转换函数
C语言提供了2个字符转换函数:
int tolower ( int c );
//将参数传进去的⼤写字⺟转⼩写
int toupper ( int c );
//将参数传进去的⼩写字⺟转⼤写
有了转换函数,就可以直接使用tolower函数和toupper函数。
三、常用字符串函数
字符串函数:核心处理单位为字符串整体(由一个或多个字符按顺序组成的字符序列,如"hello"、“123abc”),功能覆盖字符串的拼接、截取、查找、替换等综合性操作。输入参数通常是一个或多个字符串,输出结果多为处理后的新字符串、布尔值(判断类操作)、整数(长度、索引位置等)或字符串数组(分割操作)。字符串函数本质是对字符序列的批量处理,无需逐字符操作,效率更高,适配日常多数文本处理场景。
3.1 strlen函数的使用和模拟实现
strlen 是 C 标准库 <string.h> 中的核心函数,用于计算字符串的有效长度(不包含字符串结束符 \0),是字符串处理中最常用的函数之一。
size_t strlen ( const char * str );//函数原型
- 字符串以含’\0’ 作为结束标志,strlen函数返回的是在符串中’\0’ 前面出现的字符个数(不包含’\0’)。
- 参数指向的字符串必须要以’\0’ 结束。
- 注意函数的返回值为size_t,是无符号的。
- strlen的使用需要包含头文件string.h
strlen函数的使用:
#include <stdio.h>
#include <string.h>
int main()
{
const char* str1 = "abcdef";
const char* str2 = "bbb";
if (strlen(str2) - strlen(str1) > 0)
{
printf("str2>str1\n");
}
else
{
printf("srt1>str2\n");
}
return 0;
}
strlen的模拟实现:
int my_strlen(const char* str)
{
int count = 0;
assert(str);
while (*str)
{
count++;
str++;
}
return count;
}
3.2 strcpy 的使用和模拟实现
char* strcpy(char * destination, const char * source );
\\函数原型
strcpy(string copy)是 C 标准库 <string.h> 中用于字符串拷贝的核心函数,功能是将源字符串(包含终止符 \0)完整拷贝到目标内存地址,是字符串操作中最基础的函数之一。
- 源字符串必须以’\0’结束
- 会将源字符串中的’\0’ 拷贝到目标空间。
- 目标空间必须足够大,以确保能存放源字符串。
- 目标空间必须可修改。
strcpy的模拟实现:
char* my_strcpy(char* dest, const char* src)
{
char* ret = dest;
assert(dest != NULL);
assert(src != NULL);
while ((*dest++ = *src++))
{
;
}
return ret;
}
3.3 strcat 的使用和模拟实现
strcat(string concatenation,字符串拼接)是 C 标准库 <string.h> 中的核心函数,用于将源字符串(含 \0)追加到目标字符串的末尾,目标字符串的原有终止符 \0 会被源字符串的第一个字符覆盖。
char *strcat(char *destination, const char *source);
//函数原型
- 源字符串必须以’\0’ 结束。
- 目标字符串中也得有’\0’,否则没办法知道追加从哪里开始。
- 目标空间必须有足够的大,能容纳下源字符串的内容。
- 目标空间必须可修改。
模拟实现strcat函数:
char* my_strcat(char* dest, const char* src)
{
char* ret = dest;
assert(dest != NULL);
assert(src != NULL);
while (*dest)
{
dest++;
}
while ((*dest++ = *src++))
{
;
}
return ret;
}
3.4 strcmp的使用和模拟实现
strcmp(string compare,字符串比较)是 C 标准库<string.h> 的核心函数,用于按 ASCII 码值逐字符比较两个字符串,返回值反映比较结果,是字符串排序、判断相等的基础函数。
int strcmp(const char *str1, const char *str2);
//函数原型
标准规定:
- 第⼀个字符串大于第二个字符串,则返回大于0的数字
- 第⼀个字符串等于第二个字符串,则返回0
- 第⼀个字符串小于第二个字符串,则返回小于0的数字
strcmp函数的模拟实现:
int my_strcmp(const char* str1, const char* str2)
{
int ret = 0;
assert(str1 != NULL);
assert(str2 != NULL);
while (*str1 == *str2)
{
if (*str1 == '\0')
return 0;
str1++;
str2++;
}
return *str1 - *str2;
}
3.5 strncpy 函数的使用
strncpy 是 C 标准库 <string.h> 中安全版字符串拷贝函数,相比 strcpy 增加了「最大拷贝长度」参数,可避免缓冲区溢出,是工业级代码中替代 strcpy 的首选。
- 拷贝num个字符从源字符串到目标空间。
- 如果源字符串的长度小于num,则拷贝完源字符串之后,在目标的后边追加0,直到num个。
char *strncpy(char *destination, const char *source, size_t num);
//函数原型
strncpy 函数的使用:
#include <stdio.h>
#include <string.h>
int main() {
char dest[20]; // 目标缓冲区足够大
const char *src = "Hello"; // 源长度5(含\0)
size_t num = 10; // 最大拷贝10个字符
// 拷贝:源长度5 < 10,拷贝后剩余5个位置补\0
strncpy(dest, src, num);
printf("示例1:源长度 < num\n");
printf("源字符串:%s(长度:%zu)\n", src, strlen(src));
printf("目标字符串:%s(长度:%zu)\n", dest, strlen(dest)); // 输出5(\0有效)
printf("目标缓冲区实际字符数:%zu\n\n", num); // 输出10(补了5个\0)
return 0;
}
3.6strncat 函数的使用
strncat 是 C 标准库 <string.h> 中安全版字符串拼接函数,相比 strcat 增加了「最大追加长度」参数,可精准控制追加字符数,避免缓冲区溢出,是拼接字符串的首选安全函数。
char *strncat(char *destination, const char *source, size_t num);
//函数原型
- 将source指向字符串的前num个字符追加到destination指向的字符串末尾,再追加⼀个’\0’字符
- 如果source 指向的字符串的长度小于num的时候,只会将字符串中到’\0’ 的内容追加到destination指向的字符串末尾
strncat 函数的使用:
#include <stdio.h>
#include <string.h>
int main() {
char dest[20] = "Hello, "; // 目标字符串(长度7,含\0)
const char *src = "World! Nice to meet you"; // 源长度21
size_t num = 5; // 最多追加5个字符
// 拼接:仅追加前5个字符(W-o-r-l-d),自动补\0
strncat(dest, src, num);
printf("示例1:源长度 > num\n");
printf("拼接前:%s(长度:%zu)\n", dest, strlen(dest)); // 输出7
printf("拼接后:%s(长度:%zu)\n", dest, strlen(dest)); // 输出12(7+5)
printf("目标缓冲区剩余空间:%zu\n\n", sizeof(dest) - strlen(dest)); // 输出8
return 0;
}
3.7 strncmp函数的使用
strncmp 是 C 标准库 <string.h> 中安全版字符串比较函数,相比 strcmp 增加了「最大比较字符数」参数,可仅对比字符串的前 n 个字符,避免越界比较,是字符串前缀匹配、有限长度对比的核心函数。
int strncmp(const char *str1, const char *str2, size_t num);
//函数原型
比较str1和str2的前num个字符,如果相等就继续往后比较,最多比较num个字目,如果提前发现不一样,就提前结束,大的字符所在的字符串大于另外⼀个。如果num个字符都相等,就是相等返回0。
strncmp函数的使用:
#include <stdio.h>
#include <string.h>
int main() {
const char *str1 = "Hello World";
const char *str2 = "Hello C Language";
size_t num = 5; // 仅对比前5个字符
int ret = strncmp(str1, str2, num);
printf("示例1:前num字符相等\n");
printf("str1:%s\nstr2:%s\n对比前%zu个字符,结果:%d\n\n",
str1, str2, num, ret); // 输出0(前5个字符均为"Hello")
return 0;
}
3.8 strstr 的使用和模拟实现
strstr(string substring)是 C 标准库 <string.h> 中用于查找子字符串的核心函数,功能是在一个主字符串中查找指定子串的首次出现位置,返回指向该位置的指针;若未找到,返回 NULL。
char *strstr(const char *haystack, const char *needle);
//函数原型
- 函数返回字符串str2在字符串str1中第⼀次出现的位置
- 字符串的比较匹配不包含’\0’ 字符,以’\0’作为结束标志
strstr 函数的使用:
#include <stdio.h>
#include <string.h>
int main()
{
char str[] = "This is a simple string";
char* pch;
pch = strstr(str, "simple");
strncpy(pch, "sample", 6);
printf("%s\n", str);
return 0;
}
strstr的模拟实现:
char* strstr(const char* str1, const char* str2)
{
char* cp = (char*)str1;
char* s1, * s2;
if (!*str2)
return((char*)str1);
while (*cp)
{
s1 = cp;
s2 = (char*)str2;
while (*s1 && *s2 && !(*s1 - *s2))
s1++, s2++;
if (!*s2)
return(cp);
cp++;
}
return(NULL);
}
3.9 strtok函数的使用
strtok(string tokenize)是 C 标准库 <string.h> 中用于字符串分割(分词) 的核心函数,功能是按指定的分隔符将一个字符串拆分成多个子串(token),是处理字符分隔数据(如 CSV、日志、命令行参数)的常用工具。
char *strtok(char *str, const char *delim);
//函数原型
- sep参数指向⼀个字符串,定义了⽤作分隔符的字符集合
- 第⼀个参数指定⼀个字符串,它包含了0个或者多个由sep字符串中⼀个或者多个分隔符分割的标
记。 - strtok函数找到str中的下⼀个标记,并将其用’\0’结尾,返回⼀个指向这个标记的指针(注:strtok函数会改变被操作的字符串,所以被strtok函数切分的字符串⼀般都是临时拷贝的内容并且可修改。)
- strtok函数的第⼀个参数不为NULL 的位置。函数将找到str中第⼀个标记,strtok函数将保存它在字符串中的位置。
- strtok函数的第⼀个参数为NULL ,函数将在同⼀个字符串中被保存的位置开始,查找下⼀个标记。
- 如果字符串中不存在更多的标记,则返回NULL 指针。
#include <stdio.h>
#include <string.h>
int main()
{
char arr[] = "192.168.6.111";
char* sep = ".";
char* str = NULL;
for (str = strtok(arr, sep); str != NULL; str = strtok(NULL, sep))
{
printf("%s\n", str);
}
return 0;
}
3.10 strerror 函数的使用
strerror 函数可以把参数部分错误码对应的错误信息的字符串地址返回来。
在不同的系统和C语⾔标准库的实现中都规定了⼀些错误码,⼀般是放在errno.h 这个头文件中说明的,C语言程序启动的时候就会使用⼀个全局的变量errno来记录程序的当前错误码,只不过程序启动的时候errno是0,表示没有错误,当我们在使⽤标准库中的函数的时候发生了某种错误,就会将对应的错误码,存放在errno中,而⼀个错误码的数字是整数很难理解是什么意思,所以每⼀个错误码都是有对应的错误信息的。strerror函数就可以将错误对应的错误信息字符串的地址返回。
strerror 函数的使用:
#include <errno.h>
#include <string.h>
#include <stdio.h>
//我们打印⼀下0~10这些错误码对应的信息
int main()
{
int i = 0;
for (i = 0; i <= 10; i++) {
printf("%s\n", strerror(i));
}
return 0;
}
更多推荐



所有评论(0)