C语言进阶教程:字符串处理 - string.h库函数深入
yund56 2025-06-02 22:04 12 浏览
C语言标准库中的 <string.h> 头文件提供了大量用于操作字符串和内存块的函数。熟练掌握这些函数对于高效地进行C语言编程至关重要。本节将深入探讨其中几个常用且功能强大的函数:strstr、strtok、memcpy 和 memmove。
1. strstr()- 在字符串中查找子字符串
char *strstr(const char *haystack, const char *needle);
- haystack: 指向被搜索的主字符串。
- needle: 指向要搜索的子字符串。
strstr() 函数在 haystack 字符串中查找 needle 子字符串第一次出现的位置。
- 返回值:
- 如果找到子字符串,返回一个指向 haystack 中子字符串第一次出现位置的指针。
- 如果未找到子字符串,或者 needle 是一个空字符串(C99及之后标准,早期行为可能不同),返回 NULL。
特性与用途:
- 用于判断一个字符串是否包含另一个字符串。
- 获取子字符串在主字符串中的起始位置,从而可以进行后续的提取或替换操作。
- 大小写敏感。
示例:
#include <stdio.h>
#include <string.h>
int main() {
const char *main_string = "Hello, this is a test string for testing.";
const char *substring1 = "test";
const char *substring2 = "world";
const char *empty_substring = "";
char *found_pos;
// 查找 "test"
found_pos = strstr(main_string, substring1);
if (found_pos != NULL) {
printf("Substring '%s' found at position: %ld\n", substring1, found_pos - main_string);
printf("Remaining string from found position: %s\n", found_pos);
} else {
printf("Substring '%s' not found.\n", substring1);
}
// 查找 "world"
found_pos = strstr(main_string, substring2);
if (found_pos != NULL) {
printf("Substring '%s' found at position: %ld\n", substring2, found_pos - main_string);
} else {
printf("Substring '%s' not found.\n", substring2);
}
// 查找空字符串 (C99及以后标准,通常返回haystack本身)
// 行为可能因编译器和标准版本而异,较早的标准可能返回NULL
// 现代编译器通常遵循C99/C11,空needle匹配haystack的开头
found_pos = strstr(main_string, empty_substring);
if (found_pos != NULL) {
printf("Empty substring found at position: %ld (points to start of haystack)\n", found_pos - main_string);
} else {
printf("Empty substring not found or treated as no match.\n");
}
return 0;
}
2. strtok()- 分割字符串
char *strtok(char *restrict str, const char *restrict delim);
- str: 第一次调用时,指向要被分割的字符串。后续调用时,应传入 NULL。
- delim: 指向一个包含分隔符集合的字符串。
strtok() 函数用于将一个字符串分割成一系列的“标记”(tokens),这些标记由 delim 字符串中包含的任何一个字符分隔开。
重要特性与警告:
- 修改原字符串:strtok() 会修改它所处理的字符串。它会将找到的分隔符替换为 \0 (空字符),以便返回的标记是正常的以空字符结尾的字符串。因此,如果你需要保留原始字符串,应该先复制一份。
- 内部静态状态:strtok() 使用一个内部的静态指针来记住下次开始搜索的位置。这意味着:
- 它不是线程安全的。在多线程环境中使用 strtok() 会导致问题。
- 不能同时用 strtok() 分割两个不同的字符串(除非一个分割完成后再开始另一个)。
- C11标准引入了 strtok_s() (以及POSIX中的 strtok_r()) 作为线程安全的替代品。
- 连续分隔符:如果字符串中有连续的分隔符,strtok() 会将它们视为单个分隔符,并且不会返回空标记。
- 开头/结尾分隔符:如果字符串以分隔符开头,这些分隔符会被跳过。如果以分隔符结尾,则最后一个标记之后的分隔符也会被处理。
调用流程:
- 第一次调用:将待分割的字符串作为第一个参数传递给 strtok()。
- 后续调用:将 NULL 作为第一个参数传递给 strtok(),以继续从上一次停止的地方分割同一个字符串。
- 当没有更多标记可返回时,strtok() 返回 NULL。
示例:
#include <stdio.h>
#include <string.h>
int main() {
char str[] = "apple,banana;orange grape-mango";
char delimiters[] = ",;- "; // 分隔符可以是逗号、分号、连字符或空格
char *token;
printf("Original string: '%s'\n", str);
// 第一次调用
token = strtok(str, delimiters);
printf("Tokens:\n");
while (token != NULL) {
printf(" '%s'\n", token);
// 后续调用,传入NULL
token = strtok(NULL, delimiters);
}
// 注意:此时原字符串 str 已经被修改
printf("String after strtok: ");
// 由于strtok用\0替换了分隔符,直接打印str可能只显示第一个token
// 需要遍历查看被修改的部分
char *ptr = str;
while (*ptr != '\0' || *(ptr+1) != '\0') { // 打印直到连续两个\0 (大致示意)
if (*ptr == '\0') printf(" [NULL] ");
else putchar(*ptr);
ptr++;
if (ptr - str > sizeof(str)) break; // 防止无限循环
}
putchar('\n');
// 另一个例子,处理连续分隔符
char str2[] = "one,,,two; three";
printf("\nOriginal string 2: '%s'\n", str2);
token = strtok(str2, delimiters);
printf("Tokens from str2:\n");
while (token != NULL) {
printf(" '%s'\n", token);
token = strtok(NULL, delimiters);
}
return 0;
}
3. memcpy()- 内存复制
void *memcpy(void *restrict dest, const void *restrict src, size_t n);
- dest: 指向目标内存区域的指针,数据将复制到这里。
- src: 指向源内存区域的指针,数据将从这里复制。
- n: 要复制的字节数。
memcpy() 函数从 src 指向的内存位置复制 n 个字节到 dest 指向的内存位置。
重要特性与警告:
- 内存重叠:如果源内存区域和目标内存区域有重叠,memcpy() 的行为是未定义的。在这种情况下,应该使用 memmove()。
- 不关心数据类型:memcpy() 按字节复制,不关心它复制的是什么类型的数据(整数、浮点数、结构体等)。
- 不处理空字符:与字符串复制函数(如 strcpy)不同,memcpy() 会精确复制 n 个字节,即使中途遇到 \0 也会继续复制。
- 返回值:返回 dest 指针。
示例:
#include <stdio.h>
#include <string.h>
typedef struct {
int id;
char name[20];
} Record;
int main() {
// 复制字符串 (包括末尾的\0,如果n足够大)
char source_str[] = "Hello World";
char dest_str[20];
memcpy(dest_str, source_str, strlen(source_str) + 1); // +1 for null terminator
printf("Copied string: %s\n", dest_str);
// 复制整数数组
int source_arr[] = {1, 2, 3, 4, 5};
int dest_arr[5];
memcpy(dest_arr, source_arr, sizeof(source_arr));
printf("Copied array: ");
for (int i = 0; i < 5; i++) {
printf("%d ", dest_arr[i]);
}
printf("\n");
// 复制结构体
Record rec_src = {101, "Test Record"};
Record rec_dest;
memcpy(&rec_dest, &rec_src, sizeof(Record));
printf("Copied record: ID=%d, Name=%s\n", rec_dest.id, rec_dest.name);
// 潜在的重叠问题 (不应使用memcpy)
char buffer[] = "123456789";
// 错误示例: memcpy(buffer + 2, buffer, 5); // dest 和 src 重叠,行为未定义
// 正确应使用 memmove for overlapping regions
// memmove(buffer + 2, buffer, 5);
// printf("Buffer after potentially problematic memcpy (or correct memmove): %s\n", buffer);
return 0;
}
4. memmove()- 安全的内存复制(处理重叠)
void *memmove(void *dest, const void *src, size_t n);
- dest: 指向目标内存区域的指针。
- src: 指向源内存区域的指针。
- n: 要复制的字节数。
memmove() 函数与 memcpy() 非常相似,它也是从 src 复制 n 个字节到 dest。关键区别在于:memmove() 可以正确处理源内存区域和目标内存区域重叠的情况。
如果 src 和 dest 指向的区域可能重叠,必须使用 memmove() 而不是 memcpy() 来保证正确的行为。
memmove() 通过先将数据复制到一个临时缓冲区(如果区域重叠且方向不安全),或者通过判断重叠方向并选择合适的复制顺序(从前向后或从后向前)来实现安全的复制。
- 返回值:返回 dest 指针。
示例:
#include <stdio.h>
#include <string.h>
int main() {
char str[] = "abcdefghij";
printf("Original string: %s\n", str);
// 示例1: dest 在 src 之后,且有重叠 (例如,将 "abcde" 移动到 "cdefg" 的位置)
// src: a b c d e f g h i j
// dest: a b c d e
// memmove(str + 2, str, 5); // 结果应为 "ababcdehij"
// memcpy 在这种情况下行为未定义,结果可能不正确
// 我们用一个更清晰的例子演示重叠
char buffer1[20] = "HelloWorld";
// 将 "Hello" 移动到 "lloWo" 的位置 (buffer1+2)
// src: H e l l o W o r l d
// dest: H e l l o
printf("Buffer1 before memmove: %s\n", buffer1);
memmove(buffer1 + 2, buffer1, 5);
printf("Buffer1 after memmove (dest > src, overlap): %s\n", buffer1); // 预期: "HeHelloorld"
char buffer2[20] = "HelloWorld";
// 将 "World" 移动到 "lloWo" 的位置 (buffer2)
// src: W o r l d
// dest: H e l l o
printf("Buffer2 before memmove: %s\n", buffer2);
memmove(buffer2, buffer2 + 5, 5);
printf("Buffer2 after memmove (dest < src, overlap): %s\n", buffer2); // 预期: "WorldWorld"
// 如果不重叠,memmove 和 memcpy 效果相同
char src_no_overlap[] = "Source";
char dest_no_overlap[10];
memmove(dest_no_overlap, src_no_overlap, strlen(src_no_overlap) + 1);
printf("Non-overlapping copy with memmove: %s\n", dest_no_overlap);
return 0;
}
总结
- strstr(): 用于在字符串中查找子串。
- strtok(): 用于分割字符串,但会修改原串且非线程安全(应考虑 strtok_s 或 strtok_r)。
- memcpy(): 用于高效复制内存块,但源和目标区域不能重叠。
- memmove(): 用于复制内存块,可以安全处理源和目标区域重叠的情况。
理解这些函数的行为、参数和潜在问题,可以帮助你编写更安全、更高效的C代码来处理字符串和内存数据。
相关推荐
- 没有获得Windows 10 20H2升级通知,怎样直接升级
-
微软公司已经正式发布Windows1020H2操作系统,在正常情况下,微软只会首先推送到少量电脑,然后一边推送一边采集遥测数据。收集遥测数据可以确定哪些电脑可以更新,哪些电脑在更新后可能会失败,微...
- 不想让人随便卸载你安装的程序,用这四招,他将无计可施
-
Windows10不提供设置删除应用程序限制的功能,有几种间接方法可以防止用户删除操作系统中的程序和游戏。一、WindowsInstaller服务使用Windows工具,可以部分限制用户的权限。如...
- 一文看懂苹果全球开发者大会 五大系统全面升级
-
来源:环球网【环球网智能报道记者张阳】北京时间6月23日凌晨1点,苹果全球开发者大会(WWDC2020)如期举行,还是那个熟悉的乔布斯剧院,依旧是高水准的视频展示,但是这届WWDC,却是苹果历史...
- 无需等待微软分批推送,23H2可借助注册表快速获取Win11 24H2更新
-
IT之家10月15日消息,Windows1124H2正在分批推送,但由于存在多种Bug,微软已经开始放缓其推送节奏。WindowsLatest发现,Windows1123H2...
- 办公小技巧:剑走偏锋 PPT中打造动态图表
-
年底到了少不了又要制作各种总结报表,为了让自己的报表与众不同,我们可以借助PowerPoint动画组件+报表的方式,打造出更为出彩的动态图表。下面以PowerPoint2016为例,介绍如何使用三维...
- 文档表格 版本差异何在
-
在办公过程中,对文档或表格的修改是司空见惯的事。那么,一份文档做了内容改动,如何知道差异在哪里?一份表格改动部分数据,如何知道哪些有所变动?不要说审阅和修订功能,因为不是所有人都会用这些功能来标注的,...
- Excel VBA自制日历组件16色可选 完美替代VBA日期控件
-
本日期组件可跟随单元格跟随窗体中ActiveX文本框组合框控件16种配色可选私信回复880日历可体验效果使用说明1打开自己需要应用日历面板的Excel表,注意必须是启用VBA的格式2在...
- 如何从交互角度读懂产品需求文档
-
作为设计师,理解产品经理提供的需求文档是交互设计工作的重要前提与起点,然而对于很多设计师来说,需求文档内容通常非常复杂,设计师们需要花费大量时间去消化、理解和归纳。本文作者结合公司示例,分析设计师如何...
- 植入让文档变得更强大
-
有效地利用文档置入技术,会让我们的常用文档功能变得更加强大,实现更加高效或有趣的应用。1.写字板文档嵌入其他文档有时,我们要组织一个大型的文档,但是这些文档的内容可能来自于不同种类的文档编辑器,比如...
- Office 2016滚动文本框 顺手就来
-
【电脑报在线】如果一页PPT内容较多无法在完全显示,就需要用到滚动文本框,在PPT2016中借助控件即可快速制作滚动文本框。在“告诉我你想要做什么”输入“文本框控件”,在搜索结果点击“文本框(Acti...
- Axure的多状态复选树
-
本文将详细介绍如何在Axure中实现一种增强型的多状态复选树组件,它不仅支持全选、半选和未选等状态,还具备动态加载、关键字筛选等高级功能。多状态复选树(Multi-StateCheckboxTre...
- 办公小技巧:PPT中控件图表巧联动
-
在利用PPT进行图表演示时,操作者有可能要与图表进行交互联动,比如通过输入数据来预测产品的生产情况等,这时就需要用到“开发工具”中的控件了。几个控件配合几句VBA代码,就可以轻松实现上述交互联动效果(...
- 用好插件——找回火狐的旧功能
-
现在的软件,特别是浏览器类软件,更新换代速度都很快,而且无论是外观界面还是系统组件都会有较大的变化,这样会让很多朋友无所适从。以大家常用的火狐浏览器为例,它就已经升级到了最新的35版,而且在新版中对很...
- 重新认识控件(二)
-
图片和文字,都是一种数据形式。我平时对文本框的录入,报错和提交的设计比较多。最近涉及到图片控件的设计,细细琢磨一下,这玩意还有一些平时没太注意的细节点,感觉对于其他控件的设计有指导意义,特此总结一下传...
- JSA宏教程——在文档中添加复合框控件
-
上一期,我们初步认识了控件Control,本节我们将继续控件的相关内容。这几期我们将逐一介绍相关控制。本节先介绍复合框(也叫组合框)Combobox。复合框的作用复合框就是一个下拉选项框,一次显示一个...
- 一周热门
- 最近发表
- 标签列表
-
- filter函数js (37)
- filter函数excel用不了 (73)
- 商城开发 (40)
- 影视网站免费源码最新版 (57)
- 影视资源api接口 (46)
- 网站留言板代码大全 (56)
- java版软件下载 (52)
- java教材电子课本下载 (48)
- java技术的电子书去哪看 (33)
- 0基础编程从什么开始学 (50)
- java是用来干嘛的 (51)
- it入门应该学什么 (55)
- java线上课程 (55)
- 学java的软件叫什么软件 (38)
- 程序开发软件有哪些 (53)
- 软件培训 (59)
- 机器人编程代码大全 (50)
- 少儿编程教程免费 (45)
- 新代系统编程教学 (61)
- 共创世界编程网站 (38)
- 亲测源码 (36)
- 三角函数积分公式表 (35)
- 函数的表示方法 (34)
- 表格乘法的公式怎么设置 (34)
- sumif函数的例子 (34)