c语言regex.h（c语言regex实现）

E安全 • 2024年4月4日 21:54:27 • C语言 • 阅读 62

今天给各位分享c语言regex.h的知识，其中也会对c语言regex实现进行解释，如果能碰巧解决你现在面临的问题，别忘了关注本站，现在开始吧！

本文目录一览：

1、C语言怎么用正则表达式2、linux C语言的头文件对应Windows下的头文件是哪些？？3、C语言正则表达式支持中文英文数字以及“_”该怎么写，求大佬们指教4、如何引入头文件.5、合法的C语言表达式6、C语言编程问题，求高手解答遇到输入非法字符时，怎么处理。

C语言怎么用正则表达式

由于它可以极大地简化处理字符串时的复杂度，因此现在已经在许多 L i n u x 实用工具中得到了应用。千万不要以为正则表达式只是 P e r l 、 P y t h o n 、 B a s h 等脚本语言的专利，作为 C 语言程序员，用户同样可以在自己的程序中运用正则表达式。标准的 C 和 C + + 都不支持正则表达式，但有一些函数库可以辅助 C / C + + 程序员完成这一功能，其中最著名的当数 P h i l i p H a z e l 的 P e r l – C o m p a t i b l e R e g u l a r E x p r e s s i o n 库，许多 L i n u x 发行版本都带有这个函数库。编译正则表达式为了提高效率，在将一个字符串与正则表达式进行比较之前，首先要用 r e g c o m p ( ) 函数对它进行编译，将其转化为 r e g e x _ t 结构： i n t r e g c o m p ( r e g e x _ t * p r e g , c o n s t c h a r * r e g e x , i n t c f l a g s ) ; 参数 r e g e x 是一个字符串，它代表将要被编译的正则表达式；参数 p r e g 指向一个声明为 r e g e x _ t 的数据结构，用来保存编译结果；参数 c f l a g s 决定了正则表达式该如何被处理的细节。如果函数 r e g c o m p ( ) 执行成功，并且编译结果被正确填充到 p r e g 中后，函数将返回 0 ，任何其它的返回结果都代表有某种错误产生。匹配正则表达式一旦用 r e g c o m p ( ) 函数成功地编译了正则表达式，接下来就可以调用 r e g e x e c ( ) 函数完成模式匹配： i n t r e g e x e c ( c o n s t r e g e x _ t * p r e g , c o n s t c h a r * s t r i n g , s i z e _ t n m a t c h , r e g m a t c h _ t p m a t c h [ ] , i n t e f l a g s ) ; t y p e d e f s t r u c t { r e g o f f _ t r m _ s o ; r e g o f f _ t r m _ e o ; } r e g m a t c h _ t ; 参数 p r e g 指向编译后的正则表达式，参数 s t r i n g 是将要进行匹配的字符串，而参数 n m a t c h 和 p m a t c h 则用于把匹配结果返回给调用程序，最后一个参数 e f l a g s 决定了匹配的细节。在调用函数 r e g e x e c ( ) 进行模式匹配的过程中，可能在字符串 s t r i n g 中会有多处与给定的正则表达式相匹配，参数 p m a t c h 就是用来保存这些匹配位置的，而参数 n m a t c h 则告诉函数 r e g e x e c ( ) 最多可以把多少个匹配结果填充到 p m a t c h 数组中。当 r e g e x e c ( ) 函数成功返回时，从 s t r i n g + p m a t c h [ 0 ] . r m _ s o 到 s t r i n g + p m a t c h [ 0 ] . r m _ e o 是第一个匹配的字符串，而从 s t r i n g + p m a t c h [ 1 ] . r m _ s o 到 s t r i n g + p m a t c h [ 1 ] . r m _ e o ，则是第二个匹配的字符串，依此类推。释放正则表达式无论什么时候，当不再需要已经编译过的正则表达式时，都应该调用函数 r e g f r e e ( ) 将其释放，以免产生内存泄漏。 v o i d r e g f r e e ( r e g e x _ t * p r e g ) ; 函数 r e g f r e e ( ) 不会返回任何结果，它仅接收一个指向 r e g e x _ t 数据类型的指针，这是之前调用 r e g c o m p ( ) 函数所得到的编译结果。如果在程序中针对同一个 r e g e x _ t 结构调用了多次 r e g c o m p ( ) 函数， P O S I X 标准并没有规定是否每次都必须调用 r e g f r e e ( ) 函数进行释放，但建议每次调用 r e g c o m p ( ) 函数对正则表达式进行编译后都调用一次 r e g f r e e ( ) 函数，以尽早释放占用的存储空间。报告错误信息如果调用函数 r e g c o m p ( ) 或 r e g e x e c ( ) 得到的是一个非 0 的返回值，则表明在对正则表达式的处理过程中出现了某种错误，此时可以通过调用函数 r e g e r r o r ( ) 得到详细的错误信息。 s i z e _ t r e g e r r o r ( i n t e r r c o d e , c o n s t r e g e x _ t * p r e g , c h a r * e r r b u f , s i z e _ t e r r b u f _ s i z e ) ; 参数 e r r c o d e 是来自函数 r e g c o m p ( ) 或 r e g e x e c ( ) 的错误代码，而参数 p r e g 则是由函数 r e g c o m p ( ) 得到的编译结果，其目的是把格式化消息所必须的上下文提供给 r e g e r r o r ( ) 函数。在执行函数 r e g e r r o r ( ) 时，将按照参数 e r r b u f _ s i z e 指明的最大字节数，在 e r r b u f 缓冲区中填入格式化后的错误信息，同时返回错误信息的长度。应用正则表达式最后给出一个具体的实例，介绍如何在 C 语言程序中处理正则表达式。 # i n c l u d e s t d i o . h ; # i n c l u d e s y s / t y p e s . h ; # i n c l u d e r e g e x . h ; / * 取子串的函数 * / s t a t i c c h a r * s u b s t r ( c o n s t c h a r * s t r , u n s i g n e d s t a r t , u n s i g n e d e n d ) { u n s i g n e d n = e n d – s t a r t ; s t a t i c c h a r s t b u f [ 2 5 6 ] ; s t r n c p y ( s t b u f , s t r + s t a r t , n ) ; s t b u f [ n ] = 0 ; r e t u r n s t b u f ; } / * 主程序 * / i n t m a i n ( i n t a r g c , c h a r * * a r g v ) { c h a r * p a t t e r n ; i n t x , z , l n o = 0 , c f l a g s = 0 ; c h a r e b u f [ 1 2 8 ] , l b u f [ 2 5 6 ] ; r e g e x _ t r e g ; r e g m a t c h _ t p m [ 1 0 ] ; c o n s t s i z e _ t n m a t c h = 1 0 ; / * 编译正则表达式 * / p a t t e r n = a r g v [ 1 ] ; z = r e g c o m p ( r e g , p a t t e r n , c f l a g s ) ; i f ( z ! = 0 ) { r e g e r r o r ( z , r e g , e b u f , s i z e o f ( e b u f ) ) ; f p r i n t f ( s t d e r r , ” % s : p a t t e r n ‘ % s ‘ \ n ” , e b u f , p a t t e r n ) ; r e t u r n 1 ; } / * 逐行处理输入的数据 * / w h i l e ( f g e t s ( l b u f , s i z e o f ( l b u f ) , s t d i n ) ) { + + l n o ; i f ( ( z = s t r l e n ( l b u f ) ) ; 0 l b u f [ z – 1 ] = = ‘ \ n ‘ ) l b u f [ z – 1 ] = 0 ; / * 对每一行应用正则表达式进行匹配 * / z = r e g e x e c ( r e g , l b u f , n m a t c h , p m , 0 ) ; i f ( z = = R E G _ N O M A T C H ) c o n t i n u e ; e l s e i f ( z ! = 0 ) { r e g e r r o r ( z , r e g , e b u f , s i z e o f ( e b u f ) ) ; f p r i n t f ( s t d e r r , ” % s : r e g c o m ( ‘ % s ‘ ) \ n ” , e b u f , l b u f ) ; r e t u r n 2 ; } / * 输出处理结果 * / f o r ( x = 0 ; x n m a t c h p m [ x ] . r m _ s o ! = – 1 ; + + x ) { i f ( ! x ) p r i n t f ( ” % 0 4 d : % s \ n ” , l n o , l b u f ) ; p r i n t f ( ” $ % d = ‘ % s ‘ \ n ” , x , s u b s t r ( l b u f , p m [ x ] . r m _ s o , p m [ x ] . r m _ e o ) ) ; } } / * 释放正则表达式 * / r e g f r e e ( r e g ) ; r e t u r n 0 ; } 上述程序负责从命令行获取正则表达式，然后将其运用于从标准输入得到的每行数据，并打印出匹配结果。执行下面的命令可以编译并执行该程序： # g c c r e g e x p . c – o r e g e x p # . / r e g e x p ‘ r e g e x [ a – z ] * ‘ r e g e x p . c 0 0 0 3 : # i n c l u d e r e g e x . h ; $ 0 = ‘ r e g e x ‘ 0 0 2 7 : r e g e x _ t r e g ; $ 0 = ‘ r e g e x ‘ 0 0 5 4 : z = r e g e x e c ( r e g , l b u f , n m a t c h , p m , 0 ) ; $ 0 = ‘ r e g e x e c ‘ 小结对那些需要进行复杂数据处理的程序来说，正则表达式无疑是一个非常有用的工具。本文重点在于阐述如何在 C 语言中利用正则表达式来简化字符串处理，以便在数据处理方面能够获得与 P e r l 语言类似的灵活性。

linux C语言的头文件对应Windows下的头文件是哪些？？

linux和windows平台下，能够对应的头文件就是符合C11标准的头文件。其他的头文件不仅和平台有关系，还和平台下的编译环境有关，很难画上等号的。

C语言符合标准的头文件.

#include assert.h //设定插入点

#include ctype.h //字符处理

#include errno.h //定义错误码

#include float.h //浮点数处理

#include fstream.h //文件输入／输出

#include iomanip.h //参数化输入／输出

#include iostream.h //数据流输入／输出

#include limits.h //定义各种数据类型最值常量

#include locale.h //定义本地化函数

#include math.h //定义数学函数

#include stdio.h //定义输入／输出函数

#include stdlib.h //定义杂项函数及内存分配函数

#include string.h //字符串处理

#include strstrea.h //基于数组的输入／输出

#include time.h //定义关于时间的函数

#include wchar.h //宽字符处理及输入／输出

#include wctype.h //宽字符分类

linux常用头文件如下：

POSIX标准定义的头文件

dirent.h 目录项

fcntl.h 文件控制

fnmatch.h 文件名匹配类型

glob.h 路径名模式匹配类型

grp.h 组文件

netdb.h 网络数据库操作

pwd.h 口令文件

regex.h 正则表达式

tar.h TAR归档值

termios.h 终端I/O

unistd.h 符号常量

utime.h 文件时间

wordexp.h 字符扩展类型

————————-

arpa/inet.h INTERNET定义

net/if.h 套接字本地接口

netinet/in.h INTERNET地址族

netinet/tcp.h 传输控制协议定义

————————-

sys/mman.h 内存管理声明

sys/select.h Select函数

sys/socket.h 套接字借口

sys/stat.h 文件状态

sys/times.h 进程时间

sys/types.h 基本系统数据类型

sys/un.h UNIX域套接字定义

sys/utsname.h 系统名

sys/wait.h 进程控制

——————————

POSIX定义的XSI扩展头文件

cpio.h cpio归档值

dlfcn.h 动态链接

fmtmsg.h 消息显示结构

ftw.h 文件树漫游

iconv.h 代码集转换使用程序

langinfo.h 语言信息常量

libgen.h 模式匹配函数定义

monetary.h 货币类型

ndbm.h 数据库操作

nl_types.h 消息类别

poll.h 轮询函数

search.h 搜索表

strings.h 字符串操作

syslog.h 系统出错日志记录

ucontext.h 用户上下文

ulimit.h 用户限制

utmpx.h 用户帐户数据库

—————————–

sys/ipc.h IPC(命名管道)

sys/msg.h 消息队列

sys/resource.h资源操作

sys/sem.h 信号量

sys/shm.h 共享存储

sys/statvfs.h 文件系统信息

sys/time.h 时间类型

sys/timeb.h 附加的日期和时间定义

sys/uio.h 矢量I/O操作

——————————

POSIX定义的可选头文件

aio.h 异步I/O

mqueue.h 消息队列

pthread.h 线程

sched.h 执行调度

semaphore.h 信号量

spawn.h 实时spawn接口

stropts.h XSI STREAMS接口

trace.h 事件跟踪

C语言正则表达式支持中文英文数字以及“_”该怎么写，求大佬们指教

俺写了一个： /^\S[a-zA-Z\s\d\u4e00-\u9fa5]+\S$/如果符合要求，很不介意，你再追加几百分给俺的。若不符合请联系俺。。。

如何引入头文件.

不需引入

regex.h

c++11已经封装了regex

即改为#include

regex即可

合法的C语言表达式

引用头文件 #include math.h

const double pi=3.41592654;

再写上double tt= sin(pi/6);

sin（30°）在C语言中的表示为 sin(30*3.1415926/180)

C语言编程问题，求高手解答遇到输入非法字符时，怎么处理。

#includestdio.h

#includetime.h

#include stdlib.h

#include “regex.h”

const int MAX_LEN = 1000;

/*去掉字符串两端的空格*/

char * trimString(char guessString[])

{

int head = 0 ,rear = strlen(guessString)-1;

char result[MAX_LEN];

int i,k;

/*开头空格*/

while( guessString[head] != ‘\0’

(guessString[head] == ‘ ‘ || guessString[head] == ‘ ‘ )

)

{

head ++;

}

/*尾部空格*/

while( rear = 0

(guessString[rear] == ‘ ‘ || guessString[rear] == ‘ ‘ )

)

{

rear –;

}

for(i = head ,k = 0; i = rear ; i++ , k++)

{

result[k] = guessString[i];

}

result[k] = ‘\0’;

return result;

}

提取字符串中的【正整数】。

如果是恰好包含【一个正整数】的字符串（正数前后可以有任意个空格,正数可以有多余的前导0），则返回这个正数；

如果是一个空串，则返回 -1

如果包含非数字字符，则返回-2

int transStringToNum(char guessString[])

{

int i;

int head = 0 ,rear = strlen(guessString)-1;

char trimGuessString[MAX_LEN];

int num = 0;

// 去前后空格

strcpy(trimGuessString,trimString(guessString));

// 检查是否空串

if( 0== strlen(trimGuessString) )

{

return -1;

}

// 检查是否有非数字字符

for(i = 0 ; trimGuessString[i] != ‘\0’ ; i ++)

{

if(trimGuessString[i] ‘0’ || trimGuessString[i] ‘9’)

{

return -2;

}

// 字符串转换成数字

for(i = 0 ,num = 0 ; trimGuessString[i] != ‘\0’ ; i++)

{

num = num * 10 + (trimGuessString[i] – ‘0’);

}

return num;

}

int main()

{

int num,guessNum,n,count=0;

char guessString[MAX_LEN];

char reply;

srand(time(NULL));

{

//产生一个随即数

num=rand()%100+1;

printf(“你有10次机会，请猜数字并按回车。\n”);

for(n=1;n=10;n++)

{

// 以字符串形式读入一个整数

gets(guessString);

调用函数 transStringToNum 进行有效性验证

当返回值 guessNum 是负数时，

字符串 guessString 中没有合法的正数

guessNum = transStringToNum(guessString);

if(guessNum == -1 )

{

printf(“请输入一个数字（必须是在1-100 之间）!\n”);

n–;

continue;

}

if(guessNum == -2 )

{

printf(“输入的不是一个合法数字（必须是在1-100 之间）!\n”);

n–;

continue;

}

if(guessNumnum)

{

printf(“It’s too high!\n”);

}

else if(guessNumnum)

{

printf(“It’s too low!\n”);

}

这里有误，是 == 而不是 =

因为你刚好把这个分支放在最后，因此察觉不到错误

如果你写成

if(guessNum = num) else if(guessNumnum) else if(guessNumnum)

就知道错了。这时if(guessNum = num)永远都会被执行

因为这是一个【赋值语句】而不是【逻辑语句】，且 num 的值是恒正的

else if(guessNum == num)

{

printf(“You are right!\n”);

printf(“你共用了%d次机会猜对数字。\n”,n);

break;

}

printf(“Do you want to continue(Y/N or y/n)?”);

用 getch() 取代scanf ，不易出错

因为 getch()只能输入一个字符

而 scanf 可以读入多个字符，而且要回车

fflush(stdin);

reply = getch();

}while((toupper(reply)==’Y’));

printf(“The game is over!\n”);

return 0;

}

输入合法数字示例(数字包含在一对””中)：

“123”

” 123″

“123 “

” 123 “

” 0000123 ”

上面的结果都是输入正数: 123

关于c语言regex.h和c语言regex实现的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

本文来自投稿，不代表【痞子匠】观点，发布者：【E安全】

本文地址：https://www.pizijiang.com/wep/229108.html ，如若转载，请注明出处！

举报投诉邮箱：253000106@qq.com

regex 语言

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

E安全作者

64.2K 文章

0 评论

0 粉丝

这个人很懒，什么都没有留下～

c语言代码逻辑分析（逻辑或c语言）

上一篇 2024年4月4日 21:50:21

c语言命令行参数函数只能使用char吗（c语言中char函数）

下一篇 2024年4月4日 21:56:29

C语言

c语言改写模式,c语言实现修改功能

c语言程序修改? 1、这个程序有4个错误，我都加粗了，第一个是m没有赋初值，第二个是while表达式中的ch=getchar()需要括号括起来，第三个是m=m*10+ch-0中的0也需要用单引号括起来，第四个是第2个while中为m！=0。 2、define容易造成误会，因为不符合一般的编程习惯，false 0， true 1；scanf放在你的那个地方是达…

E安全
2024年5月23日
41000
C语言

c语言控制代码的换码序列,c语言交换代码

求C语言编程大神解答一下下面这个编程代码? k==5，用5去除125余0，所以r=125%5中r为0。由于！0为1，所以执行while循环体：先打印出5(k的值)，再n=n/k==125/5=25；由于251则再打印出*号。这一循环结果输出是5*。下面是我的代码，三个函数分别对应三个问题。在实现基本要求的前提下，拓展了可以从键盘输入的功能，以下为各题代码…

E安全
2024年5月23日
58000
C语言

c语言扫描io脚状态,c语言端口扫描

求51单片机的上升沿和下降沿C语言检测程序列子,端口就是普通IO口。上升沿触发是当信号有上升沿时的开关动作，当电位由低变高而触发输出变化的就叫上升沿触发。也就是当测到的信号电位是从低到高也就是上升时就触发，叫做上升沿触发。单片机怎么计算1s内下降沿的个数的C语言程序或者计算两个下降沿的时间（检测脉冲频率）计算1s内下降沿的个数方法是，一个定时器设置定时1…

E安全
2024年5月23日
45000
C语言

c语言mallloc使用的简单介绍

C语言中使用malloc必须加#includemallo.h? 1、在C语言中使用malloc函数进行动态内存分配。malloc的全称是memory allocation，中文叫动态内存分配。原型：extern void malloc(unsigned int num_bytes)；功能：分配长度为num_bytes字节的内存块。 2、你可以看一下C语言那本…

E安全
2024年5月23日
45000
C语言

c语言三位小数,C语言三位小数

怎样用C++语言输出精确到小数点后三位的数? 1、用C++语言输出精确到小数点后三位的数，可以参考下面给出的代码：coutsetiosflags(ios：fixed)setprecision(3)。其中 setiosflags中set是设置的意思。ios是iostream的缩写，即输入输出流。flags是标志的意思。 2、要精确到小数点后若干位，则数据类型为…

E安全
2024年5月23日
75000
C语言

c语言21点游戏,二十一点游戏代码c语言

如何使用C语言编写简单小游戏? 1、数学知识：长方形的面积S=a*b 长方形周长L=2*（a+b）其中a b分别为长方形的宽和高。算法分析：长方形面积及周长均依赖于宽和高，所以先要输入宽高值，然后根据公式计算，输出结果即可。 2、/*也不知道你是什么级别的，我是一个新手，刚接触编程语言，以下是我自己变得一个小程序，在所有c语言的编译器(vc++0、turbo…

E安全
2024年5月23日
65000
C语言

c语言当中的null,C语言当中的符号

C/C++中,NULL和null的区别是什么? nul 和 null要看编译器，不同的编译器有所区别。所以C或者C++中都使用一个特殊定义NULL表示无效值，其本质就是未定义具体数据类型的0值。 null是是什么都没有的意思。在java中表示空对象。本意是“空的；元素只有零的”意思。计算机中通常表示空值，无结果，或是空集合。\x0d\x0a在ASCII码…

E安全
2024年5月23日
47000
C语言

包含c语言对txt文件命名的词条

如何在C语言编程里面修改源文件名字如果你是在WINDOWS的话，简单了，随便用个编辑器，比如记事本，然后写c源程序，保存到你想要保存的位置。如果你在DOS下，可以用edit，写好以后，按alt键，选择文件菜单，然后保存。用open打开文件，注意操作模式使用“修改”或者“添加” 用write或者fprintf向文件中写入你的内容。用close关闭文件。 …

E安全
2024年5月23日
50000
C语言

学c语言编程,学c语言编程用什么软件

编程开发必须要学C语言吗? 1、要学习。编程开发的学习内容主要包括c语言、python和c+语言。C语言作为一种简单灵活的高级编程语言，它是一个面向过程的语言，一般是作为计算机专业的基础入门语言课程。 2、C语言。对于刚接触编程的人来说，先学习C语言是非常重要的。C语言可以说是是计算机编程语言的鼻祖，其他的编程语言几乎全是由C语言变化衍生出来的。 3、不需要…

E安全
2024年5月23日
35000
C语言

c语言用string定义字符串,c语言中用string类型来处理字符串类型

C++怎样定义定义字符串 1、第一是字符数组来表示字符串。用下面的语句声明：char a[10]；C语言中字符数组与字符串的唯一区别是字符串末尾有一个结束符\0，而字符数组不需要。 2、在C中定义字符串有下列几种形式：字符串常量，char数组，char指针字符串常量即：位于一对双括号中的任何字符。双引号里的字符加上编译器自动提供的结束标志\0字符，作为 …

E安全
2024年5月23日
45000