c语言提取超链接

E安全 • 2024年3月26日 13:01:55 • C语言 • 阅读 49

如何用C语言创建一个HTML文件（或者是一个超链接文件）？

1、C语言不适合用于写网页，虽然可以用C语言写CGI程序，但是这种方法现在已经被PHP/ASP/JSP等动态页面技术取代，所以并不常用。

2、网页代码是基于HTML语言的。进入到WEB2.0以后开始出现大量的动态网页，也就是通过服务器语言如ASP,PHP,CGI等加上各种数据库实现与用户之前的动态交互。总体来说实现网页的显示还是HTML，只是通过这些语言来控制HTML而已。

用C语言删除一个TXT文件中的超链接

本代码测试数据：

超衔接格式我用的普通html的a标签格式，识别前后匹配字符串分别是”a href=”和”/a”。

如果你想要识别其他字符串并删除，请修改函数int deleteHREF(char *str,int len)中的代码：

char strB[]=”a href=”,strE[]=”/a”;

程序功能说明：

识别每行数据中对应的超衔接字符串，并删除。可以一行对应多个超衔接文本。

不识别跨行的超衔接!!!!(一条超衔接，分两行写，这种不识别，注意！！)。

运行后，会在原文件的地址下新建一个new开头的文件存放删除后的数据。

比如源数据c:\list.txt。执行代码后就会新建c:\new_list.txt。这就是你要的数据。

#include stdio.h

#include malloc.h

#include conio.h

#include string.h

#define MAXC 500//预估行最大字符数量，必须大于实际数量，可改大，实际代码会动态分配空间，不会浪费内存

#define MAXFPATH 100//路径最大字符

#define MAXFNAME 50 //文件名最大字符

typedef struct fpInfo

{

char path[MAXFPATH];

char fname[MAXFNAME];

char **content;

int nrow;//行数

int *nCol;//实际每行字数(同时nCol[]+1也是行内存大小)

}FPINFO;

FPINFO *init();

void printfTXT(FPINFO *fpInfo);//打印文本内容

void meError(void *p);//内存申请失败

int deleteHREF(char *str,int len);//删除一行字符串中超衔接文本，删除成功返回1，失败返回0

int delStr(int indexB,int indexE,char *str);//删除str中下标indexB到indexE的字符，返回删除后的字符串长度

void delFromTXT(FPINFO *fpInfo);//从文本中删除超衔接

int writeFile(FPINFO *fpInfo);//一次写入一行

int main()

{

FPINFO *fpInfo=NULL;

fpInfo=init();

if(fpInfo)

printfTXT(fpInfo);

delFromTXT(fpInfo);

printfTXT(fpInfo);

writeFile(fpInfo);

return 0;

}

void delFromTXT(FPINFO *fpInfo)//从文本中删除超衔接

{

int i;

printf(“\n开始从文本中删除所有超衔接内容\n”);

for(i=0;ifpInfo-nrow;i++)

deleteHREF(fpInfo-content[i],fpInfo-nCol[i]);

printf(“删除完成\n\n”);

}

int deleteHREF(char *str,int len)//删除一行字符串中超衔接文本，删除成功返回1，失败返回0

{

int i,m,n,flag,flagB,flagE,lenB,lenE,indexB,indexE;

char strB[]=”a href=”,strE[]=”/a”;

lenB=strlen(strB),lenE=strlen(strE);

while(1)

{

flag=0;

flagB=0;

flagE=0;

for(i=0;ilen;i++)

{

if(flagB)//首字符串匹配成功，开始寻找尾字符串

{

m=i;

for(n=0;nlenE;n++)// 对比超衔接尾字符串

{

if(str[m]!=strE[n])

break;

m++;

}

if(n==lenE)//尾字符串也匹配成功

flagE=1,indexE=m-1;

}

else

{

m=i;

for(n=0;nlenB;n++)// 对比超衔接首字符串

{

if(str[m]!=strB[n])

break;

m++;

}

if(n==lenB)//首字符串匹配成功,下次循环从对应首字符串之后开始

flagB=1,i=m-1,indexB=m-lenB;

}

if(flagB flagE)//首尾都匹配说明找到一个完整的衔接，执行删除衔接，行字符串移位，并开始再次检查该行字符串是否有其他衔接

{

len=delStr(indexB,indexE,str);

flag=1;

break;

}

if(!flag)//复查没有找到新的匹配字符串，结束查找

break;

}

return 0;

}

int delStr(int indexB,int indexE,char *str)//删除str中下标indexB到indexE的字符，返回删除后的字符串长度

{

str[indexB]=0;

strcat(str,str[indexE+1]);

return strlen(str);

}

void printfTXT(FPINFO *fpInfo)//打印文本内容

{

int i;

printf(“当前txt文本中的内容是：\n—————-\n”);

for(i=0;ifpInfo-nrow;i++)

printf(“%s\n”,fpInfo-content[i]);

printf(“—————-\n”);

}

FPINFO *init()

{

int row=0,len=0,*ncSave=NULL;

FILE *fp=NULL;

char filePath[MAXFPATH+MAXFNAME]={0};

char str[MAXC]={0},*rCtt=NULL,**cSave=NULL;

FPINFO *fpInfo=(FPINFO *)malloc(sizeof(FPINFO));

meError(fpInfo);

printf(“请输入要读取的文件路径（不包含文件名，小于%d个字符）:\n”,MAXFPATH);

scanf(“%s”,fpInfo-path);

printf(“请输入要读取的文件名称（小于%d个字符）:\n”,MAXFNAME);

scanf(“%s”,fpInfo-fname);

strcat(filePath,fpInfo-path);

strcat(filePath,fpInfo-fname);

fpInfo-content=NULL;

fpInfo-nCol=NULL;

fp=fopen(filePath,”rt+”);

if(!fp)

{

printf(“文件打开失败！\n”);

return NULL;

}

fseek(fp,0,SEEK_SET);

while(fgets(str,MAXC,fp))

{

len=strlen(str);

row++;

if(!fpInfo-content)

fpInfo-content=(char **)malloc(sizeof(char *)*row);

else

{

cSave=realloc(fpInfo-content,sizeof(char *)*row);

if(cSave)

fpInfo-content=cSave;

}

fpInfo-nrow=row;

if(!fpInfo-nCol)

fpInfo-nCol=(int *)malloc(sizeof(int)*row);

else

{

ncSave=realloc(fpInfo-nCol,sizeof(int)*row);

fpInfo-nCol=ncSave;

}

fpInfo-nCol[row-1]=len;

rCtt=(char *)malloc(sizeof(char)*len+1);

meError(fpInfo-content);

meError(rCtt);

memset(rCtt,0,len+1);

strcpy(rCtt,str);

fpInfo-content[row-1]=rCtt;

memset(str,0,MAXC);

}

fclose(fp);

return fpInfo;

}

int writeFile(FPINFO *fpInfo)

{

char filePath[MAXFPATH+MAXFNAME+1]={0};

int i,row=fpInfo-nrow;

FILE *fp=NULL;

strcat(filePath,fpInfo-path);

strcat(filePath,”new_”);

strcat(filePath,fpInfo-fname);

fp=fopen(filePath,”w+”);

if(!fp)

{

printf(“文件创建失败！\n”);

return 0;

}

fseek(fp,0,SEEK_SET);

printf(“\n—-开始写入新的文件—-\n”);

for(i=0;irow;i++)

fprintf(fp,”%s”,fpInfo-content[i]);

printf(“—-新数据保存完成—-\n”);

fclose(fp);

return 1;

}

void meError(void *p)//内存申请失败

{

if(p==NULL)

{

printf(“\n异常：内存申请失败！回车结束程序！\n”);

while(getch()!=’\r’);

exit(0);

}

C语言提取源文件？

这段代码能把键盘输入的特定字符串后面双引号内的文字提取出来存入XYZ.txt文件中。在提取过程中滤除了源文件中的’\n’和’ ‘。供参考……

#include “stdio.h”//

#include “string.h”//

#include “stdlib.h”//

void main(void){

FILE *pR,*pW;

char CoStr[20],ln,ch,i=0;

if(!(pR=fopen(“ABC.txt”,”r”))){

printf(“源文件打开失败…”);

exit(0);

}

printf(“请输入特定字符串…\nCoStr=”);

ln=strlen(gets(CoStr));

do{

fseek(pR,-i,SEEK_CUR);

for(i=0;iln;i++)

if((ch=getc(pR))!=CoStr[i]) break;

if(ch==EOF){

printf(“没有发现特定字符串%s!\n”,CoStr);

exit(0);

}

}while(iln);

if(!(pW=fopen(“XYZ.txt”,”w”))){

printf(“创建目标文件失败…”);

exit(0);

}

while((ch=getc(pR))!='”‘ ch!=(char)176);

while((ch=getc(pR))!='”‘ ch!=(char)177){

if(ch==’\n’ || ch==’ ‘) continue;

putc(ch,pW);

}

fclose(pW);

fclose(pR);

printf(“文件已成功建立，名为XYZ.txt\n”);

}

c语言提取html标签内容

#include stdio.h

#include math.h

void fetch_str(char *str_in, char *str_out);

int main(){

char test[] = “aThis is the … string/a”;

char result[256];

fetch_str(test, result);

printf(“\ntest\t=%s\n”, test);

printf(“\nresult\t=%s\n”,result);

return 1;

}

void fetch_str(char *str_in, char *str_out)

{

char begin_str[] = “a”;

char end_str[] = “/a”;

int index_end =0;

int index_begin=0;

int flag_begin =0;

int flag_end =0;

int str_index=0;

int i;

// to find the max index of str_in

while(str_in[str_index]!=’\0′)

{

str_index++;

}

str_index–;

//printf(“%s %s”, begin_str, end_str);

int count=0;

while(str_in[count]!=’\0′)

{

// to find the begin index of the target string

if( flag_begin==0 count=(str_index-2) )

{

if( str_in[count]==begin_str[0] str_in[count+1]==begin_str[1] str_in[count+2]==begin_str[2] )

{

flag_begin=1;

index_begin=count+3;

}

// to find the end index of the target string

//if( flag_end==0 count=(str_index-3) )

if(count=(str_index-3) )

{

if( str_in[count]==end_str[0] str_in[count+1]==end_str[1] str_in[count+2]==end_str[2] str_in[count+3]==end_str[3])

{

flag_end=1;

index_end=count-1;

}

count++;

}

//printf(“\nbegin_index=%d, end_index=%d\n”, index_begin, index_end);

// to copy the target string to str_out

count=0;

for(i=index_begin;i=index_end;i++)

{

str_out[count]=str_in[i];

count++;

}

str_out[count]=’\0′;

return;

}

c语言提取html中的信息

1. 如果你懂编程序：

使用字符串匹配算法，例如KMP算法，AC算法等。

AC算法比较好，网络上可能有现成的，弄一个源代码，再修改下就可以。

2. 如果你不懂编程：

用word，ultraedit等编辑工具，直接搜索你要的字符串就可以了吧。

本文来自投稿，不代表【痞子匠】观点，发布者：【E安全】

本文地址：https://www.pizijiang.com/wep/202646.html ，如若转载，请注明出处！

举报投诉邮箱：253000106@qq.com

语言超链接

打赏

微信扫一扫

支付宝扫一扫

0 0

关于作者

E安全作者

64.2K 文章

0 评论

0 粉丝

这个人很懒，什么都没有留下～

c语言优先级题目

上一篇 2024年3月26日 12:58:47

c语言用循环输出三角形

下一篇 2024年3月26日 13:08:04

C语言

c语言改写模式,c语言实现修改功能

c语言程序修改? 1、这个程序有4个错误，我都加粗了，第一个是m没有赋初值，第二个是while表达式中的ch=getchar()需要括号括起来，第三个是m=m*10+ch-0中的0也需要用单引号括起来，第四个是第2个while中为m！=0。 2、define容易造成误会，因为不符合一般的编程习惯，false 0， true 1；scanf放在你的那个地方是达…

E安全
2024年5月23日
39000
C语言

c语言控制代码的换码序列,c语言交换代码

求C语言编程大神解答一下下面这个编程代码? k==5，用5去除125余0，所以r=125%5中r为0。由于！0为1，所以执行while循环体：先打印出5(k的值)，再n=n/k==125/5=25；由于251则再打印出*号。这一循环结果输出是5*。下面是我的代码，三个函数分别对应三个问题。在实现基本要求的前提下，拓展了可以从键盘输入的功能，以下为各题代码…

E安全
2024年5月23日
56000
C语言

c语言扫描io脚状态,c语言端口扫描

求51单片机的上升沿和下降沿C语言检测程序列子,端口就是普通IO口。上升沿触发是当信号有上升沿时的开关动作，当电位由低变高而触发输出变化的就叫上升沿触发。也就是当测到的信号电位是从低到高也就是上升时就触发，叫做上升沿触发。单片机怎么计算1s内下降沿的个数的C语言程序或者计算两个下降沿的时间（检测脉冲频率）计算1s内下降沿的个数方法是，一个定时器设置定时1…

E安全
2024年5月23日
44000
C语言

c语言mallloc使用的简单介绍

C语言中使用malloc必须加#includemallo.h? 1、在C语言中使用malloc函数进行动态内存分配。malloc的全称是memory allocation，中文叫动态内存分配。原型：extern void malloc(unsigned int num_bytes)；功能：分配长度为num_bytes字节的内存块。 2、你可以看一下C语言那本…

E安全
2024年5月23日
44000
C语言

c语言三位小数,C语言三位小数

怎样用C++语言输出精确到小数点后三位的数? 1、用C++语言输出精确到小数点后三位的数，可以参考下面给出的代码：coutsetiosflags(ios：fixed)setprecision(3)。其中 setiosflags中set是设置的意思。ios是iostream的缩写，即输入输出流。flags是标志的意思。 2、要精确到小数点后若干位，则数据类型为…

E安全
2024年5月23日
72000
C语言

c语言21点游戏,二十一点游戏代码c语言

如何使用C语言编写简单小游戏? 1、数学知识：长方形的面积S=a*b 长方形周长L=2*（a+b）其中a b分别为长方形的宽和高。算法分析：长方形面积及周长均依赖于宽和高，所以先要输入宽高值，然后根据公式计算，输出结果即可。 2、/*也不知道你是什么级别的，我是一个新手，刚接触编程语言，以下是我自己变得一个小程序，在所有c语言的编译器(vc++0、turbo…

E安全
2024年5月23日
63000
C语言

c语言当中的null,C语言当中的符号

C/C++中,NULL和null的区别是什么? nul 和 null要看编译器，不同的编译器有所区别。所以C或者C++中都使用一个特殊定义NULL表示无效值，其本质就是未定义具体数据类型的0值。 null是是什么都没有的意思。在java中表示空对象。本意是“空的；元素只有零的”意思。计算机中通常表示空值，无结果，或是空集合。\x0d\x0a在ASCII码…

E安全
2024年5月23日
45000
C语言

包含c语言对txt文件命名的词条

如何在C语言编程里面修改源文件名字如果你是在WINDOWS的话，简单了，随便用个编辑器，比如记事本，然后写c源程序，保存到你想要保存的位置。如果你在DOS下，可以用edit，写好以后，按alt键，选择文件菜单，然后保存。用open打开文件，注意操作模式使用“修改”或者“添加” 用write或者fprintf向文件中写入你的内容。用close关闭文件。 …

E安全
2024年5月23日
48000
C语言

学c语言编程,学c语言编程用什么软件

编程开发必须要学C语言吗? 1、要学习。编程开发的学习内容主要包括c语言、python和c+语言。C语言作为一种简单灵活的高级编程语言，它是一个面向过程的语言，一般是作为计算机专业的基础入门语言课程。 2、C语言。对于刚接触编程的人来说，先学习C语言是非常重要的。C语言可以说是是计算机编程语言的鼻祖，其他的编程语言几乎全是由C语言变化衍生出来的。 3、不需要…

E安全
2024年5月23日
34000
C语言

c语言用string定义字符串,c语言中用string类型来处理字符串类型

C++怎样定义定义字符串 1、第一是字符数组来表示字符串。用下面的语句声明：char a[10]；C语言中字符数组与字符串的唯一区别是字符串末尾有一个结束符\0，而字符数组不需要。 2、在C中定义字符串有下列几种形式：字符串常量，char数组，char指针字符串常量即：位于一对双括号中的任何字符。双引号里的字符加上编译器自动提供的结束标志\0字符，作为 …

E安全
2024年5月23日
43000