從檔案裡得到所有的郵件地址(原始碼) (轉)

worldblog發表於2007-12-14
從檔案裡得到所有的郵件地址(原始碼) (轉)[@more@]

很想實現類似 裡的 ereg 功能.歡迎探討

/*
 * 從裡得到地址 -2-8 17:15
 */
#include
#include
#define MaxLen 20
#define bufMaxLen 200

long filesize(FILE *stream)
{
 long curpos, length;
 curp= ftell(stream);
 fseek(stream, 0L, SEEK_END);
 length = ftell(stream);
 fseek(stream, curpos, SEEK_SET);
 return length;
}

int main(int argc,char *argv[])
{
 FILE *fp,*fp_write;
 int i,temp_len;
 int bool_find=0,bool_finished=0;
 long file_len=0;
 char fileName[30],write_file[30];
 char mail_data[50]; //儲存得到的臨時郵件
 char *buf;
 char *p,*mail_begin,*temp_p;
 if(argc!=2)
 { printf("error!nExp: %s yourmail.datn",argv[0]);
 return 0;
 }
 sprintf(write_file, "tmp_%s", argv[1]); //生成要寫入的檔名
 strcpy(fileName, argv[1]);
 if((fp=fopen(fileName,"rb"))==NULL)
 { printf("nCan't open The file for %s to read! n",fileName);
 printf("Press any key to halt!");
 return(0);
 }

 if((fp_write=fopen(write_file,"w"))==NULL)
 { printf("nCan't open The file for %s to write! n",fp_write);
 printf("Press any key to halt!");
 return(0);
 }

 file_len=filesize(fp);
 buf=(char *)malloc(file_len);
 fread(buf,file_len,1, fp);
 for(p=buf;*p!='';p++)
 {
// if(*p=='_' || *p=='.' || (*p>='0' && *p<='9') || (*p>='a' && *p<='z') || (*p>='A' && *p<='Z') )

 if()
 {
 bool_finished=0;
 bool_find=0;
 mail_begin=p;
 temp_len=0;
 while(temp_len {
 p--;
//如果符合標準的
 if(*p=='_' || *p=='-' ||  *p=='.' || (*p>='0' && *p<='9') || (*p>='a' && *p<='z') || (*p>='A' && *p<='Z'))
 {
 temp_len++;
 }
 else
 {
 break;
 }
 }
 p++;//指向正確的開始
//eregi("^[_.0-9a-z-]+@([0-9a-z][0-9a-z-]+.)+[a-z]{2,3}$",$))
 if(mail_begin!=p) //符合條件了
 {
 temp_p=mail_begin; //這時temp_p 指向@處
 mail_begin=p; //記錄郵件名開始地址
 p=++temp_p; //p指向@後的第一個字元
// printf("%s %c","ok",*temp_p);

 //接下來的第1個字元應該是a-z 0-9 之間
 while((*p>='0' && *p<='9') || (*p>='a' && *p<='z') || (*p>='A' && *p<='Z') && *p!='')
 {
 p++;
 //緊接著應該是a-z -
 if(*p=='-' || (*p>='0' && *p<='9')  || (*p>='a' && *p<='z') || (*p>='A' && *p<='Z'))
 { p++;
 }
 else
 { bool_find=0;
 break;
 }
 temp_len=0; 
 while(temp_len { if(*p=='-' || (*p>='0' && *p<='9')  || (*p>='a' && *p<='z') || (*p>='A' && *p<='Z'))
 { p++;
 temp_len++;
 }//
 else if(*p=='.')//找到點.了  +[a-z]{2,3}$
 { bool_find++;//找到一段了
 temp_p=p; //temp_p 指向.所在的位置
 p++;
 break;
 }
 else
 { bool_finished=1; //退出迴圈
 break;
 }
 }//while(temp_len if(bool_finished==1 && bool_find==0)//不符合
 break;
 }//while
 }// if(mail_begin!=p) //符合條件了
// .cnggg">ggg@chinatoolsnet.cnggg
 if(bool_find>0)
 {
 p=temp_p; //p退到最後一個.的位置
 p=p+3;
 if(!((*p>='a' && *p<='z') || (*p>='A' && *p<='Z'))) //最後的 不符合
 { p--;
 }
/*
 for(temp_p=mail_begin;temp_p<=p;temp_p++)
 { printf("%c",*temp_p);
 }
*/
// strncpy(mail_data, mail_begin, 3);
 fwrite(mail_begin, p-mail_begin+1, 1, fp_write);
 fputc('n',fp_write);
// printf("%c",'n');
 *p=' '; //這樣做是為了下次檢查時從此開始
 }
 }// if()
// printf("%c",*p);
 }//for
 fclose(fp);
 fclose(fp_write);
 free(buf);
 printf("n--------------------nok!");
 printf("nfile writed to '%s'!",write_file);

 return(0);
}


來自 “ ITPUB部落格 ” ,連結:http://blog.itpub.net/10752043/viewspace-993458/,如需轉載,請註明出處,否則將追究法律責任。

相關文章