0920編譯原理詞法分析

15林志傑發表於2015-09-20

原文網址 : https://www.cnblogs.com/15linzhijie/p/4824031.html

#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#define _KEY_WOED_END "waiting for your expanding"     //關鍵字結束標誌

typedef struct
{
	int typenum;
	char * word;
}WORD;

char input[255];   //輸入換緩衝區 

char token[255]="";   //單詞緩衝區

int p_input;        //輸入換緩衝區指標

int p_token;        //單詞緩衝區指標

char ch;           //當前所讀的字元

char *rwtab[]={"begin","if","then","while","do","end",_KEY_WOED_END};        //C語言關鍵字

WORD * scaner();    //詞法掃描函式，獲得關鍵字






main()
{
	int over=1;
	WORD *oneword;
	oneword=(WORD *)malloc(sizeof(WORD));
	printf("請輸入您的字串（以#作為結束標誌）:");
	scanf("%[^#]s",input);                        //讀入源程式字串到緩衝區，以#結束，允許多行輸入
	p_input=0;
	printf("您輸入的字串是:%s\n\n",input);
	while(over<1000&&over!=-1)
	{
		oneword=scaner();
		printf("(%d,%s)\n",oneword->typenum,oneword->word);
		over=oneword->typenum;
	}
	printf("\n\n備註:數字10代表所輸入的不是關鍵詞，只是普通詞\n");
	printf("     數字20代表您輸入的是數字\n");
    printf("     數字1000是結束標誌\n\n");

}


//需要用到的自編函式參考實現
//從輸入緩衝區讀取一個字元到ch中

char m_getch(){
	ch=input[p_input];
	p_input=p_input+1;
	return (ch);
}



//去掉空白字元
void getbc()
{
	while(ch==' '||ch==10){
	ch=input[p_input];
	p_input=p_input+1;
	}
}



//拼接單詞
void concat()
{
	token[p_token]=ch;
	p_token=p_token+1;
	token[p_token]='\0';
}



//判斷是否字母
int letter()
{
	if(ch>='a'&&ch<='z'||ch>='A'&&ch<='Z')return 1;
	else return 0;
}


//判斷是否數字
int digit()
{
	if(ch>='0'&&ch<='9')
		return 1;
	else
		return 0;
}


//檢索關鍵字表格
int reserve()
{
	int i=0;
	for(i=0;i<7;i++)
	{
		if(!strcmp(rwtab[i],token))
		{
			return i+1;
		}
		i=i+1;
	}
	return 10;
}




//回退一個字元
void retract()
{
	p_input=p_input-1;
}




WORD *scaner()
{
	WORD *myword;
	myword=(WORD *)malloc(sizeof(WORD));
	myword->typenum=10;
	myword->word="";
	p_token=0;
	m_getch();
	getbc();
	if(letter())
	{
		while(letter()||digit())
		{
		   concat();
		   m_getch();
		
		}
		retract();
 	    myword->typenum=reserve();
	    myword->word=token;
	    return(myword);
	}
	else if(digit())
	{
		while(digit())
		{
			concat();
			m_getch();
		}
		retract();
		myword->typenum=20;
	    myword->word=token;
		return(myword);
	}
	else
	{
		switch(ch)
		{
		case '=':m_getch();
			if(ch=='=')
			{
				myword->typenum=39;
	            myword->word="==";
		        return(myword);
			}
			retract();
			myword->typenum=21;
	        myword->word="=";
		    return(myword);
			break;
		case '+':
			myword->typenum=22;
	            myword->word="+";
		        return(myword);
				break;
		case '-':
			myword->typenum=23;
	            myword->word="-";
		        return(myword);
				break;
		case '*':
			myword->typenum=24;
	        myword->word="*";
		    return(myword);
		    break;
		case '/':
			myword->typenum=25;
	        myword->word="/";
		    return(myword);
		    break;
		case '(':
			myword->typenum=26;
	        myword->word="(";
		    return(myword);
		    break;
		case ')':
			myword->typenum=27;
	        myword->word=")";
		    return(myword);
		    break;
		case '[':
			myword->typenum=28;
	        myword->word="[";
		    return(myword);
		    break;
		case ']':
			myword->typenum=29;
	        myword->word="]";
		    return(myword);
		    break;
		case '{':
			myword->typenum=30;
	        myword->word="{";
		    return(myword);
		    break;
		case '}':
			myword->typenum=31;
	        myword->word="}";
		    return(myword);
		    break;
		case ',':
			myword->typenum=32;
	        myword->word=",";
		    return(myword);
		    break;
		case ':':
			myword->typenum=33;
	        myword->word=":";
		    return(myword);
		    break;
		case ';':
			myword->typenum=34;
	        myword->word=";";
		    return(myword);
		    break;
		case '>':
			myword->typenum=35;
	        myword->word=">";
		    return(myword);
		    break;
		case '<':
			myword->typenum=36;
	        myword->word="<";
		    return(myword);
		    break;
		case '!':
			m_getch();
			if(ch=='=')
			{
				myword->typenum=40;
				myword->word="!=";
				return(myword);
			}
			retract();
			myword->typenum=-1;
	        myword->word="ERROR";
		    return(myword);
		    break;
		case '\0':
			myword->typenum=1000;
	        myword->word="OVER";
		    return(myword);
		    break;
		default:
			myword->typenum=-1;
	        myword->word="ERROR";
		    return(myword);
			}
		}
	}

Go編譯原理系列3（詞法分析）
2022-01-02
Go編譯原理詞法分析
【編譯原理】手工打造詞法分析器
2024-03-28
編譯原理詞法分析
Go編譯原理系列2（詞法分析&語法分析基礎）
2021-12-23
Go編譯原理詞法分析語法分析
Java 實現《編譯原理》簡單詞法分析功能
2019-06-13
Java編譯原理詞法分析
小C語言--詞法分析程式（編譯原理實驗一）
2018-09-22
C語言詞法分析編譯原理
【水汐の編譯原理】詞法分析器課題1
2020-10-02
編譯原理詞法分析
編譯原理之語法分析-自下而上分析(四)
2020-05-17
編譯原理語法分析
編譯原理之語法分析-自下而上分析(三)
2020-05-17
編譯原理語法分析
Go編譯原理系列4（語法分析）
2022-01-09
Go編譯原理語法分析
用Java寫編譯器（1）- 詞法和語法分析
2020-09-02
Java編譯語法分析
精讀《手寫 SQL 編譯器 - 詞法分析》
2018-07-09
SQL編譯詞法分析
精讀《手寫 SQL 編譯器 – 詞法分析》
2019-03-04
SQL編譯詞法分析
【編譯原理】手工打造語法分析器
2024-04-07
編譯原理語法分析
【編譯原理複習Part_2】語法分析
2024-06-27
編譯原理語法分析
深入分析 Javac 編譯原理
2018-09-17
Java編譯原理
C語言編譯器開發之旅（一）：詞法分析掃描器
2021-06-04
C語言編譯詞法分析
編譯器前端之如何實現基於DFA的詞法分析器
2021-09-21
編譯前端詞法分析
程式的編譯和連結原理分析
2019-03-03
編譯
編譯原理
2024-08-10
編譯原理
《編譯原理》LR 分析法與構造 LR(1) 分析表的步驟 - 例題解析
2019-06-22
編譯原理
實現指令碼直譯器 - 詞法分析器
2019-05-11
指令碼詞法分析
Flutter 編譯原理
2019-09-06
Flutter編譯原理
[譯]用javascript實現一門程式語言-詞法分析
2019-02-27
JavaScript詞法分析
Hollis原創|深入分析Java的編譯原理
2019-05-14
Java編譯原理
vue之詞法分析
2018-09-18
Vue詞法分析
詞法分析基礎
2024-04-07
詞法分析
詞法分析器
2021-05-08
詞法分析
Go編譯原理系列5（抽象語法樹構建）
2022-01-15
Go編譯原理抽象語法樹
精讀《手寫 SQL 編譯器 - 語法分析》
2018-07-23
SQL編譯語法分析
Typescript編譯原理（一）
2018-12-22
TypeScript編譯原理
Vue 模板編譯原理
2018-03-15
Vue編譯原理
編譯原理概覽
2021-12-17
編譯原理
什麼是詞法分析？請描述下js詞法分析的過程？
2024-11-26
詞法分析JS
編譯原理: Thompson 構造法（正規表示式轉 NFA）
2020-11-26
編譯原理
詞法分析的前奏：字元分析（三）
2020-12-27
詞法分析字元
Lex詞法分析器
2019-05-10
詞法分析
從編譯後的程式碼，分析 Angular @Injectable 的工作原理
2022-07-20
編譯Angular
模板函式編譯原理
2021-01-03
函式編譯原理
Go 語言的詞法分析和語法分析(1)
2021-03-23
Go詞法分析語法分析

0920編譯原理詞法分析

相關文章