一、前言
前面一口君寫了一篇關于url的文章:《一文帶你理解URI 和 URL 有什么區(qū)別?》
本篇在此基礎上,編寫一個簡單的用于解析url的小例子,
最終目標是解析出URL中所有的數(shù)據(jù)信息。
二、庫函數(shù)
用到的幾個庫函數(shù)如下:
1. strncasecmp
頭文件
#include<string.h>
函數(shù)定義
int?strncasecmp(const?char?*s1,const?char?*s2,size_t?n);
函數(shù)說明
用來比較參數(shù)s1和s2字符串前n個字符,比較時會自動忽略大小寫的差異。
返回值
若參數(shù)s1和s2?字符串相同則返回0。
s1?若大于s2則返回大于0的值,
s1若小于s2則返回小于0?的值。
2. strstr
頭文件
#include<string.h>
函數(shù)定義
char?*strstr(?const?char*?str,?const?char*?substr?);
函數(shù)說明
查找 substr 所指的空終止字節(jié)字符串在 str 所指的空終止字節(jié)字符串中的首次出現(xiàn)。不比較空終止字符。
若 str 或 substr 不是指向空終止字節(jié)字符串的指針,則行為未定義。
參數(shù)
str?:指向要檢驗的空終止字節(jié)字符串的指針
substr?:指向要查找的空終止字節(jié)字符串的指針
返回值
指向于 str 中找到的子串首字符的指針,或若找不到該子串則為空指針。若 substr 指向空字符串,則返回 str 。
3. strtok
函數(shù)定義
?char?*strtok(char?*str,?const?char?*delim)
功能
分解字符串?str?為一組字符串,delim?為分隔符
參數(shù)
str --?要被分解成一組小字符串的字符串。
delim --?包含分隔符的 C 字符串。
返回值
該函數(shù)返回被分解的第一個子字符串,如果沒有可檢索的字符串,則返回一個空指針。
4. strncpy
函數(shù)說明
char?*strncpy(char?*dest,?const?char?*src,?size_t?n)
功能
將src指向的字符串拷貝到dest執(zhí)行的內存中,最多拷貝n個字符
參數(shù)
dest --?指向用于存儲復制內容的目標數(shù)組。
src --?要復制的字符串。
n --?要從源中復制的字符數(shù)。
返回值
該函數(shù)返回最終復制的字符串。
5. inet_pton/inet_ntop
頭文件
???????#include?<sys/socket.h>
???????#include?<netinet/in.h>
???????#include?<arpa/inet.h>
函數(shù)聲明
#include?<arpe/inet.h>
int?inet_pton(int?family,?const?char?*strptr,?void?*addrptr);?????
功能:
將點分十進制的ip地址轉化為用于網(wǎng)絡傳輸?shù)臄?shù)值格式
對于IPv4地址和IPv6地址都適用
參數(shù)
family:協(xié)議類型既可以是AF_INET(ipv4)也可以是AF_INET6(ipv6)。如果,以不被支持的地址族作為family參數(shù),這兩個函數(shù)都返回一個錯誤,并將errno置為EAFNOSUPPORT.
strptr:指向點分十進制的IP地址字符串,比如"192.168.1.1"
addrptr:轉換結果存放在addrptr中,比如"192.168.1.1"轉換為:0xC0A80101
addrptr類型為:struct?in_addr?
typedef?uint32_t?in_addr_t;
struct?in_addr?{
????in_addr_t?s_addr;
};
返回值
若成功則為1,若輸入不是有效的表達式則為0,
若出錯則為-1
const?char?*?inet_ntop(int?family,?const?void?*addrptr,?char?*strptr,?size_t?len);?????
功能
將數(shù)值格式轉化為點分十進制的ip地址格式,從數(shù)值格式(addrptr)轉換到表達式(strptr),
返回值
若成功則為指向結構的指針,若出錯則為NULL
6. gethostbyname
函數(shù)的定義
#include?<netdb.h>
struct?hostent?*?gethostbyname(const?char?*?hostname);???
功能
解析hostname指向的域名,該函數(shù)會將該域名封裝到DNS協(xié)議包中,發(fā)送給DNS服務器,DNS服務器會將該域名對應的地址返回,存儲在struct?hostent中
參數(shù)
hostname :存儲域名對應的字符串。
返回值
若成功則為非空指針,若出錯則為NULL且設置h_errno
返回的指針類型為:
struct?hostent{
????char?*h_name;??//official?name
????char?**h_aliases;??//alias?list
????int??h_addrtype;??//host?address?type
????int??h_length;??//address?lenght
????char?**h_addr_list;??//address?list
}
DNS服務器返回的地址就存儲在該結構體中
三、自定義結構
結構體用于存放需要解析的協(xié)議和端口號
struct?pro_port{
?char?pro_s[32];
?unsigned?short?port;
};
目前本例子只解析以下集中協(xié)議,讀者需要支持其他協(xié)議可以按照該格式增加對應信息即可
#define?HEAD_FTP_P?"ftp://"
#define?HEAD_FTPS_P?"ftps://"???
#define?HEAD_FTPES_P?"ftpes://"
#define?HEAD_HTTP_P?"http://"
#define?HEAD_HTTPS_P?"https://"
#define?PORT_FTP??21
#define?PORT_FTPS_I??990????//implicit
#define?PORT_FTPS_E??21?????//explicit
#define?PORT_HTTP?80
#define?PORT_HTTPS?443
struct?pro_port?g_pro_port[]={
?{HEAD_FTP_P,PORT_FTP},
?{HEAD_FTPS_P,PORT_FTPS_I},?
?{HEAD_FTPES_P,PORT_FTPS_E},?
?{HEAD_HTTP_P,PORT_HTTP},?
?{HEAD_HTTPS_P,PORT_HTTPS},
};
四、程序流程圖
程序流程相對來說,比較簡單,主函數(shù)功能說明如下:
1. parse_url()
int?parse_url(char?*raw_url,URL_RESULT_T?*result)
參數(shù):
raw_url:指向一個url字符串,比如:ftp://peng:pass@baidu.com/dir/index.html
result :url解析后的結果存放在該結構體中
結構體類型定義如下:
typedef?struct
{
?char?user[MAX_USER_LEN];
?char?pass[MAX_PASS_LEN];
?char?domain[INET_DOMAINSTRLEN];//域名
?char?svr_dir[MAX_PATH_FILE_LEN];?//文件路徑
?char?svr_ip[MAX_IP_STR_LEN];
?int?port;
}URL_RESULT_T;
功能:
解析url字符串,并將解析結果存放在result中
返回值;
成功返回?URL_OK
失敗返回?URL_ERROR?
2. void remove_quotation_mark()
void?remove_quotation_mark(char?*input)
參數(shù)
input:字符串
功能
去掉字符串中的雙引號?"
返回值
無
3. parse_domain_dir
int??parse_domain_dir(char?*url,URL_RESULT_T?*result)
參數(shù)
url:執(zhí)行去掉協(xié)議頭的url字符串,比如:peng:pass@baidu.com/dir/index.html
result :url解析后的結果存放在該結構體中
功能
解析出url中用戶名、密碼、域名/ip、文件路徑等信息
返回值
成功:URL_OK
失敗:URL_ERROR
4. check_is_ipv4()
int?check_is_ipv4(char?*domain)
參數(shù)
domain:指向一個域名或者IP地址點分十進制字符串,最大長度為:MAX_URL_LEN
功能
判斷domain中存放的是不是合法的IP地址
返回值
1:是IP地址
-1:不是IP地址
5、dns_resoulve()
int?dns_resoulve(char?*svr_ip,const?char?*domain)
參數(shù)
svr_ip:存放DNS協(xié)議解析過的域名對應的IP地址點分十進制字符串
domain:域名字符串
功能
將domain中的域名,通過DNS協(xié)議解析成對應的IP地址
返回值
成功:URL_OK
失?。篣RL_ERROR
五、運行
測試程序
void?main(void)
{
?int?ret;
?
?char?url_str[256]="ftp://peng:pass@baidu.com/dir/index.html";
?parse_url(url_str,&url_result_t);
?ret?=?check_is_ipv4(url_result_t.domain);?
?if(ret?!=?1)
?{?
??//dns
??dns_resoulve(url_result_t.svr_ip,url_result_t.domain);
?}
?printf("n-------------result---------------n");
?printf("user:%sn",url_result_t.user);
?printf("pass:%sn",url_result_t.pass);
?printf("port:%dn",url_result_t.port);
?printf("domain:%sn",url_result_t.domain);
?printf("svr_dir:%sn",url_result_t.svr_dir);
?printf("svr_ip:%sn",url_result_t.svr_ip);
?printf("-------------end---------------n");
}
執(zhí)行結果
六、代碼獲取
完整代碼可以進入我的倉庫獲取 https://gitee.com/yikoulinux/url