Dale Rogerson
Microsoft 網(wǎng)絡開發(fā)技術小組
摘要
這篇技術性文章討論了如何利用Microsoft Win32網(wǎng)絡函數(shù)創(chuàng)建一個網(wǎng)絡瀏覽器。這篇文章的宗旨是讓讀者了解一些Win32網(wǎng)絡函數(shù)的作用、能力和使用范圍,而不是為這些功能給出一個詳細的文檔。這篇文章所配合的SurfBear樣本應用程序使用Win32網(wǎng)絡函數(shù)從網(wǎng)絡服務器上讀取HTML文件,并把它們顯示成原始的、沒有經(jīng)過格式化的文本。
介紹
不通過網(wǎng)絡,你就無法了解我的一個朋友。計算機雜志已經(jīng)在internet上設置了電子期刊,而本地的報紙也已經(jīng)把整個段落都放到了網(wǎng)絡上。事實上,許多報紙都在聯(lián)機。每個人都有一個主頁,甚至一些無家可歸的人都有一個主頁。雖然有許多關于網(wǎng)絡的消息難免言過其實,但網(wǎng)絡正在變成計算機整體的一部分已經(jīng)是無庸置疑的了。
Microsoft 已經(jīng)介紹了Microsoft Win32網(wǎng)絡函數(shù)來協(xié)助開發(fā)者把網(wǎng)絡變成他們的應用程序的整體部分。這些新的功能簡化了使用FTP(文件傳輸協(xié)議)、和HTTP(超文本傳輸協(xié)議)訪問網(wǎng)絡。使用Win32網(wǎng)絡函數(shù)的開發(fā)者不需要對TCP/IP或Windows 配件。對于一些最普通的操作,開發(fā)者不需要知道他們正在使用的某個協(xié)議的細節(jié)。
最終,Win32網(wǎng)絡函數(shù)將成為Win32應用程序接口的一部分并且與基于Windows的不同的平臺一起發(fā)布。最初,Win32網(wǎng)絡函數(shù)將安裝在一個叫做WININET.DLL的再分布式動態(tài)鏈接庫里。(來自Microsoft網(wǎng)絡軟件開發(fā)工具包,其網(wǎng)址是:http://www.microsoft.com/inter/sdle/)。這屬于網(wǎng)絡開發(fā)工具包的一部分。
這篇文章說明了如何使用Win32網(wǎng)絡函數(shù)去創(chuàng)建一個簡單的網(wǎng)絡瀏覽器。它沒有具體詳細的討論這些功能的細節(jié),但對他們的用法和操作給出了一個演示。請參考網(wǎng)址是http://www.microsoft.com/intdev/sdk/docs/wininet的Microsoft Win32網(wǎng)絡函數(shù)的主題,可以了解到全部的細節(jié)。
這篇文章是配合SurfBear樣本應用程序而創(chuàng)作的。SurfBear是一個HTML文件。覆蓋了這個過程種特定的網(wǎng)絡部分,但它沒有涉及與這個過程有關的用戶接口問題或HTML文件的顯示或操作問題。
注意:這篇文章是基于WININET.DLL一個相當早的版本。很可能其中的參數(shù)名、標識名和函數(shù)名發(fā)生了改變。但是函數(shù)的范圍和意圖應該還是和這篇文章中描述的是一致的。
網(wǎng)絡函數(shù)
最好的探討Win32網(wǎng)絡函數(shù)的方法是直接進入代碼。下面的代碼是樣本的代碼,為了方便閱讀,錯誤處理部分已經(jīng)被刪除掉了。
HINTERNET hNet = ::InternetOpen("MSDN SurfBear", PRE_CONFIG_INTERNET_ACCESS, NULL, INTERNET_INVALID_PORT_NUMBER, 0) ;
HINTERNET hUrlFile = ::InternetOpenUrl(hNet, "http://www.microsoft.com", NULL, 0, INTERNET_FLAG_RELOAD, 0) ;
char buffer[10*1024] ; DWORD dwBytesRead = 0; BOOL bRead = ::InternetReadFile(hUrlFile, buffer, sizeof(buffer), &dwBytesRead);
::InternetCloseHandle(hUrlFile) ;
::InternetCloseHandle(hNet) ; 上面列舉的代碼包括四個網(wǎng)絡函數(shù):InternetOpen、InternetOpenOrl、InternetReadFile和InternetCloseHandle。下面我們依次對這些函數(shù)進行分析。
InternetOpen
InternetOpen初始化WININET.DLL。它在其他的Win32網(wǎng)絡函數(shù)之前被調用。
HINTERNET hNet = ::InternetOpen( "MSDN SurfBear", // 1 LPCTSTR lpszCallerName PRE_CONFIG_INTERNET_ACCESS, // 2 DWORD dwAccessType "", // 3 LPCTSTR lpszProxyName INTERNET_INVALID_PORT_NUMBER, // 4 INTERNET_PORT nProxyPort 0 // 5 DWORD dwFlags ) ; InternetOpen返回一個類型為HINTERNET的句柄。其他的Win32網(wǎng)絡函數(shù)把這個句柄當作一個參數(shù)。現(xiàn)在你不能把一個HINTERNET句柄用在類似于ReadFile之類的其他Win32函數(shù)中。但是隨著Microsoft Windows和Microsoft Windows NT網(wǎng)絡支持的成熟,這一點在將來不是不可能實現(xiàn)的。
當你已經(jīng)結束使用Wein32網(wǎng)絡函數(shù)時,你應該調用InternetCloseHandle釋放InternetOpen分配的資源。使用Microsoft基礎類(MFC)的應用程序將從文件的構造程序里象征性地調用InternetOpen。絕大多數(shù)應用程序都將在每一進程里調用InternetOpen。
InternetOpen 的第一個參數(shù)lpszCallerName指定正在使用網(wǎng)絡函數(shù)的應用程序。當HTTP協(xié)議使用時,這個名字將變成用戶代理。
第二個參數(shù)dwAccessType指定訪問類型。在上面的例子里,PRE_CONFIG_INTERNET_ACCESS訪問類型指示W(wǎng)in32網(wǎng)絡函數(shù)使用登記信息去發(fā)現(xiàn)一個服務器。使用PRE_CONFIG_INTERNET_ACCESS需要正確設定登記信息。這里我耍了一個小花招并讓網(wǎng)絡開發(fā)者替我登記注冊。如果你不想欺騙,你需要按圖1所示設定登記信息。
在登記注冊中,把AccessType設置為1,則意味著“直接入網(wǎng)”,把AccessType 設置為2,意味著“使用網(wǎng)關”。把DisableServiceLocation設置為1,將讓它使用一個已經(jīng)命名的服務器;否則將找到一個使用注冊信息和名字決議(RNR)應用程序接口的服務器,它是Windows接口的一部分。
其他的訪問類型包括以下幾種:
LOCAL_INTERNET_ACCESS只連接到當?shù)豂nternet網(wǎng)站。例如,如果我使用SurfBear標志,我就只能訪問Microsoft整體的Internet網(wǎng)站。 CERN_PROXY_INTERNET_ACCESS使用一個CERN代理去訪問web。CERN代理是一個充當網(wǎng)關的web服務器并且能向要使用代理的服務器發(fā)送HTTP請求。 GATEWAY_INTERNET_ACCESS允許連接到World Wide Web。我可以用這個訪問類型去訪問web上的任何站點。 GATEWAY_PROXY_INTERNET_ACCESS和CERN_PROXY_ACCESS訪問類型要求第三個參數(shù)給InternetOpen:服務器名(lpszProxyName)。PRE_CONFIG_INTERNET_ACCESS不要求服務器名,因為他可以為服務器搜索寄存信息。
NProxyPort參數(shù)用在CERN_PROXY_INTERNET_ACCESS中用來指定使用的端口數(shù)。使用INTERNET_INVALID_PORT_NUMBER相當于提供卻省的端口數(shù)。
最后一個參數(shù)棗dwFlags,設置額外的選擇。你可以使用 INTERNET_FLAG_ASYNC標志去指示使用返回句句柄的將來的Internet函數(shù)將為回調函數(shù)發(fā)送狀態(tài)信息,使用InternetSetStatusCallback進行此項設置。
InternetOpenUrl
一旦你把Win32網(wǎng)絡函數(shù)初始化了,你就可以使用其他網(wǎng)絡函數(shù)。下一個要調用的Internet 函數(shù)是InternetOpenUrl。這個函數(shù)連接到一個網(wǎng)絡服務器上并且最被從服務器上讀取數(shù)據(jù)。InternetOpenUrl能對FTP,Gopher或HTTP協(xié)議起作用。在這篇文章中,我們只涉及HTTP協(xié)議。
HINTERNET hUrlFile = ::InternetOpenUrl( hNet, // 1 HINTERNET hInternetSession "http://www.microsoft.com", // 2 LPCTSTR lpszUrl NULL, // 3 LPCTSTR lpszHeaders 0, // 4 DWORD dwHeadersLength INTERNET_FLAG_RELOAD, // 5 DWORD dwFlags 0 // 6 DWORD dwContext ) ; InternetOpenUrl也返回一個HINTERNET,它被傳遞給在這個URL(統(tǒng)一資源定位)上操作的函數(shù)。你應該使用InternetClose來關閉這個句柄的處理。
InternetOpenUrl的第一個參數(shù)hInternetSession是從InternetOpen返回的句柄。第二個參數(shù)lpszUrl是我們需要的資源的URL(統(tǒng)一資源定位)。在上面的例子中,我們想得到一個Microsoft的web主頁。下面兩個參數(shù)lpszHeaders和HeaderLength用來向服務器傳送額外的信息。使用這些參數(shù)要求具有正在使用的特定協(xié)議的知識。
DwFlag是一個可以用幾種方式修改InternetOpenUrl行為的標志,InternetOpenUrl的行為包括關閉、隱藏,使原始數(shù)據(jù)可用和用存在的連接取代開辟一個新的連接。
最后一個參數(shù)dwContext是一個 DWORD上下文值。如果有一個值已經(jīng)被指定,它將被送到狀態(tài)回調函數(shù)。如果這個值是0,信息將不會被送到狀態(tài)回調函數(shù)。
InternetReadFile
你打開一個文件后,就要讀它,所以下一個函數(shù)是InternetReadFile是符合邏輯的:
char buffer[10*1024] ; DWORD dwBytesRead = 0; BOOL bRead = ::InternetReadFile( hUrlFile, // 1 HINTERNET hFile buffer, // 2 LPVOID lpBuffer sizeof(buffer), // 3 DWORD dwNumberOfBytesToRead &dwBytesRead // 4 LPDWORD lpdwNumberOfBytesRead );
buffer[dwBytesRead] = 0 ; pEditCtrl->SetWindowText(buffer) ; InternetReadFile接收InternetOpenUrl返回的句柄。它也對其他Win32網(wǎng)絡函數(shù),例如FtpOpenFile,FopherOpenFile和HttpOpenRequest返回的句柄有影響。
剩下的InternetReadFile的三個參數(shù)也非常的明白直接。Inbuffer是指向保留數(shù)據(jù)的緩沖區(qū)的一個無返回值指針,dwNumberOfByteToRead以字節(jié)為單位指定緩沖區(qū)的尺寸。最后一個參數(shù),lpdwNumberOfBytesRead是一個指向包含讀入緩沖區(qū)字節(jié)數(shù)的變量的指針。如果返回值是TRUE,而且lpdwNumberOfBytesRead指向0,則文件已經(jīng)讀到了文件的末尾。這個行為與Win32 Re3adFile的函數(shù)的行為是一致的。一個真正的web瀏覽器將在InternetReadFile上循環(huán) ,不停地從Internet上讀入數(shù)據(jù)塊。
為了顯示緩沖區(qū),向緩沖區(qū)添加一個0并把它送到編輯器控制。
這樣,InternetOpen、InternetOpenUrl和InternetReadFile一起創(chuàng)建了Internet瀏覽器的基礎。他們使從Internet上讀取文件就象從你的本地硬盤驅動器上讀取文件一樣容易。
HTTP函數(shù)
在一些例子中,InternetOpenUrl太普通了,所以你可能需要其他的Win32網(wǎng)絡函數(shù)。InternetOpenUrl相當與不同的FTP,GOPHER和HTTP函數(shù)的封皮。當使用HTTP時,InternetOpenUrl調用InternetConnect,HttpOpenRequest以及HttpSendRequest,比如說我們想要在下載一個HTML頁之前得到它的尺寸以便于我們在緩沖區(qū)中為其分配適當?shù)某叽纾琀ttpQueryInfo將得到web頁的大小。
警告:不是所有web 頁都支持得到頁尺寸。(例如:www.toystory.com和www.movielink.com不支持這個功能)另外,TCP/IP能傳遞的數(shù)據(jù)也比要求的要少。所以,你的應用程序應該處理著兩種情況并且圍繞InternetReadFile循環(huán)直到結果為TRUE同時*lpdwNumberOfBytesRead為0。
使用HttpOpenRequest,HttpSendRequest和HttpQueryInfo去打開文件http://www.microsoft.com/msdn/msdninfo的代碼顯示如下,錯誤檢測已經(jīng)被刪除。
// Open Internet session. HINTERNET hSession = ::InternetOpen("MSDN SurfBear", PRE_CONFIG_INTERNET_ACCESS, NULL,
INTERNET_INVALID_PORT_NUMBER, 0) ;
// Connect to www.microsoft.com. HINTERNET hConnect = ::InternetConnect(hSession, "www.microsoft.com", INTERNET_INVALID_PORT_NUMBER, "", "", INTERNET_SERVICE_HTTP, 0, 0) ;
// Request the file /MSDN/MSDNINFO/ from the server. HINTERNET hHttpFile = ::HttpOpenRequest(hConnect, "GET", "/MSDN/MSDNINFO/", HTTP_VERSION, NULL, 0, INTERNET_FLAG_DONT_CACHE, 0) ;
// Send the request. BOOL bSendRequest = ::HttpSendRequest(hHttpFile, NULL, 0, 0, 0);
// Get the length of the file.
char bufQuery[32] ; DWORD dwLengthBufQuery = sizeof(bufQuery); BOOL bQuery = ::HttpQueryInfo(hHttpFile, HTTP_QUERY_CONTENT_LENGTH,
bufQuery,
&dwLengthBufQuery) ;
// Convert length from ASCII string to a DWORD. DWORD dwFileSize = (DWORD)atol(bufQuery) ;
// Allocate a buffer for the file.
char* buffer = new char[dwFileSize+1] ;
// Read the file into the buffer.
DWORD dwBytesRead ; BOOL bRead = ::InternetReadFile(hHttpFile, buffer, dwFileSize+1,
&dwBytesRead); // Put a zero on the end of the buffer. buffer[dwBytesRead] = 0 ;
// Close all of the Internet handles. ::InternetCloseHandle(hHttpFile);
::InternetCloseHandle(hConnect) ; ::InternetCloseHandle(hSession) ;
// Display the file in an edit control. pEditCtrl->SetWindowText(buffer) ;
InternetConnect InternetConnet函數(shù)連接到一個HTTP,F(xiàn)TP或Gopher服務器: HINTERNET hConnect = ::InternetConnect( hSession, //1 HINTERNET hInternetSession "www.microsoft.com", //2 LPCTSTR lpszServerName INTERNET_INVALID_PORT_NUMBER, //3 INTERNET_PORT nServerPort "", //4 LPCTSTR lpszUsername "", //5 LPCTSTR lpszPassword INTERNET_SERVICE_HTTP, //6 DWORD dwService 0, //7 DWORD dwFlags O //8 DWORD dwContext ) ; 第六個參數(shù)dwService決定服務類型(HTTP,F(xiàn)TP或Gopher)。在上面的例子中,InternetConnect連接到一個HTTP服務器上,因為dwService被設置成INTERNET_SERVICE_HTTP。第二個參數(shù)(設置成www.microsoft.com)提供了服務器的地址。注意,HTTP地址必須為服務器名作語法分析,InternetOpenUrl為我們作語法分析。第一個參數(shù)hInternetSession是從InternetOpen返回的句柄。第四個、第五個參數(shù)提供一個用戶姓名和密碼 。這七個參數(shù)沒有控制任何標志影響HTTP操作。最后一個參數(shù)為狀態(tài)回調函數(shù)提供前后關系的信息。
HttpOpenRequest 一旦和服務器的連接已經(jīng)建立,我們打開了想要的文件。HttpOpenRequest和HttpSenRequest一起工作打開文件。HttpOpenRequest去創(chuàng)建一個請求句柄并且把參數(shù)存儲在句柄中。HttpOpenRequest把請求參數(shù)送到HTTP服務器。 HINTERNET hHttpFile = ::HttpOpenRequest( hConnect, // 1 HINTERNET hHttpSession "GET", // 2 LPCTSTR lpszVerb "/MSDN/MSDNINFO/", // 3 LPCTSTR lpszObjectName HTTP_VERSION, // 4 LPCTSTR lpszVersion NULL, // 5 LPCTSTR lpszReferer 0, // 6 LPCTSTR FAR * lplpszAcceptTypes INTERNET_FLAG_DONT_CACHE, // 7 DWORD dwFlags 0 // 8 DWORD dwContext ) ; 到現(xiàn)在為止,網(wǎng)絡函數(shù)的許多參數(shù)看起來都類似。HttpOpenResult的第一個參數(shù)是由InternetConnet返回的 HINTERNET。HttpOpenRequest的第七和第八個參數(shù)執(zhí)行與InternetConnect中有相同名字的參數(shù)一樣的功能。 第二個參數(shù)(“GET”)指定我們想要得到由第三個參數(shù)(“/MSDN/MSDNINFO/”)命名的對象。HTTP版已經(jīng)傳遞第四個參數(shù);現(xiàn)在,它肯定是HTTP棗VERSION。因為“GET”是最流行的動詞類型,HttpOpenRequest將為這個參數(shù)接收一個空指針。 第五個參數(shù)lpszReferer是一個網(wǎng)點的地址。在這個網(wǎng)點上我們發(fā)現(xiàn)了我們現(xiàn)在想要看見的URL(統(tǒng)一資源定位)。換而言之,如果你在www.home.com上而且單擊了跳到www.microsoft.com的一個連接,第五個參數(shù)就是www.home.com。因為它使你指向了目標URL(統(tǒng)一資源定位)。這個值可以為空。第六個參數(shù)執(zhí)行一個我們的程序接收的文件類型列表。把空值傳遞給HttpOpenRequest即通知了服務器只有文本文件可以被接收。
HttpSendRequest
除了傳送請求外,HttpSendRequest允許你傳送額外的HTTP標題給服務器。關于HTTP標題的信息可以在http://www.w3.org/ 上的最新的說明上找到。在這個例子中,HttpSendRequest的所有參數(shù)都被傳遞為缺省值。
BOOL bSendRequest = ::HttpSendRequest( hHttpFile, // 1 HINTERNET hHttpRequest NULL, // 2 LPCTSTR lpszHeaders 0, // 3 DWORD dwHeadersLength 0, // 4 LPVOID lpOptional 0 // 5 DWORD dwOptionalLength ); HttpQueryInfo
為了得到關于文件的信息,在調用HttpSendRequest后使用HttpQueryInfo函數(shù):
BOOL bQuery = ::HttpQueryInfo( hHttpFile, // 1 HINTERNET hHttpRequest HTTP_QUERY_CONTENT_LENGTH, // 2 DWORD dwInfoLevel bufQuery, // 3 LPVOID lpvBuffer &dwLengthBufQuery // 4 LPDWORD lpdwBufferLength ) ; 查詢的結構是字符串或lpvBuffer中的字符串列表。HTTP_QUERY_CONTENT_LENGTH查詢得到文件的長度。你可以使用HttpQueryInfo查詢大范圍的信息。要獲知詳細情形可查閱網(wǎng)點http://www.microsoft.com/intdev/sdk/docs/wininet上的Microsoft Win32網(wǎng)絡函數(shù)專題。
SurfBear樣本應用程序
SurBear樣本應用程序使用Win32網(wǎng)絡函數(shù)從Internet上得到文件并且在編輯器上顯示原始的HTML格式。SurfBear使用HttpOpenRequest和HttpSendRequest取代InternetOpenUrl,純粹是為了演示的需要。
圖2 SurfBear 屏幕
SurfBear是一個MFC4.0版本的對話應用程序。它所有與Internet有關的功能都在InternetThread.h和InternetThread.cpp文件中。
從internet上讀取文件要花費相當數(shù)量的時間,所以從一個工作線程調用網(wǎng)絡函數(shù)是一個明智的主意。通過這種方式,當系統(tǒng)在等待得到數(shù)據(jù)時,應用程序的窗口能被改變尺寸和移動。
圖3顯示了SurfBear的控制流。
當用戶按下GOTO按鈕時,CsurfBearDlg::OnBtnGoto調用CinternetThread:GetWebPoge,傳遞想要的web頁的HTTP地址。GetWebPage把HTTP地址語法分析成服務器和對象名,存儲在CinternetThread的成員變量中。GetWebPage然后調用AfxBeginThread,它產(chǎn)生一個運行靜態(tài)成員函數(shù)的線程GetWebPage WorkerThread。如果網(wǎng)絡函數(shù)沒有被初始化,GetWebPageWorkerThread調用InternetOpen,然后它嘗試讀取想要的web頁。當GetWebPageWorkerThread結束時,它發(fā)送一個用戶定義的WM_READFILECOMPLETED消息給SurfBear對話框。OnReadFileCompleted處理這個消息并且把一個web頁復制到編輯器控制里。
總結
Win32網(wǎng)絡函數(shù)使從FTP,Gopher和HTTP服務器上讀取信息就想從你的硬盤驅動器上讀取信息一樣容易。僅僅使用4個函數(shù)棗InternetOpen,InternetOpenUrl,InternetReadFile和InternetCloseHandle和很少的HTTP知識,你就可以寫一個簡單的網(wǎng)絡瀏覽器。
把這個簡單的瀏覽器變成一個工業(yè)性質的瀏覽器將要花費很多工作,包括一些對HTTP的了解,對如何顯示HTML文件的了解和以及使用多線程方式的能力。Win32網(wǎng)絡函數(shù)將開發(fā)者從與TCP/IP,Windows Sockets和HTTP編程有關的大多數(shù)煩悶工作中解脫出來。
|