在php中使用sockets:從新聞組中獲取文章
PHP能打開(kāi)遠(yuǎn)程或本地主機(jī)上的Socket端口。本文是一個(gè)使用Socket的小例子:連接到一個(gè)Usenet新聞組服務(wù)器,同服務(wù)器對(duì)話,從新聞組中下載一些文章。
在php中打開(kāi)一個(gè)socket使用fsockopen()打開(kāi)一個(gè)socket.這個(gè)函數(shù)在php3和php4種都可以使用。函數(shù)聲明是這樣的:
int fsockopen (string hostname, int port _[, int errno [, string errstr [, double timeout]]])
這個(gè)函數(shù)將打開(kāi)一個(gè)連接到主機(jī)hostname的port端口的TCP連接。hostname可以是一個(gè)有效的域名,或者是一個(gè)ip地址。對(duì)于udp連接,你必須指定協(xié)議:udp://hostname. 對(duì)于unix域,主機(jī)名使用到socket的路徑,這種情況下,端口port必須置為0。可選的timeout參數(shù)用來(lái)設(shè)定等待打開(kāi)一個(gè)socket的時(shí)間,單位為秒。
關(guān)于fsockopen()的更多信息,請(qǐng)參考:http://www.php.net/manual/function.fsockopen.php
網(wǎng)絡(luò)新聞傳輸協(xié)議 訪問(wèn)新聞組服務(wù)器需要通過(guò)稱為NNTP(網(wǎng)絡(luò)新聞傳輸協(xié)議)的協(xié)議來(lái)進(jìn)行。這個(gè)協(xié)議在rfc977中有詳細(xì)的細(xì)節(jié),可以在http://www.w3.org/Protocols/rfc977/rfc977.html得到。這個(gè)文檔分別描述了怎樣連接到NNTP服務(wù)器,怎樣同服務(wù)器對(duì)話,以及完成這些任務(wù)的不同命令。
連接 連接到一個(gè)NNTP服務(wù)器需要知道它的主機(jī)名(或者是ip地址)和它偵聽(tīng)的端口。為了避免一個(gè)連接企圖失敗導(dǎo)致程序掛起,你應(yīng)該使用timeout參數(shù)。 <?php $cfgServer= 'your.news.host'; $cfgPort;;= 119; $cfgTimeOut; = 10;
//open a socket if(!$cfgTimeOut) // without timeout $usenet_handle = fsockopen($cfgServer, $cfgPort); else // with timeout $usenet_handle = fsockopen($cfgServer, $cfgPort, &$errno, &$errstr, $cfgTimeOut);
if(!$usenet_handle) { echo 'Connection failed.n'; exit(); } else { echo 'Connected.n'; $tmp = fgets($usenet_handle, 1024); }
?> 與服務(wù)器對(duì)話 現(xiàn)在我們已經(jīng)連接到了服務(wù)器,可以通過(guò)前面打開(kāi)的socket同服務(wù)器對(duì)話了。比如說(shuō)我們要從某個(gè)新聞組得到最近的10篇文章。RFC977指出,第一步要用GROUP命令選擇正確的新聞組: GROUP ggg 參數(shù)ggg是要選擇的新聞組的名字(比如說(shuō)是'net.news'),這是必需的。可用的新聞組的列表可以用LIST命令得到。選擇新聞組的命令成功后,返回組中第一篇和最后一篇文章的文章編號(hào),以及組中文章的數(shù)目。
下面是一個(gè)例子: chrome:~$ telnet my.news.host 119 Trying aa.bb.cc.dd... Connected to my.news.host. Escape character is '^]'. 200 my.news.host InterNetNews NNRP server INN 2.2.2 13-Dec-1999 ready (posting ok). GROUP alt.test 211 232 222996 223235 alt.test quit 205 .
接收到命令 GROUP alt.test 后,服務(wù)器返回'211 232 222996 223235 alt.test'. 211是RFC中定義的返回碼,指示命令已成功執(zhí)行。返回信息還指出,現(xiàn)在有232篇文章,最早的文章的編號(hào)是222996,最新的文章的編號(hào)是223235。我們看到,222996+232并不等于223235。丟失的7篇文章因?yàn)槟撤N原因被從服務(wù)器刪除了,可能是因?yàn)楸凰暮戏ㄗ髡呷∠耍ㄟ@是可能的,而且很容易做到),或者因?yàn)槭枪嗨恼露粍h。
需要注意的事,有些服務(wù)器在選擇新聞組之前可能要求身份認(rèn)證,這取決于這是一個(gè)公共的或者是私用的服務(wù)器。也有可能服務(wù)器允許任何人讀取文章,但發(fā)表文章需要身份驗(yàn)證。
<?php //$cfgUser;= 'xxxxxx'; //$cfgPasswd; = 'yyyyyy'; $cfgNewsGroup = 'alt.php';
//identification required on private server if($cfgUser) { fputs($usenet_handle, 'AUTHINFO USER '.$cfgUser.'n'); $tmp = fgets($usenet_handle, 1024); fputs($usenet_handle, 'AUTHINFO PASS '.$cfgPasswd.'n'); $tmp = fgets($usenet_handle, 1024);
//check error if($tmp != '281 Okrn') { echo '502 Authentication errorn'; exit(); } } //select newsgroup fput($usenet_handle, 'GROUP '.$cfgNewsGroup.'n'); $tmp = fgets($usenet_handle, 1024); if($tmp == '480 Authentication required for commandrn') { echo $tmp; exit(); } $info = split(' ', $tmp); $first= $info[2]; $last = $info[3]; printf('First : %sn', $first); printf('Last : %lastn', $last);
?>
