我要定时抓网页,希望先判断一下网页的HTTP_QUERY_LAST_MODIFIED,如果网页没有改动过,就不抓了,这样科研降低流量。////////////////////////////////////////////
我抓网页是这样做的,就抓网页而言,是可以工作了。
HINTERNET hSession = ::InternetOpen(L"test", INTERNET_OPEN_TYPE_PRECONFIG, NULL, NULL, 0);
HINTERNET hURL = ::InternetOpenUrl(hSession, L"www.sina.com.cn", NULL, 0, INTERNET_FLAG_RELOAD, 0);
DWORD dwStatus;
DWORD dwBuffLen = sizeof(dwStatus);
BOOL bSuccess = ::HttpQueryInfo(hURL, HTTP_QUERY_STATUS_CODE | HTTP_QUERY_FLAG_NUMBER, &dwStatus, &dwBuffLen, NULL);
if(bSuccess && dwStatus == HTTP_STATUS_OK)
{
    ::InternetReadFile(hURL, szReadBuffer, sizeof(szReadBuffer), &dwNumberOfBytesRead);
}
////////////////////////////////////////////我尝试在BOOL bSuccess = ::HttpQueryInfo(hURL, HTTP_QUERY_STATUS_CODE | HTTP_QUERY_FLAG_NUMBER, &dwStatus, &dwBuffLen, NULL);这句后面添加获取时间的语句,但不能成功:
SYSTEMTIME st;
DWORD dwLen = sizeof(SYSTEMTIME);
bSuccess = ::HttpQueryInfo(hURL, HTTP_QUERY_LAST_MODIFIED | HTTP_QUERY_FLAG_SYSTEMTIME, &st, &dwLen, NULL);
发现返回的bSuccess是FALSE;
请问,怎么办?谢谢!