教你突破基于HTTP_REFERER的防盗链的方法

时间:2022-12-13
其实防盗链这个技术并不复杂,目前基本就是在服务器端判断HTTP_REFERER的位置,如果不是来自本站自身,则拒绝输出详细。
那么如果考虑突破防盗链的措施,就需要考虑在HTTPREFERER上面做手脚了。PHP 脚本中对应的变量是$SERVER['HTTPREFERER'] ,它存储了 HTTPREFERER 的值。
由于直接访问目标URL资源已经被上述防盗链的措施给屏蔽,所以我们需要个类似网关的玩意去获取。说白了就是编写已经包装过的HTTP头的 PHP 脚本。
下面是简单的函数实现:
function getRemoteFile($url, $refer = '') { 
    $option = array( 
            'http' => array( 
                'header' => "Referer:$refer") 
            ); 
    $context = stream_context_create($option); 
    return file_get_contents($url, false, $context); 
} 
这是个比较简单的函数,其功能就是伪造 Referer (使用 streamcontextcreate 函数 )然后获取对方的数据(使用 filegetcontents,需要开启 allowurlfopen )。
如果想「复杂」一点,可以使用 sockets 扩展 ,这不在这里的讨论范围以内。
另外,再提供个获取主机名的正则函数
function getHost($url) { 
    $result = preg_match('/^http://([d|w|.]+)//', $url, $matches); 
    if (sizeof($matches) >= 2)  { 
        return $matches[1]; 
    } else { 
        return null; 
    } 
} 
再进一步的扩展,可以封装成脚本,然后譬如调用
http://127.0.0.1/proxy.php?url=http://i.am/img 
就可以获取那些开启防盗链措施的链接了。
上一篇:Referer等错误码处理-爬虫反扒机制处理 下一篇:没有了

相关文章

最新文章