PHP get_meta_tags获取网页标题title 描述description 关键字keywords等meta信息

PHP内置的get_meta_tags函数可以用于获取网页的标题(title)、描述(description)、关键字(keywords)等meta信息

使用方法如下:

$meta_array = get_meta_tags('https://www.microeco.net');
var_dump($meta_array);

输出

array(4) {
  ["viewport"]=>
  string(56) "width=device-width, initial-scale=1.0, maximum-scale=1.0"
  ["applicable-device"]=>
  string(9) "pc,mobile"
  ["description"]=>
  string(253) "百码云 - 百码云资源站(教程 资源 网站 前端 后端 程序 运维 IT OFFICE 站长),提供网站建设,服务器运维,源码,数据库,IT知识,办公软件WORD,excel,ppt,access,photoshop学习,各种免费空间,域名,VPS介绍等"
  ["keywords"]=>
  string(213) "百码云,百码云资源站,教程,资源,网站,前端,后端,程序,运维,OFFICE,站长,服务器维护,电脑知识,OFFICE办公软件,站长源代码,免费资源,免费域名,免费服务器,免费VPS推荐"
}

get_meta_tags 默认是 utf-8 编码,如果遇到 gbk、gb2312编码,则会出现乱码,

例如,爬取www.qq.com,因为编码是 gb2312 所有出现了乱码:

$meta_array = get_meta_tags('http://www.qq.com');
var_dump($meta_array);

运行结果:

array (size=3)
  'baidu-site-verification' => string 'cNitg6enc2' (length=10)
  'keywords' => string '???,????,???,????,???,NBA,???,?????,???,QQ,Tencent' (length=56)
  'description' => string '???????2003??????????????????????????????????????????????????????????????????????????????????????????????????????????????е?????????????????????????????????????????????????????????????????????????????????????????????????????????????????????????' (length=314)

解决乱码,这里介绍两个方法

方法1:加上 header 头编码,正确代码格式如下:

header("content-type:text/html; charset=gb2312"); 
$meta_array = get_meta_tags('http://www.qq.com');
var_dump($meta_array);

方法2:通用的编码解决方案,让你的浏览器自适应:

header("content-type:text/html; charset=xxx"); 
$meta_array = get_meta_tags('http://www.qq.com');
var_dump($meta_array);

注意:charset=xxx 表示让浏览器自动适配正确的网页编码,这样就不会造成显示乱码

免责申明:
1. 本站所有教程、文章分享目的仅供大家学习和交流,资源连接来自于网络,非本站发布,本站也不存储任何资源!
2. 如有无法查看或链接失效,烦请报告联系管理员处理!
3. 本站无法保证资源质量及其时效性,恕不接受任何提问。
4.本站即不保存任何资源,也不对任何链接作品负责,希望大家赞助本站,费用仅维持本站的日常运营所需!
5. 百码云无法保证文章教程或资源的完善与安全,请自行检测解决。
6. 通过本站收集链接的相关资源,严禁杜绝任何形式的正式商业用途,请前往官方购买。
7. 但凡通过本站链接导航下载的任何作品,虽不归本站所有,但在研究学习的前提下,请务必在下载24小时后删除。
百码云资源站仅提供学习的平台,所有资料均来自于网络,版权归原创者所有!本站不提供任何保证,并不承担任何法律责任,如果对您的版权或者利益造成损害,请提供相应的资质证明,我们将于3个工作日内予以删除。本文章采用BY-NC-SA 4.0 《国际知识共享署名许可协议4.0》 进行许可 。
百码云 » PHP get_meta_tags获取网页标题title 描述description 关键字keywords等meta信息

提供互联网优质的资源链接集合站点

关于VIP 站内帮助