新浪网是如何处理不同原因产生的死链的

在以下背景下会较多产生死链;死链分类:服务器端返回HTTP状态码404,页面需要用户和蜘蛛正常访问,由于删改或误操作导致反复上下线;解决方案

新浪网是如何处理不同原因产生的死链的

新浪稳座国家级门户头把交椅,谁还敢说自己网站结构的复杂程度可以超越新浪。于是我们请王久明分享一下新浪在死链处理和死链预防(重要页面因修改而产生死链)方面的经验。

一、在以下背景下会较多产生死链:

1、时政新闻的敏感性;

2、来自监管的删除需求;

3、频道(编辑)自身删改的需求;

4、搜索方期望资源方主动优化和定期清除的需求

二、死链分类:

由于系统架构、历史遗留问题、多业务系统交叉影响等多方面因素,新浪存在如下三种死链:

1、协议死链,服务器端返回HTTP状态码404;

例如:‘谁在伪善’http://news.sina.com.cn/movie/music/1999-06-15/2965.shtml

2,内容死链,服务器端返回HTTP状态码200,无法设置为404;

例如:http://news.sina.com.cn/c/2015-04-23/184531753084.shtml

3,页面需要用户和蜘蛛可以正常访问,但由于删改或误操作导致反复上下线形成协议死链或内容死链。

例如:http://news.sina.com.cn/2015-12-05/doc-ifxmhqaa9933763.shtml

上线后又下线,后又上线,甚至反复多次。由于下线期间存在协议死链或内容死链的情况,导致百度认为该页面应该被删除,不被收录,且即使后续重新上线也无法恢复收录。对于这种情况,应加以预防。

三、解决方案:

1、协议死链,这个最符合HTML标准处理方式,站点方面无须多做什么,如果需要百度快速处理可以通过百度站长平台的死链提交工具(http://zhanzhang.baidu.com/college/courseinfo?id=267&page=4#h2_article_title18)进行主动提交

2,无法设置协议死链接,仅主体内容文本被删除的内容死链死链,新浪的处理方法是:

1)走事先之制定好的《死链标准流程》:用站内标准内容死链模板页面(告诉用户该页无法找到)覆盖需要删除的页面,5秒后跳转到统一的全站导航页,以减少用户流失。 

2)根据需要,比如根据特定关键词圈定一批最终需要处理为协议死链的敏感页面,将这些页面链接放到一个文件里,由专人在服务器端修改成协议死链。通过百度站长平台工具进行死链提交

3,针对反复上下线导致百度误判为死链的情况,新浪的预防办法是:

1)制度上:系统后台设置提醒,提醒编辑上线后除非特殊情况不要下线;

2)功能上:这种情况在专题运营中最常见,且影响比单篇新闻页要大,由于我站点运营规定是不能删除页面的,因此在系统后台将“删除专题(对编辑来说就是删除该专题)”和“将专题调整为不对外显示(对编辑来说不是删除,而是暂时下线,调整为外网用户无法访问,可随时再次重新上线)”两个功能严格区分开,并提供回收功能。针对“将专题调整为不对外显示”这种情况,不再将页面更新为内容死链(页面无法找到),以免被百度误判。专题页面仍可访问,只是站点不设置入口、不进行推广,用户没有访问来源而已。

本文来自投稿,不代表【】观点,发布者:【

本文地址: ,如若转载,请注明出处!

举报投诉邮箱:253000106@qq.com

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2024年5月4日 03:28:19
下一篇 2024年5月4日 03:30:25

相关推荐

  • 转码java,转码原因怎么写

    java转码问题 1、其实你的转换是可以的。但是系统显示以当前文件编码 为标准。所以看到不对文字。如果你转成文件编码形式肯定能显示的。 2、java不同编码之间进行转换,都需要使用unicode作为中转。 3、new String(中文字符串.getBytes(iso-8859-1),utf-8);这个应该可以解决你的问题。另外,编码应该页面,文件本身全部统…

    2024年5月22日
    4400
  • excel打不开xlsx文件,excel打不开文件原因

    Excel文件打不开,提示:**.xls文件格式无效。怎么办? 文件损坏:可能该 Excel 文件已经损坏,导致无法正确读取。尝试使用其他 Excel 文件打开软件或在线工具(如 Google Sheets)尝试打开文件,以确定文件是否完整。 具体方法如下:在注册表里面修改才行;在新建EXCEL工作表.xlsx格式;双击就能打开了;方法二:看到桌面上面的Ex…

    2024年5月21日
    5100
  • c语言释放excel资源,c语言如何处理excel

    想从EXCEL中筛取数据,如何用C语言编写,求大神指教 1、先打开我们的VS2015来编写C语言代码。新建一个test.xls来测试我们是否能够写入我们想要的数据到Excel表格里面,学会了如何写入,也就会如何读取了。开始写入一个文件指针,用于到时候指向我们需要找到的Excel表格。 2、你想读取并解析需要有其他库的支持,并不是那么容易。我没有做过这方面的研…

    2024年5月21日
    4300
  • 为什么手机打不开excel文件,手机不能打开excel原因

    手机微信打不开excel表格怎么回事 打不开是因为手机中没有办公软件APP,建议安装后参考下面方法打开;以安卓手机操作excel为例(word同理):首先,我们先登录微信账号。找到对方发送文件的微信号,或者微信群。然后找到那个excel文件。 由于使用的公软件(WPS、EXCEL等)格式、版本不同,苹果手机微信无法正常打开。在苹果应用商店下载WPSapp。打…

    2024年5月20日
    6000
  • excel乱码修复工具,excel乱码如何处理

    excel文件乱码怎么恢复 1、(1)将Excel乱码文件保存为SYLK格式。如果Excel乱码文件可以打开,将Excel乱码文件转换成SYLK格式可以过滤掉文档中损坏的部分,然后保存数据。(2)Excel乱码文件转换成早期版本。 2、步骤一:更改编码方式 打开Excel文件,选择“文件”-“选项”-“高级”;找到“General”选项卡,在“Web选项”下…

    2024年5月19日
    9200
  • 包含linux在哪查看tomcat停止原因的词条

    linux下进程如何查看什么时候停止,哪个用户停止的 1、进入linux系统后,在普通用户模式下输入su – 输入密码,切换到root用户下。 2、ps -ef|grep java复制代码可以看到用户和进程编号,可以用kill 进程编号结束进程。 3、打开linux系统,在linux的桌面的空白处右击。在弹出的下拉选项里,点击打开终端。输入exp…

    2024年5月19日
    4600
  • linux系统报错cpu,linux cpu过高的原因

    Linux系统安装出现cpu被系统禁用是什么情况 1、CPU不支持导致的。换一种方法安装。如下参考:要创建一个新的Linux虚拟机,单击“new”。然后给新虚拟机起一个名字,自定义名字,点击下一步。然后分配虚拟机内存。然后创建一个虚拟硬盘并动态分配磁盘大小。 2、其他虚拟机没提示这个,说明你bios中已经设置了cpu支持虚拟化,那么建议你增加内存试试。 3、…

    2024年5月18日
    6000
  • linux信号丢失怎么解决方法,linux信号6产生原因

    浅谈Linux网络故障的解决办法 1、第一步:配置虚拟机网络,配置文件。/etc/sysconfig/network-scripts/ifcfg-ens33 第二步:虚拟机配置。第三步:重启网卡systemctl restart network 显示重启网卡失败 第二步:查看网卡状态,若active状态,则停掉。 2、检查访问权限是否打开。 (较高)假如从1…

    2024年5月16日
    4700
  • java网站运行慢,javaweb系统响应慢的原因

    JAVA运行太慢怎么办 1、在JAVA页面,点击所有JAVA下载,在里面windows脱机27MB,然后会提示有正在运行的可能是JAVA程序,你点关闭继续进行。可能你会看到什么都没有,实际正在安装,你看安装所在文件夹就知道。 2、java的唯一优点就是开发比较方便,开发界面程序一般用c++或c#或其它,很少人用java的,java那个运行效率真的太垃圾了,内…

    2024年5月15日
    4000
  • c语言所有程序闪退,c语言程序闪退的原因分析

    新手学C问题:为什么我的C语言程序老是闪退? C语言编写的程序运行时闪一下就没了是设置错误造成的,解决方法为:我们以最经典的HELLO WORLD程序为例。当我们写完这个程序 编译完成后单击左上角的叹号运行 可以看到一切正常 按下任意按键后窗口才会消失。 这些都是依赖于windows的控制台窗口,程序执行完就退出了。 如果是已经编译好的C语言程序,可以通过开…

    2024年5月13日
    4700

发表回复

登录后才能评论



关注微信