1.本发明涉及网站更新不及时的计算方法技术领域,具体为一种网站更新不及时的计算方法。
背景技术:
2.随着网站的不断发展,网站内容及栏目越来越多,给网站内容保障工作带来挑战。一方面,网站需要保持不断更新来提高搜索引擎的收录量,从而推动网站影响力的提升;另一方面,网站大部分栏目都有明确更新频率或者时间截点要求,无论是监管单位还是网站运营单位,都需关注网站各栏目的更新情况,对于栏目层级目录较多的网站,在资源有限的情况下仅靠人工计算无法达到预期目标,因此可引入技术手段来自动监测和计算栏目的更新及时性情况,为各单位技术支撑。
技术实现要素:
3.本发明提供了一种网站更新不及时的计算方法,该网站更新不及时的计算方法,解决了通过对各大网站内实施更新报道的截图转换识别,以此来对比自身网站信息的及时性和准确性,同时对一些僵尸栏目也就是长期未更新的网站进行标记并进行数据云端存储,以此减少网站运行数据臃肿,在配以对比误差后的更新预警提醒,进行全方位的网站运行。
4.为实现以上目的,本发明通过以下技术方案予以实现:一种网站更新不及时的计算方法,包括实时栏目更新及时性模块,所述实时栏目更新及时性模块,在对网站重要栏目展开实时扫描监测,根据设定栏目的更新计算阈值,自动判断栏目的最新更新状态,同时,还可汇总统计各栏目实时监测结果,如更新不及时数、更新及时率,所述网站首页更新及时性对用户网站的首页信息进行日常更新监测,支持统计任意时间段内的更新量、平均日更新、近2周未更新天数,同时提供更新趋势及首页更新详情列表;
5.所述常规栏目更新及时性模块,每日对网站群各子站的动态要闻类、人事信息类栏目、通知公告类、政策文件类等一级栏目的更新情况进行监测,并监测分析各栏目在考核更新周期内的更新及时性情况;
6.所述常规栏目更新及时性模块相较于“实时栏目更新及时性模块”,支持查询历史任意时间点,各栏目的更新情况,结合这两个模块,用户既可以了解栏目的最新更新及时性状态,还可对任意历史时间点的更新及时性情况;
7.所述长期未更新栏目模块,为将未纳入常态化监测的栏目纳入监测范围,系统通过定期全站扫描监测的方式对网站中的长期未更新栏目进行监测,系统首先初步根据信息更新时间进行识别,并对监测出的“疑似长期未更新栏目”自动截图留证,同时,由专人审核后,最终形成长期未更新栏目列表;
8.所述空白栏目模块,系统将定期对网站进行空白栏目(即有栏目无内容的栏目)监测,并自动截图留证,然后经过人工二次审核,判断其是否为空白栏目,最终形成空白栏目
问题汇总列表,其中空白栏目模块还设置有空白栏目列表和空白栏目识别,所述空白栏目列表为客户提供空白栏目列表展示功能,在空白栏目列表展示页中,
9.用户可查看该栏目名称、网址、截图、审核时间、整改标记及审核标记等信息,同时支持对检测出的栏目网址进行查询匹配、定位操作(支持源代码及页面定位),满足用户自主查询、整改标记、即时定位查阅需求,更便于后期问题整改,所述空白栏目识别主要以栏目中稿件的数量为依据: 统可统计栏目中的稿件数量,并以此作为栏目识别的初步依据;
10.优选的,所述常规栏目更新及时性模块包括栏目自主分析技术,栏目自主分析技术主要领域为系统支持栏目分析功能,能分析各栏目在考核更新周期内的更新及时性情况,栏目条件通过设置包括和排除两种策略来确定,通过配置栏目监测过滤地址,便可实现过滤站外地址以及无法打开的地址,自动截图取证,为便于审核确认并提供留证记录,系统在扫描监测时,若初步判断该栏目为长期未更新栏目/空白栏目时,会自动截图保留,栏目定位功能。
11.优选的,所述更新及时性模块包括更新预警功能模块,更新预警功能模块,支持根据实际更新频率需求设置阈值,当栏目更新未达标时,系统可自动发送预警信息给相关网站负责人,如设置首页近两周内需更新10 条,若近两周内更新8条,则系统会发送告警信息(短信、微信或邮箱等方式)通知相关网站负责人及时更新信息。
12.优选的,所述更新及时性模块包括网站更新监控配置功能,网站更新监控配置功能有添加新监测栏目、新建栏目监控和项目基本属性,所述新建栏目监控进入管理系统后台,选择“更新量监测”后点击“添加监测任务”,进入新建向导,所述项目基本属性设置网站名称、栏目名称、栏目地址、包括范围,(注:1、多个栏目请用“;”分开,如果多个类别,请用
“‑”
连接类别与栏目,如果没有
“‑”
则默认第一个\前的人为是类别。
13.优选的,所述更新及时性模块包括设置每日更新条件模块,设置每日更新条件模块,包括配置栏目检测阈值模块、设置更新时间识别,选择“操作”后点击“属性”后点击每日更新识别,进入属性配置界面,所述添加栏目警报,根据用户需求,可设置栏目报警机制,选择“操作”后点击“报警规则”后点击“添加规则”进入报警配置,所述修改检测配置模块,第一步;修改检测地址、第二部;修改检测范围,所述配置栏目检测阈值模块,选择“栏目更新阈值”后点击“添加栏目更新阈值配置”进入栏目阈值配置属性,所述还设置有查看更新数据模块、删除、添加更新记录模块。
14.优选的,所述常规栏目更新及时性模块包括检测模块,检测模块中设置有僵尸栏目检测配置模块,其中僵尸栏目配置模块还设置有僵尸栏目扫描模块、人工更新频率审核模块。
15.借由上述技术方案,本发明提供了一种网站更新不及时的计算方法。至少具备以下有益效果:
16.该网站更新不及时的计算方法,在实际运行过程中,减少了用户具体查看各类网站分类信息的有效性,也就是说因大量网站长期未更新且职能变化快导致很多信息处于无用信息,而网站种类繁多也导致政策导向查找困难,在此通过实时栏目更及时性模块对各大网站进行实时监控,并对未确认的信息转发进空白栏目进行预展示,后根据人工审核在进行展示常规栏目更新,以此来确定了网站的多样性和时效性,后通过将长期未更新的网站标记为僵尸网站,并将其数据放入空白栏目中,后只展示基础文字展示,当用户点击时,
则进入云端数据并取出点击僵尸栏目内的信息放入具体的栏目中,以此来达到减少网站运行内存多导致的网站卡顿。
具体实施方式
17.以下结合实施例对本发明作进一步说明:
18.本发明提供该技术方案:一种网站更新不及时的计算方法,包括实时栏目更新及时性模块,实时栏目更新及时性模块,在对网站重要栏目展开实时扫描监测,根据设定栏目的更新计算阈值,自动判断栏目的最新更新状态,同时,还可汇总统计各栏目实时监测结果,如更新不及时数、更新及时率,网站首页更新及时性对用户网站的首页信息进行日常更新监测,支持统计任意时间段内的更新量、平均日更新、近2周未更新天数,同时提供更新趋势及首页更新详情列表,同时支持关键信息预转发,因及时性更新特殊性,导致经扫描检测比对后还需进行人工审核书写才能进行更新发表,导致异常拖拉,为此通过对空白栏目模块进行填充,对关键词比对后的文案进行预先转发,以保证及时性,后进入更新预警功能模块中进行积攒,并达到预定数量后进行告警;
19.常规栏目更新及时性模块,每日对网站群各子站的动态要闻类、人事信息类栏目、通知公告类、政策文件类等一级栏目的更新情况进行监测,监测方便包括通过前期数据预设数据库,以此定位关键词库,如出现、人名、地名、职业、变更、或试行方法等敏感词汇时,通过长期未更新栏目模块内的自动截图留证功能中的截图,后将图片的bmp格式转换为pdf格式,并与网站的更新内容进行比对,此过程中若关键词相差过大,或时间相隔过大转入长期未更新栏目模块内进行储存标记等待专人审核,若内容关键词同质化严重则进行自动删除,并监测分析各栏目在考核更新周期内的更新及时性情况;
20.常规栏目更新及时性模块相较于“实时栏目更新及时性模块”,支持查询历史任意时间点,各栏目的更新情况,结合这两个模块,用户既可以了解栏目的最新更新及时性状态,还可对任意历史时间点的更新及时性情况,通过对2年以上的栏目中内容进行压缩处理或进行云存储来避免过多往期内容导致的栏目运行内存臃肿;
21.长期未更新栏目模块,为将未纳入常态化监测的栏目纳入监测范围,系统通过定期全站扫描监测的方式对网站中的长期未更新栏目进行监测,系统首先初步根据信息更新时间进行识别,并对监测出的“疑似长期未更新栏目”自动截图留证,同时,由专人审核后,最终形成长期未更新栏目列表,针对系统发现的长期未更新栏目/空白栏目,系统提供地址定位功能,能够让用户快速定位从哪个页面中可以打开这个栏目,如通过点击监测结果列表中的定位,用户即可迅速在栏目引用页中定位到相关长期未更新栏目,具体定位方法如下展示;
22.《ahref=“../-/zcfg/》政策法规-关停《》/a《
23.《/div》
‑‑
》
24.《divclass="_tophatc-topnav4"》
25.《ahrefa"http://(网址)》安全监管《/a》
26.《/div》
27.《divclass="ctopnavfc_topnav5"》
28.《ahrefa"http://(网址)》公众参与《/a》
29.《/div》
30.《divclass="ctopnavfctopnav6'》
31.《ahrefa"http://(网址)》服务大厅《/a》
32.《/div》
33.《divclass="ctopnavfctopnav6'》
34.《ahrefa"http://(网址)》机关党建《/a》
35.《/div》
36.《divclass="ctopnavfctopnav6'》
37.《ahrefa"http://(网址)》空白栏目《/a》
38.return0;
39.}。
40.空白栏目模块,系统将定期对网站进行空白栏目(即有栏目无内容的栏目)监测,并自动截图留证,然后经过人工二次审核,判断其是否为空白栏目,最终形成空白栏目问题汇总列表,其中空白栏目模块还设置有空白栏目列表和空白栏目识别,空白栏目列表为客户提供空白栏目列表展示功能,在空白栏目列表展示页中;
41.用户可查看该栏目名称、网址、截图、审核时间、整改标记及审核标记等信息,同时支持对检测出的栏目网址进行查询匹配、定位操作(支持源代码及页面定位),满足用户自主查询、整改标记、即时定位查阅需求,更便于后期问题整改,空白栏目识别主要以栏目中稿件的数量为依据:统可统计栏目中的稿件数量,并以此作为栏目识别的初步依据;
42.常规栏目更新及时性模块包括栏目自主分析技术,栏目自主分析技术主要领域为系统支持栏目分析功能,能分析各栏目在考核更新周期内的更新及时性情况,栏目条件通过设置包括和排除两种策略来确定,通过配置栏目监测过滤地址,便可实现过滤站外地址以及无法打开的地址,自动截图取证,为便于审核确认并提供留证记录,系统在扫描监测时,若初步判断该栏目为长期未更新栏目/空白栏目时,会自动截图保留,栏目定位功能。
43.更新及时性模块包括更新预警功能模块,,更新预警功能模块,支持根据实际更新频率需求设置阈值,当栏目更新未达标时,系统可自动发送预警信息给相关网站负责人。如设置首页近两周内需更新10条,若近两周内更新8条,则系统会发送告警信息(短信、微信或邮箱等方式)通知相关网站负责人及时更新信息。
44.更新及时性模块包括网站更新监控配置功能,网站更新监控配置功能有添加新监测栏目、新建栏目监控和项目基本属性,新建栏目监控进入管理系统后台,选择“更新量监测”后点击“添加监测任务”,进入新建向导,项目基本属性设置网站名称、栏目名称、栏目地址、包括范围,(注: 1、多个栏目请用“;”分开,如果多个类别,请用
“‑”
连接类别与栏目,如果没有
“‑”
则默认第一个\前的人为是类别。
45.更新及时性模块包括设置每日更新条件模块,设置每日更新条件模块,包括配置栏目检测阈值模块、设置更新时间识别,选择“操作”后点击“属性”后点击每日更新识别,进入属性配置界面,添加栏目警报,根据用户需求,可设置栏目报警机制,选择“操作”后点击“报警规则”后点击“添加规则”进入报警配置,修改检测配置模块,第一步;修改检测地址、第二部;修改检测范围,配置栏目检测阈值模块,选择“栏目更新阈值”后点击“添加栏目更新阈值配置”进入栏目阈值配置属性,还设置有查看更新数据模块、删除、添加更新记录模
块。
46.常规栏目更新及时性模块包括检测模块,检测模块中设置有僵尸栏目检测配置模块,其中僵尸栏目配置模块还设置有僵尸栏目扫描模块、人工更新频率审核模块。
47.僵尸栏目扫描模块,先通过打开webdr.exe软件,并进入云检测服务器内,通过taskid获得预存的数据,并更改栏目地址后上传栏目服务器,以此来减少因网站数据过多导致的臃肿。
48.以上为本发明举例说明。
技术特征:
1.一种网站更新不及时的计算方法,包括实时栏目更新及时性模块,其特征在于:所述实时栏目更新及时性模块,在对网站重要栏目展开实时扫描监测,根据设定栏目的更新计算阈值、自动判断栏目的最新更新状态,同时还可汇总统计各栏目实时监测结果,如更新不及时数、更新及时率,所述网站首页更新及时性对用户网站的首页信息进行日常更新监测,支持统计任意时间段内的更新量、平均日更新、近2周未更新天数,同时提供更新趋势及首页更新详情列表;s1,所述常规栏目更新及时性模块,每日对网站群各子站的动态要闻类、人事信息类栏目、通知公告类和政策文件类等一级栏目的更新情况进行监测,并监测分析各栏目在考核更新周期内的更新及时性情况;s2,所述常规栏目更新及时性模块相较于实时栏目更新及时性模块,支持查询历史任意时间点、各栏目的更新情况,结合这两个模块用户既可以了解栏目的最新更新及时性状态,还可对任意历史时间点的更新及时性情况;s3,所述长期未更新栏目模块,为将未纳入常态化监测的栏目纳入监测范围,系统通过定期全站扫描监测的方式对网站中的长期未更新栏目进行监测,系统首先初步根据信息更新时间进行识别,并对监测出的疑似长期未更新栏目自动截图留证,同时由专人审核后,最终形成长期未更新栏目列表;s4,所述空白栏目模块,系统将定期对网站进行空白栏目、即有栏目无内容的栏目监测并自动截图留证,然后经过人工二次审核判断其是否为空白栏目,最终形成空白栏目问题汇总列表,其中空白栏目模块还设置有空白栏目列表和空白栏目识别,所述空白栏目列表为客户提供空白栏目列表展示功能;s4.1在空白栏目列表展示页中,所述用户可查看该栏目名称、网址、截图、审核时间、整改标记及审核标记等信息,同时支持对检测出的栏目网址进行查询匹配、定位操作、支持源代码及页面定位,满足用户自主查询、整改标记和即时定位查阅需求,更便于后期问题整改,所述空白栏目识别主要以栏目中稿件的数量为依据统可统计栏目中的稿件数量,并以此作为栏目识别的初步依据。2.根据权利要求1所述的一种网站更新不及时的计算方法,其特征在于:s1所述常规栏目更新及时性模块包括栏目自主分析技术,栏目自主分析技术主要领域为系统支持栏目分析功能,能分析各栏目在考核更新周期内的更新及时性情况,栏目条件通过设置包括和排除两种策略来确定,通过配置栏目监测过滤地址,便可实现过滤站外地址以及无法打开的地址,自动截图取证,为便于审核确认并提供留证记录系统在扫描监测时,若初步判断该栏目为长期未更新栏目和空白栏目时,会自动截图保留,栏目定位功能。3.根据权利要求1所述的一种网站更新不及时的计算方法,其特征在于:s2所述更新及时性模块包括更新预警功能模块,更新预警功能模块支持根据实际更新频率需求设置阈值,当栏目更新未达标时,系统可自动发送预警信息给相关网站负责人,如设置首页近两周内需更新10条,若近两周内更新8条,则系统会发送告警信息、包括短信、微信或邮箱等方式通知相关网站负责人及时更新信息。4.根据权利要求1所述的一种网站更新不及时的计算方法,其特征在于:所述更新及时性模块包括网站更新监控配置功能,网站更新监控配置功能有添加新监测栏目、新建栏目监控和项目基本属性,所述新建栏目监控进入管理系统后台,选择“更新量监测”后点击“添
加监测任务”,进入新建向导,所述项目基本属性设置网站名称、栏目名称和栏目地址。5.根据权利要求1所述的一种网站更新不及时的计算方法,其特征在于:所述更新及时性模块包括设置每日更新条件模块,设置每日更新条件模块包括配置栏目检测阈值模块、设置更新时间识别,选择“操作”后点击“属性”后点击每日更新识别,进入属性配置界面,所述添加栏目警报,根据用户需求,可设置栏目报警机制,选择“操作”后点击“报警规则”后点击“添加规则”进入报警配置,所述修改检测配置模块,第一步;修改检测地址、第二部;修改检测范围,所述配置栏目检测阈值模块,选择“栏目更新阈值”后点击“添加栏目更新阈值配置”进入栏目阈值配置属性,所述还设置有查看更新数据模块、删除、添加更新记录模块。6.根据权利要求1所述的一种网站更新不及时的计算方法,其特征在于:所述常规栏目更新及时性模块包括检测模块,检测模块中设置有僵尸栏目检测配置模块,其中僵尸栏目配置模块还设置有僵尸栏目扫描模块、人工更新频率审核模块。
技术总结
本发明涉及网站更新不及时的计算方法技术领域,公开了一种网站更新不及时的计算方法,包括实时栏目更新及时性模块,所述实时栏目更新及时性模块,在对网站重要栏目展开实时扫描监测,根据设定栏目的更新计算阈值,自动判断栏目的最新更新状态,同时,还可汇总统计各栏目实时监测结果,该网站更新不及时的计算方法,解决了通过对各大网站内实施更新报道的截图转换识别,以此来对比自身网站信息的及时性和准确性,同时对一些僵尸栏目也就是长期未更新的网站进行标记并进行数据云端存储,以此减少网站运行数据臃肿,在配以对比误差后的更新预警提醒,进行全方位的网站运行。进行全方位的网站运行。
技术研发人员:张泯泯
受保护的技术使用者:上海星鸟网络科技有限公司
技术研发日:2021.11.26
技术公布日:2022/3/8