
[摘要]: WEB是一个非常大的信息源,但是提供此信息的网站的结构是否合理,唯一的评估者是访问它的用户. 每次用户访问时,访问日志都会记录在WEB服务器上. 根据该日志应用 日志分类,可以知道诸如用户访问站点的URL,用户的IP地址和访问时间之类的信息. 通过分析和处理这些日志信息,我们可以提取访问者的WLP(Web日志路径). 分析这些WLP并挖掘出用户的一般行为模式可以调整网站结构,优化系统性能,并进一步提高WEB最终用户的服务质量. 本文旨在通过对WEB日志挖掘和用户访问模式的研究,开发基于WEB日志挖掘的智能网站知识提取系统. 通过对WEB访问日志的分析,提出了真实路径获取算法和正向访问路径拦截算法,可以发现多用户通用访问模式和单用户个人偏好访问模式. 目标页面确定算法应用 日志分类,页面关联规则发现算法,用于查找Internet目标页面之间的隐藏链接;发现回溯过多的不合理页面节点,从而调整和优化现有网站结构;提出的用户访问路径会话集发现算法,加权网站生成算法,用于探索WEB站点骨干子网的频繁穿越,可以为3G移动应用中WAP子网的生成提供参考. 提出了一种单用户搜索关键词关联规则发现算法,可以为个体用户提供量身定制的个性化搜索引擎服务. 提出了一种新的数据随机干扰处理方法,以实现隐私保护关联规则挖掘模型. 利用数据仓库和OLAP技术来实现采矿信息的统计决策和图形表示. 本文研究的网站日志挖掘算法和应用模型是当前互联网海量信息处理研究的活跃领域,该模型本身体现了更高级的思想. 通过各种有针对性的网站日志挖掘算法,用户可以找到常见的访问模式并找到网站页面之间的隐藏关联规则,从而实现改善网站结构和匹配电子商务网站中最大商机的策略.
本文来自电脑杂谈,转载请注明本文网址:
http://www.pc-fly.com/a/jisuanjixue/article-269349-1.html
假如他国侵犯我国领海必须击之
美舰不予理睬
联合国就是世界政府