千万不要学电子商务(浅议面向电子商务的WEB日志挖掘系统)
介绍了网络挖掘模式在电子商务中的四个应用方向,建立了电子商务网络挖掘应用系统模型,提出了一种改进网站设计的算法,实践证明,该算法可以改善网站的设计和布局,方便用户访问网站,为用户提供便捷的服务,实现对客户的个性化服务。使用关联规则发现可以为对客户动态调整网站结构,使客户访问的相关文件之间的链接更加直接,使客户更容易访问他们想要访问的页面。
[关键词]网络挖掘电子商务个性化服务
电子商务是指个人或企业通过互联网以数字方式交换商务数据和开展商务活动。目前,电子商务在企业和商业领域占据越来越大的市场份额。网络信息挖掘主要用于对商品的市场定位和消费分析,以辅助制定市场策略、分析购物模式、预测销售市场、改进网站设计和提高网站效率。向特定客户推荐相关产品。网络信息挖掘可以提供不同用户的特定信息,有针对性地传播网络广告。利用网络数据挖掘技术建立客户关系管理系统可以大大增强企业的竞争优势。
1.网络挖掘模式应用
(一)寻找潜在客户。对于对,的一个电子商务网站来说,了解并关注注册的客户群是非常重要的,但是从众多的访问者中发现潜在的客户群也是非常重要的。如果发现一些客户是潜在客户,我们可以针对像对这样的客户实施一定的策略,尽快成为注册客户。对于对,的电子商务网站来说,这可能意味着订单数量的增加和收益的增加。利用网络挖掘的分类技术来挖掘历史数据,可以有效地发现对,潜在客户。
(二)延长客户停留时间。对于对,的顾客来说,传统的顾客和卖家之间的差距在电子商务中已经不存在了,而对互联网上的每个卖家对顾客来说都是一样的,所以如何让顾客在自己的销售网站上停留更长的时间将是对卖家面临的一个挑战。为了让客户在自己的网站上停留更长的时间,我们应该了解他们的浏览行为,了解他们的兴趣和需求,并根据他们的需求动态调整网页。利用数据挖掘中的序列模式发现技术来挖掘对,的客户访问信息,可以了解客户的浏览行为,从而了解客户的兴趣和需求。
(3)改进场地设计。网站页面内容的排列就像超市货架上的商品排列一样。将具有一定程度的支持和信任的相关项目放在一起有助于销售。使用关联规则发现可以为对客户动态调整网站结构,使客户访问的相关文件之间的链接更加直接,使客户更容易访问他们想要访问的页面。
(4)为对商户的不同客户提供个性化产品,可以挖掘注册记录和网络日志中的对客户,从而了解访问者的个人爱好,充分了解客户需求,并根据各个细分市场甚至每个客户的独特需求提供个性化产品,有利于提高客户满意度。
综上所述,网络挖掘技术促进个性化推荐,使网站访问者成为购买者,增加交叉销售和促进销售,每次购买增加客户忠诚度。
二,面向电子商务的网络挖掘应用系统模型
当用户访问网络服务器时,网络服务器将自动建立访问日志信息。随着WWW技术的快速发展和时间的积累,web服务器中的Web日志文件将会越来越大,基于Web的电子商务服务器将会保存大量的Web访问日志记录。目前,网络日志挖掘的主要任务是如何自动分析、清理和存储这些海量的网络日志记录,发现有用和重要的知识,包括模式、规则和可视化结构。
电子商务的网络挖掘系统模型包括六个层次:数据收集、数据处理、数据存储、模式发现、模式分析和利用以及客户,如图1所示。
数据采集层采集的数据对是网络服务器日志、客户注册信息和交易数据库。Web服务器日志是由客户访问生成的服务器日志数据。客户注册信息必须与访问日志集成,以提高数据挖掘的准确性。交易数据库存在商业网站上存储用户购买商品的信息,其内容因不同的数据库结构而异,一般包括:用户名、时间、商品标识、购买数量和价格等。
数据处理层实现了对对数据采集层采集的源数据的处理,包括日志文件的处理和数据仓库的建立。日志文件的处理直接影响挖掘算法的结果,其处理过程是保证Web挖掘质量的关键。经处理的数据由数据存储层存储和管理。
模式发现的层次包括路径分析、关联规则挖掘、序列模式挖掘、聚类和分类分析。
模式分析和利用层由两部分组成:个性化网站和商业智能。这也代表了网络挖掘在电子商务中的两个主要应用方向。数据挖掘的结果可以帮助他们了解客户,调整营销策略,改进促销方法,从而赢得竞争。
第三,改进网站设计的算法
对网站链接结构的优化可以从两个方面考虑:第一,通过挖掘对网站日志,发现用户访问页面的相关性,从而在对,密切相关的页面之间添加链接,方便用户使用。第二是通过挖掘对网络日志来发现用户想要的位置。如果期望位置的访问频率高于实际位置,则考虑在期望位置和实际位置之间建立导航链接,从而实现对网站的优化。本文对对的第二点进行了深入探讨。
通过这种算法,我们可以找到用户的返回点,这可能是预期的位置或目标页面,但这个问题可以通过确定时间阈值来解决。当用户长时间停留在返回点并超过指定的阈值时,该页面被视为目标页面;否则,可以将其视为预期位置。如果找不到目标页面,将在第二个预期位置找到,如果找不到,将在第三个预期位置找到。其中,我们最关心的是第一个期望的位置,以及第一个期望的频率高于系统设计者指定的值的所有页面。因此,找到第一个想要的位置成为了我们关注的焦点。
(2)寻找第一期望位置的算法。让Ei代表第一个期望位置,算法如下:首先,以用户标识为主关键字,时间为次关键字,建立对网络日志文件索引,扫描网络日志索引文件,对每个用户标识,提取页面序列。
对于(I=1;I=1。I )//n是网络日志中的记录数
{计算EI中支持的页数;按支持对页面进行排序;
如果支持(P)=SI //SI是网站设计者指定的阈值;
p是出现频率高于系统设计者指定值的第一个所需页面;{}
根据算法的挖掘结果,可以及时调整网站的链接结构,并在第一个期望位置和实际位置之间添加导航链接,从而优化网站的链接结构。
(2)确定所请求的网页的相关性
用户对对网站的访问有着有序的关系,这反映了一种用户的访问兴趣,也就是说,群体用户的访问兴趣与他们的访问顺序有着很强的相关性,可以通过兴趣关联规则挖掘算法进行挖掘。具体算法如下:
让用户访问的页面集为P={p1,p2,…,pn},并使用权重指示从一个节点转向另一个节点的可能性,然后三重(Pi,权重,Pj)指示Pi转向Pj的可能性,其中权重值定义为从Pi到Pj的访问总和与从所有Pi到其他节点的访问总和之比,01。按以下类型统计三胞胎
如果Sm用户关心加权St(其中St和Sm是根据实际情况确定的阈值);
Pi和Pj之间存在相关性。
实验表明,根据挖掘结果可以直接建立Pi和Pj之间的联系。通过这种方法,我们可以改进网站的设计和布局,方便用户访问网站,为用户提供方便快捷的服务,实现对客户的个性化服务。
四.结束语
通过网络数据挖掘,我们可以从数亿个存储着大量各种信息的网页中提取出我们需要的有用知识。通过网络数据挖掘和分析一般用户的访问行为、频率、内容等。在对,我们可以获得关于群用户访问行为和方法的一般知识,这些知识可以用来改进我们的网络服务器设计。更重要的是,通过对对,这些用户特征的了解和分析,可以帮助我们开展对-oriented电子商务活动,给每个用户一个个性化的界面,提供个性化的电子商务服务。