Monthly Archives: 九月 2009

谈谈站内搜索

站内搜索

前言

最近在实施网站优化过程中碰到了站内搜索,本以为是个很简单的事情,可一试才发现水很深,下面是学习心得报告(有删减),欢迎指正.

什么是站内搜索

在以往网站建设、企业信息系统搭建过程中,由于信息结构简单、内容稀缺,站内搜索乃至搜索都不是网站系统的必要装备。但随着Web2.0带来的海量信息井喷式涌现,企业自身对信息架构、管理、发布的需求,以及用户对信息的组织、查询、可寻性的要求越来越高,于是站内搜索出现了。

站内搜索通俗来讲是一个网站或商城的“大门口”,一般在形式上包括两个要件:搜索入口和搜索结果页面,但在其后台架构上是比较复杂的,其核心要件包括:中文分词技术、页面抓取技术、建立索引、对搜索结果排序以及对搜索关键词的统计、分析、关联、推荐等

与其他通用搜索的区别

像谷歌、百度、搜搜等通用搜索引擎都会免费开放站内搜索功能,以嵌入网页代码的形式保持与搜索引擎机器人的沟通、爬取,其弊病有二:
1.这些通用搜索引擎不能及时、全部抓取网站最新页面内容。这对电子商务网站信息(如价格、活动有效时间等)经常更新的特点来说是致命的,用户查到的可能是过时信息.
2.既然是所谓通用引擎,其对搜索结果的展示也是通用的,没有差异性的。其不能按照商城自身业务逻辑去做排序、过滤、展示是其最大的弱项

因此,站内搜索的出现也是有其具体原因和需求的,在搜索的精确度和效果上击败了通用搜索引擎。

站内搜索的价值

站内搜索价值体现在如下:

  • 用户很“懒”,节约用户查找商品时间,提高购买转化率
  • 站内搜索已经成为电子商务网站主导航的标配
  • 对后续用户输入的关键词进行分析、提取、排名等对商城运营者来说是了解用户上网行为的最佳途径

行内几家搜索结果页的特点

挑选几家电子商务里面站内搜索具有代表性的网站及其站内搜索结果页,如下:

1.淘宝站内搜索

淘宝站内搜索最大的特点是过滤功能强大、其对应的商品信息字段也是最多,在搜索技术上根据用户输入的关键词做精确猜测是比较强大,这一点必须基于以往用户搜索记录,加以分析、统计而得出的。另外淘宝屏蔽百度这一点也说明淘宝人对自身站内搜索的自信。

淘宝_搜索结果页

2.京东站内搜索

京东站内搜索最大优势是搜索结果信息设计饱满均衡,这一点表现在商品描述信息上,如每个商品名称比包含其对应的英文名称,如“诺基亚(Nokia)5030 GSM手机 红色送迪士尼正版手机袋!轻巧耐用,实惠超值之选”这一点就解决了上面我们商城站内搜索出现中文搜索得到而英文搜索不到的弊病,而要做到这一点是需要对商品特点了解很清楚的专业客服人员,属于“人海战术”(后面有说明)

京东_搜索结果页

3.走秀和番茄树站内搜索:

走秀站内搜索比较好用的是搜索信息呈现足够大方、商品图大,另外其根据热门关键词搜索量以标签云的形式展示也是一个创新。另外番茄树在商品详情页放置用户对商品打标签的做法也很2.0,既个性而且满足站内搜索需求。

走秀_搜索结果页

优化措施与途径

根据项目目前实际与潜在需求,按规划周期长短、资源成本消耗等综合因素从小到大,有以下三个优化途径可供参考、比较。

1、人海战术

所谓人海战术是应用一般SQL查询技术,提供一个后台专门修改商城所有商品、活动、业务名称,当然按照一定规则填写商品名称,丰富商品信息。优点是技术门槛低、上线快,缺点是不能根本解决搜索速度慢的问题,而且由于信息量多,很可能会重新设计二级页面,且人为修改容易出错。这只能是短期打算,不能解决站内搜索的根本问题。

2、采用第三方站内搜索技术

站内搜索由于是中大型资讯类、社交类以及电子商务类网站必要组件,其开发难度大、耗工长,已有专门公司搞这个,较出色的有银杏泰克autonomy,其特点是:上线速度快、但由于其是按照搜索量计费,后期成本控制有些难以估算。

3、 自主开发

自主开发一个站内搜索引擎,按“架构+编程+前端”3人组合据行内人士估算需要3人*100日=300个人日开发资源,若按人日200元计,成本大约在60,000RMB左右,这还不算上策划和设计资源,自主开发最大的好处是可控制、可定制。

行内几家搜索结果页的特点
1.淘宝站内搜索:
淘宝站内搜索最大的特点是过滤功能强大、其对应的商品信息字段也是最多,在搜索技术上根据用户输入的关键词做精确猜测是比较强大,这一点必须基于以往用户搜索记录,加以分析、统计而得出的。另外淘宝屏蔽百度这一点也说明淘宝人对自身站内搜索的自信。
2.京东站内搜索:
京东站内搜索最大优势是搜索结果信息设计饱满均衡,这一点表现在商品描述信息上,如每个商品名称比包含其对应的英文名称,如“诺基亚(Nokia)5030 GSM手机 红色送迪士尼正版手机袋!轻巧耐用,实惠超值之选”这一点就解决了上面我们商城站内搜索出现中文搜索得到而英文搜索不到的弊病,而要做到这一点是需要对商品特点了解很清楚的专业客服人员,属于“人海战术”
3.走秀站内搜索:
走秀站内搜索比较好用的是搜索信息呈现足够大方、商品图大,另外其根据热门关键词搜索量以标签云的形式展示也是一个创新。

Adobe收购Omniture的意义

adobe收购omniture

今天关注网站分析的同学们都已经了解到,提供网站分析工具和网站优化解决方案的Omniture以18亿美元被传统软件商Adobe收购,以公布的Ominture在9月11号的总市值为12.9亿美元来说,溢价并不高。在传统软件日益Web化的今天,Adobe无疑捡了个大便宜。按照Adobe的说法,这条新闻的最大的价值就在上面的图上。

Adobe自身作为传统软件制作商,在数字内容建设、信息发布以及用户参与度上在业内独树一帜,我们日常上网(photoshop)、工作(pdf)、娱乐(flash)如现在火热的在线视频等无不都基于其产品基础之上,其在设计师、开发者、内容发布商等角色的影响不言而喻。Adobe收购Omniture的原因,一是软件日益web化的大趋势,最近推出的photoshop.com在线设计也证明了其战略转移;二就是图中绿色部分所展示的,Adobe需要Omniture那样的一个对网站及用户行为的精确分析和优化工具,并基于此来反馈、优化Adobe内容制作、发布以及更加重要的用户参与度上。现实来讲,Omniture的加盟不仅可以立马给Adobe带来快速增长的互联网广告、电子商务、数字媒体等市场,而且使得Adobe更加多元化,扩张更多的企业级客户。

反观Omniture,其不同于Google Analystics那样采用免费策略,为其赢得了相对于GA水平的高端、大型企业级客户,在功能与技术上很牛叉。其所以被收购的原因据披露的外部材料来看较之年收入上不及Adobe的十分之一,不过话说过来,05年Google收购urchin只花了3kw美金,Omniture这桩联姻在网络分析领域还是挺幸运的。

Adobe收购Ominture之后如何发展也是一个令人感兴趣的问题,Adobe官方说法是两家公司在交易结束前还是各自独立运营,在交易圆满完成之后会有相应产品整合,也期望这对AO组合在磨合过程中推出更好的产品和服务。

Google分析学习笔记3:说说 GA 的缺点

在最近的工作学习中发现  Goolge Analystics (以下简称 GA )是个绝佳的网站分析工具,在前面的两篇文章也对其应用也有提及,今天就说一下GA的缺点。

GA 不是一款实时统计工具

GA 作为一款基于代码嵌入分析工具,利用Cookies和JS技术来记录服务端与客户端的“会话”机制来保证流量数据的正常更新,但很遗憾的是这个数据更新周期稍微长一点。根据 GA 的官方对“访问为半个小时处理一次”的定义,以及个人实际应用心得,数据更新周期大约在1小时到2小时之内。这个周期相对于同类代码嵌入分析工具的51啦和维度统计来说是太长了。更别说没有在线人数实时统计功能( GA 的 API 扩展应用是否有这类功能目前还不知晓

GA 统计代码段不能随意修改

这次在项目改版过程中发现技术人员在  GA 统计代码段中增加一句和  GA 统计无关的代码,而导致  GA 统计效果和改版前产生天壤之别。虽然之前也有 Owen同学发表的豆瓣GA统计 ,利用GA开放的API,根据项目实际需求修改  GA  统计代码定制统计报告,让人了解 GA 的灵活。但这种在 GA 统计代码中添加无关代码的举措确实值得商榷!后来的事实也证明,去掉无关代码后,GA 统计效果恢复正常,:)

GA 统计的中英文切换问题

由于个人平时习惯在英文环境下面查看  GA  统计效果,但在实际工作过程要和非技术人员沟通(领导、客户、运营人员等角色),因此需要切换到中文环境,GA 在这方面的导航做的不够细致。事实情况是当我从GA中文版首页进去后发现还是GA英文版,虽然链接中hl=cn 。目前我还没有发现一个好的方法切换中英文环境,大家多多指教~(目前的解决方法是先退出,切换到中文 GA ,然后在进去,不知还有没有其他更便捷的方法?)

今天又想到一个方法是输入下面网址:https://www.google.com/analytics/settings/?hl=zh-CN 即可立马切换到GA 中文版,也就是将上文中 hl=cn 改为 hl=zh-CN ,想想这也是 GA 的bug吧,传递参数值出错,而让用户抓不着头脑了,:)
——-2009年9月16日更新

GA 对 flash 点击来源统计的混淆

一般传统企业做广告时会在门户、社区首页发布 flash 格式的广告位,如何对这部分的点击来源做统计,一方面由广告代理商运用监测工具统计;另一方面企业有统计通过flash广告来到点击目标页面(landing page )的访问量.可惜的是 GA 在 流量来源 的报告中,将这部分的流量直接归入到 直接流量 ,对后续统计分析带来干扰。虽然 GA 开放 API ,可以通过调用_trackPageview 函数来实现,但其统计易用性大打折扣。下面是利用 GA 监测 flash 的一些心得体会。

1 )Google Analytics应该改进针对Flash页面的Tracking机制

2)Trace flash using Google analytics

——-2010年5月18日更新


有兴趣就读阿石日志站内其他GA相关的

当前页: 1 总页数: 212