汕头列举网 > 商务服务 > 网站建设/推广 > 电商搜索引擎的架构设计和性能优化
汕头
[切换城市]

电商搜索引擎的架构设计和性能优化

更新时间:2015年11月06日 16:48:01 浏览次数:52次
区域: 汕头 > 龙湖
类别:网站推广
地址:汕头市龙湖区金砂东路116号汕融大厦西梯18楼 永图
联系人:永图
电话: 归属: 广东韶关 联系时,请说明在“列举网”看到的!
Q Q在线咨询 发私信留言
列举网提醒您:为保障您的权益,请不要提前支付任何费用!
汕头龙湖网站建设/推广 电商搜索引擎的架构设计和性能优化 最新消息 2015年11月6日讯:(ID-3921897) 链接http://st.lieju.com/wangzhanjianshe_tuiguang/3921897.htm     电商搜索引擎的特点

众所周知,标准的搜索引擎主要分成三个大的部分,第一步是爬虫系统,第二步是数据分析,第三步才是检索结果。

首先,电商的搜索引擎并没有爬虫系统,因为所有的数据都是结构化的,一般都是微软的数据库或者 Oracle 的数据库,所以不用像百度一样用「爬虫」去不断去别的网站找内容,当然,电商其实也有自己的「爬虫」系统,一般都是抓取友商的价格,再对自己进行调整。

第二点,就是电商搜索引擎的过滤功能其实比搜索功能要常用。甚至大于搜索本身。什么是过滤功能?一般我们网站买东西的时候,搜了一个关健词,比如尿不湿,然后所有相关品牌或者其他分类的选择就会呈现在我们面前。对百度而言,搜什么词就是什么词,如果是新闻的话,可能在时间上会有一个过滤的选项。

第三点,电商搜索引擎支持各种维度的排序,包括支持好评、销量、评论、价格等属性的排序。而且对数据的实时性的要求非常高。对一般的搜索引擎,只有非常重要的网站,比如一些重量级的门户网站,百度的收录是非常快的,但是对那些流量很小的网站,可能一个月才会爬一次。电商搜索对数据的实时性要求主要体现在价格和库存两个方面。

电商搜索引擎另一个特点就是不能丢品,比如我们在淘宝、天猫开了个店铺,然后好不容易搞了一次活动,但是却搜不到了,这是无法忍受的。除此之外,电商搜索引擎与推荐系统和广告系统是相互融合的,因为搜素引擎对流量的贡献是最大的,所以大家都希望把广告系统能跟其融合。当然,还有一点非常重要,就是要保证绝对的高可用,而且不能宕机。

电商搜索引擎的架构

因为电商搜索引跟一般的搜索引擎区别很大,所以在架构的设计上也独具特色。

首先,搜索引擎的实现方式有很多种,有谷歌、百度、搜狗这种非常大的公司,也有京东、淘宝、当当这样的电商搜索引擎,很多中小型的电商可能更喜欢用一个开源的搜索引擎。所以总的来说,主要包括以下这几种方式:

电商搜索引擎 搜索引擎优化 电商网站优化 性能优化 网站结构优化

第一种是「Lucene+自己封装」,只用来做检索,然后封装,后面所有的 ES,这两个是完整的解决方案,而且包括索引所有的东西,只需要部署好业务逻辑,然后查找结果就可以了。

第二种就是 Solr,这是一个高性能,采用 Java5 开发,基于 Lucene 的全文搜索服务器。同时对其进行了扩展,提供了比 Lucene 更为丰富的查询语言,同时实现了可配置、可扩展并对查询性能进行了优化,并且提供了一个完善的功能管理界面,是一款非常优秀的全文搜索引擎。

第三种是 ElasticSearch,这是一个基于 Lucene 的搜索服务器。它提供了一个分布式多用户能力的全文搜索引擎,基于 RESTful web 接口。Elasticsearch 是用 Java 开发的,并作为 Apache 许可条款下的开放源码发布,目前使用的也非常多。

这里提一下,当当的搜索引擎是自己实现的,。现在,新兴的互联网公司大部分都是使用第一种或者第二种,数据量比较大的一般采用第三种。

电商搜索引擎标配模块

电商搜索引擎 搜索引擎优化 电商网站优化 性能优化 网站结构优化

接下来我想讲一下,如果我们自己做一个搜索引擎的话需要实现哪些功能(上图是电商搜索引擎的标准模块),其实不止是电商搜索引擎,除了通搜的搜索引擎,其他的搜索引擎也是使用这样的标配。

电商搜索引擎 搜索引擎优化 电商网站优化 性能优化 网站结构优化

对检索模块而言,首先是对用户的意图进行分析,根据用户的搜索词来进行纯算法的实现。比如用户的搜索词是「黑包包」,其实用户的本意就是买一个黑色的包,但是这个「包」可以跟别的词组合在一起,甚至在搜索结果中会出现「包子」。所以,这就需要 query 分析系统来做,告诉检索系统,你需要主要在服装鞋帽中的分类去找,而不是生鲜食品类。

设计到技术层面,当当网使用的是 C++。如果构建一个性能好的系统,一些老一点的公司,大家都是在使用 C++ 或者是 C 语言。不止是当当网,其实很多公司都是使用的 C 或者 C++ 实现的搜索引擎。

数据更新模块

电商搜索引擎 搜索引擎优化 电商网站优化 性能优化 网站结构优化

第二个模块就是数据更新模块,该模块负责生成索引。而数据中心模块主要做的事情,就是将原始的结构化数据,变成一个可供检索系统使用的搜索数据库。当然,数据更新模块和检索模块是分开还是合并呢?其实从本质上讲,都是一堆代码,完全可以写在一个进程里。当然,也可以分开,通过网络往外输入,各自都有道理。第一种是简单粗暴型的,如果是普通电商,像生鲜电商,数据量不大,实时性、季节性很强,就可以把两个系统用一个进程来完成。但是如果到了百万、千万甚至上亿级别的话,就不可能部在一台机器上了。

关键词:深圳网络公司
公司名称:深圳市永图时代网络技术有限公司汕头分公司
公司网站:http://www.szyongtu.com
公司地址:汕头市龙湖区金砂东路116号汕融大厦西梯18楼 永图

公司简介:深圳市永图时代网络技术有限公司,由知名互联网营销专家刘伟斌先生创办于2002年,是国内知名移动O2O电商整合策划机构。致力于移动O2O电商整体解决方案的策划、开发、运营培训和推广。

    目前重点提供帮助企业实现线上和线下(O2O)互通,社会化客户关系管理(SCRM)、移动电商(Vshop),轻应用(lightapp)的开发与服务。

    经历12年沉淀,公司在搜索营销、微信营销、微博营销和O2O策划等领域,也积累了明显优势,处于国内领先水平。
电商搜索引擎的架构设计和性能优化 2015年11月06日 16:48:01更新
本文链接地址:http://st.lieju.com/wangzhanjianshe_tuiguang/3921897.htm
联系我时,请说明是在列举网看到的,谢谢!
汕头网站建设/推广信息推荐

展开更多

注册时间:2015-03-13
---------- 认证信息 ----------

查看用户主页
职业培训 11325302 金融/担保贷款 11325301 物品回收 11325300 物品回收 11325299 物品回收 11325298 物品回收 11325297 物品回收 11325296 物品回收 11325295 物品回收 11325294 物品回收 11325293 物品回收 11325292 物品回收 11325291 物品回收 11325290 物品回收 11325289 物品回收 11325288 物品回收 11325287 物品回收 11325286 物品回收 11325285 物品回收 11325284 物品回收 11325283 物品回收 11325282 物品回收 11325281 物品回收 11325280 物品回收 11325279 物品回收 11325278 物品回收 11325277 物品回收 11325276 物品回收 11325275 物品回收 11325274 物品回收 11325273 物品回收 11325272 物品回收 11325271 物品回收 11325270 物品回收 11325269 物品回收 11325268 物品回收 11325266 物品回收 11325265 物品回收 11325264 金融/担保贷款 11325263 物品回收 11325262 物品回收 11325261 物品回收 11325260 物品回收 11325259 物品回收 11325258 物品回收 11325257 物品回收 11325256 物品回收 11325255 物品回收 11325254 物品回收 11325253 物品回收 11325252 物品回收 11325251 物品回收 11325250 物品回收 11325249 物品回收 11325248 物品回收 11325247 物品回收 11325246 物品回收 11325245 物品回收 11325244 物品回收 11325243 物品回收 11325242 物品回收 11325241 物品回收 11325240 物品回收 11325239 物品回收 11325238 物品回收 11325237 物品回收 11325236 物品回收 11325235 物品回收 11325234 物品回收 11325233 物品回收 11325232 物品回收 11325231 物品回收 11325230 物品回收 11325229 物品回收 11325228 物品回收 11325227 物品回收 11325226 物品回收 11325225 物品回收 11325224 物品回收 11325223 物品回收 11325222 物品回收 11325221 物品回收 11325220 物品回收 11325219 物品回收 11325218 物品回收 11325217 物品回收 11325216 物品回收 11325215 物品回收 11325214 物品回收 11325213 物品回收 11325212 物品回收 11325211 物品回收 11325210 物品回收 11325209 物品回收 11325208 物品回收 11325207 物品回收 11325206 物品回收 11325205 物品回收 11325204 物品回收 11325203 物品回收 11325202 销售/业务 11317926 金融/担保贷款 11317887 化妆品/保健品 11317720 物品回收 11317601 金融/担保贷款 11317369 写真/摄影 11316794 化妆品/保健品 11316538 销售/业务 11315763 销售/业务 11315748 金融/担保贷款 11315060 金融/担保贷款 11315030 化妆品/保健品 11314228 金融/保险 11313707 金融/保险 11313615 购物券 11312884 写真/摄影 11312715 金融/担保贷款 11312277 物品回收 11311459 化妆品/保健品 11311067 销售/业务 11310098 销售/业务 11310056 其他教育培训 11308178 其他教育培训 11308000 金融/担保贷款 11307670 玩具/游戏机 11306168 装修/装饰 11305619 展会服务 11304815 其他教育培训 11304578 金融/担保贷款 11303227 玩具/游戏机 11303103 玩具/游戏机 11303099 玩具/游戏机 11303096 玩具/游戏机 11303093 物品回收 11301472 写真/摄影 11301363 物品回收 11301282 写真/摄影 11300918 玩具/游戏机 11299571 销售/业务 11299215 化妆品/保健品 11297271 金融/担保贷款 11297078 金融/担保贷款 11295463 金融/担保贷款 11293671 玩具/游戏机 11293556 玩具/游戏机 11292904 考研/公务员 11292515 销售/业务 11290603 化妆品/保健品 11288379 金融/担保贷款 11287204 其他教育培训 11287095 物品回收 11286505 金融/担保贷款 11286030 其他教育培训 11285828 金融/担保贷款 11284909 物品回收 11284443 物品回收 11284441 写真/摄影 11284343 其他商务服务 11282938 玩具/游戏机 11282694 销售/业务 11280669 销售/业务 11280624 其他教育培训 11280209 化妆品/保健品 11278722 金融/担保贷款 11277906 金融/担保贷款 11276812 物品回收 11273338 金融/担保贷款 11272973 销售/业务 11270455 金融/保险 11270302 其他教育培训 11269738 化妆品/保健品 11268233 金融/担保贷款 11266285 物品回收 11265958 物品回收 11264073 玩具/游戏机 11261882 金融/保险 11260169 销售/业务 11259824 金融/担保贷款 11256994 金融/担保贷款 11256861 物品回收 11254263 快递 11253977 物品回收 11253879 物品回收 11253877 写真/摄影 11253680 化妆品/保健品 11253536 物品回收 11253066 物品回收 11251265 手机 11249934 写真/摄影 11249624 艺术/工艺/收藏品 11248730 化妆品/保健品 11243978 玩具/游戏机 11243744 物品回收 11241146 物品回收 11241144 其他教育培训 11239829 销售/业务 11237538 金融/保险 11237524 化妆品/保健品 11236257 物品回收 11233990 he***6 遵***校 金***霸 Q Q***0 安***收 鑫***收 宏***收 官***务 an*** Q Q***8 cd***6 he***g 范***傅 zh***8 13***3 xx*** hu***8 fc***2 ti***8 鸿***收 t-***9 wa***8 大***收 cs***2 鸿***收 ai***a yi***1 云***师 玲***训 售***话 wj***0 芳***0 72***5 zh***i ti***8 sd*** TZ***1 cm*** bj***c mx***2 jj***l 小*** 13***4 sl***3 t-***6 莫***机 yu***6 yu***2 sl***1 yu***6 yu***5 微***师 yu***0 ba***Q sl***x t-***3 YQ***g yu***b 云***师 福***财 Ly***8 xz***m yu***6 yu***6 85***6 yu***8 zd*** 服***户 yu***u wa***2 凌***q 88***n wa***a 隆***师 ys***x xg***x wa***8 wa***8 13***1 霸***痴 zs***8 乐*** xi***1 li***7 t_***9 wa***4 sh***9 锘***妈 百***依 鑫***4 文***8 ZL***道 sy***8 管***装 sy***5 sy***z 天***宝 天***8 bl***8 ab***n
此操作需要先登录 关闭

用户名   
密码   
                  Q Q账号