新浪微博:史上最大的Redis集群
Tape is Dead,Disk is Tape,F(xiàn)lash is Disk,RAM Locality is King. — Jim Gray
Redis不是比較成熟的memcache或者M(jìn)ysql的替代品,是對(duì)于大型互聯(lián)網(wǎng)類(lèi)應(yīng)用在架構(gòu)上很好的補(bǔ)充?,F(xiàn)在有越來(lái)越多的應(yīng)用也在紛紛基于Redis做架構(gòu)的改造。首先簡(jiǎn)單公布一下Redis平臺(tái)實(shí)際情況:
2200+億 commands/day 5000億Read/day 500億Write/day
18TB+ Memory
500+ Servers in 6 IDC 2000+instances
應(yīng)該是國(guó)內(nèi)外比較大的Redis使用平臺(tái),今天主要從應(yīng)用角度談?wù)凴edis服務(wù)平臺(tái)。
Redis使用場(chǎng)景
1.Counting(計(jì)數(shù))
計(jì)數(shù)的應(yīng)用在另外一篇文章里較詳細(xì)的描述,計(jì)數(shù)場(chǎng)景的優(yōu)化 http://www.xdata.me/?p=262這里就不多加描述了。
可以預(yù)見(jiàn)的是,有很多同學(xué)認(rèn)為把計(jì)數(shù)全部存在內(nèi)存中成本非常高,我在這里用個(gè)圖表來(lái)表達(dá)下我的觀點(diǎn):
很多情況大家都會(huì)設(shè)想純使用內(nèi)存的方案會(huì)很有很高成本,但實(shí)際情況往往會(huì)有一些不一樣:
COST,對(duì)于有一定吞吐需求的應(yīng)用來(lái)說(shuō),肯定會(huì)單獨(dú)申請(qǐng)DB、Cache資源,很多擔(dān)心DB寫(xiě)入性能的同學(xué)還會(huì)主動(dòng)將DB更新記入異步隊(duì)列,而這三塊的資源的利用率一般都不會(huì)太高。資源算下來(lái),你驚異的發(fā)現(xiàn):反而純內(nèi)存的方案會(huì)更精簡(jiǎn)!
KISS原則,這對(duì)于開(kāi)發(fā)是非常友好的,我只需要建立一套連接池,不用擔(dān)心數(shù)據(jù)一致性的維護(hù),不用維護(hù)異步隊(duì)列。
Cache穿透風(fēng)險(xiǎn),如果后端使用DB,肯定不會(huì)提供很高的吞吐能力,cache宕機(jī)如果沒(méi)有妥善處理,那就悲劇了。
大多數(shù)的起始存儲(chǔ)需求,容量較小。
2.Reverse cache(反向cache)
面對(duì)微博常常出現(xiàn)的熱點(diǎn),如最近出現(xiàn)了較為火爆的短鏈,短時(shí)間有數(shù)以萬(wàn)計(jì)的人點(diǎn)擊、跳轉(zhuǎn),而這里會(huì)常常涌現(xiàn)一些需求,比如我們向快速在跳轉(zhuǎn)時(shí)判定用戶(hù)等級(jí),是否有一些賬號(hào)綁定,性別愛(ài)好什么的,已給其展示不同的內(nèi)容或者信息。
普通采用memcache+Mysql的解決方案,當(dāng)調(diào)用id合法的情況下,可支撐較大的吞吐。但當(dāng)調(diào)用id不可控,有較多垃圾用戶(hù)調(diào)用時(shí),由于memcache未有命中,會(huì)大量的穿透至Mysql服務(wù)器,瞬間造成連接數(shù)瘋長(zhǎng),整體吞吐量降低,響應(yīng)時(shí)間變慢。
這里我們可以用redis記錄全量的用戶(hù)判定信息,如string key:uid int:type,做一次反向的cache,當(dāng)用戶(hù)在redis快速獲取自己等級(jí)等信息后,再去Mc+Mysql層去獲取全量信息。如圖:
當(dāng)然這也不是最優(yōu)化的場(chǎng)景,如用Redis做bloomfilter,可能更加省用內(nèi)存。
3.Top 10 list
產(chǎn)品運(yùn)營(yíng)總會(huì)讓你展示最近、最熱、點(diǎn)擊率最高、活躍度最高等等條件的top list。很多更新較頻繁的列表如果使用MC+MySQL維護(hù)的話(huà)緩存失效的可能性會(huì)比較大,鑒于占用內(nèi)存較小的情況,使用Redis做存儲(chǔ)也是相當(dāng)不錯(cuò)的。
4.Last Index
用戶(hù)最近訪問(wèn)記錄也是redis list的很好應(yīng)用場(chǎng)景,lpush lpop自動(dòng)過(guò)期老的登陸記錄,對(duì)于開(kāi)發(fā)來(lái)說(shuō)還是非常友好的。
5.Relation List/Message Queue
這里把兩個(gè)功能放在最后,因?yàn)檫@兩個(gè)功能在現(xiàn)實(shí)問(wèn)題當(dāng)中遇到了一些困難,但在一定階段也確實(shí)解決了我們很多的問(wèn)題,故在這里只做說(shuō)明。
Message Queue就是通過(guò)list的lpop及l(fā)push接口進(jìn)行隊(duì)列的寫(xiě)入和消費(fèi),由于本身性能較好也能解決大部分問(wèn)題。
6.Fast transaction with Lua
Redis 的Lua的功能擴(kuò)展實(shí)際給Redis帶來(lái)了更多的應(yīng)用場(chǎng)景,你可以編寫(xiě)若干command組合作為一個(gè)小型的非阻塞事務(wù)或者更新邏輯,如:在收到message推送時(shí),同時(shí)1.給自己的增加一個(gè)未讀的對(duì)話(huà) 2.給自己的私信增加一個(gè)未讀消息 3.最后給發(fā)送人回執(zhí)一個(gè)完成推送消息,這一層邏輯完全可以在Redis Server端實(shí)現(xiàn)。
但是,需要注意的是Redis會(huì)將lua script的全部?jī)?nèi)容記錄在aof和傳送給slave,這也將是對(duì)磁盤(pán),網(wǎng)卡一個(gè)不小的開(kāi)銷(xiāo)。
7.Instead of Memcache
很多測(cè)試和應(yīng)用均已證明,
在性能方面Redis并沒(méi)有落后memcache多少,而單線程的模型給Redis反而帶來(lái)了很強(qiáng)的擴(kuò)展性。
在很多場(chǎng)景下,Redis對(duì)同一份數(shù)據(jù)的內(nèi)存開(kāi)銷(xiāo)是小于memcache的slab分配的。
Redis提供的數(shù)據(jù)同步功能,其實(shí)是對(duì)cache的一個(gè)強(qiáng)有力功能擴(kuò)展。
Redis使用的重要點(diǎn)
1.rdb/aof Backup!
我們線上的Redis 95%以上是承擔(dān)后端存儲(chǔ)功能的,我們不僅用作cache,而更為一種k-v存儲(chǔ),他完全替代了后端的存儲(chǔ)服務(wù)(MySQL),故其數(shù)據(jù)是非常重要的,如果出現(xiàn)數(shù)據(jù)污染和丟失,誤操作等情況,將是難以恢復(fù)的。所以備份是非常必要的!為此,我們有共享的hdfs資源作為我們的備份池,希望能隨時(shí)可以還原業(yè)務(wù)所需數(shù)據(jù)。
2.Small item Small instance!
由于Redis單線程(嚴(yán)格意義上不是單線程,但認(rèn)為對(duì)request的處理是單線程的)的模型,大的數(shù)據(jù)結(jié)構(gòu)list,sorted set,hash set的批量處理就意味著其他請(qǐng)求的等待,故使用Redis的復(fù)雜數(shù)據(jù)結(jié)構(gòu)一定要控制其單key-struct的大小。
另外,Redis單實(shí)例的內(nèi)存容量也應(yīng)該有嚴(yán)格的限制。單實(shí)例內(nèi)存容量較大后,直接帶來(lái)的問(wèn)題就是故障恢復(fù)或者Rebuild從庫(kù)的時(shí)候時(shí)間較長(zhǎng),而更糟糕的是,Redis rewrite aof和save rdb時(shí),將會(huì)帶來(lái)非常大且長(zhǎng)的系統(tǒng)壓力,并占用額外內(nèi)存,很可能導(dǎo)致系統(tǒng)內(nèi)存不足等嚴(yán)重影響性能的線上故障。我們線上96G/128G內(nèi)存服務(wù)器不建議單實(shí)例容量大于20/30G。
3.Been Available!
業(yè)界資料和使用比較多的是Redis sentinel(哨兵)
http://www.huangz.me/en/latest/storage/redis_code_analysis/sentinel.html
http://qiita.com/wellflat/items/8935016fdee25d4866d9
2000行C實(shí)現(xiàn)了服務(wù)器狀態(tài)檢測(cè),自動(dòng)故障轉(zhuǎn)移等功能。
但由于自身實(shí)際架構(gòu)往往會(huì)復(fù)雜,或者考慮的角度比較多,為此 @許琦eryk和我一同做了hypnos項(xiàng)目。
hypnos是神話(huà)中的睡神,字面意思也是希望我們工程師無(wú)需在休息時(shí)間處理任何故障。:-)
其工作原理示意如下:
Talk is cheap, show me your code! 稍后將單獨(dú)寫(xiě)篇博客細(xì)致講下Hypnos的實(shí)現(xiàn)。
4.In Memory or not?
發(fā)現(xiàn)一種情況,開(kāi)發(fā)在溝通后端資源設(shè)計(jì)的時(shí)候,常常因?yàn)榱?xí)慣使用和錯(cuò)誤了解產(chǎn)品定位等原因,而忽視了對(duì)真實(shí)使用用戶(hù)的評(píng)估。也許這是一份歷史數(shù)據(jù),只有最近一天的數(shù)據(jù)才有人進(jìn)行訪問(wèn),而把歷史數(shù)據(jù)的容量和最近一天請(qǐng)求量都拋給內(nèi)存類(lèi)的存儲(chǔ)現(xiàn)實(shí)是非常不合理的。
所以當(dāng)你在究竟使用什么樣的數(shù)據(jù)結(jié)構(gòu)存儲(chǔ)的時(shí)候,請(qǐng)務(wù)必先進(jìn)行成本衡量,有多少數(shù)據(jù)是需要存儲(chǔ)在內(nèi)存中的?有多少數(shù)據(jù)是對(duì)用戶(hù)真正有意義的。因?yàn)檫@其實(shí)對(duì)后端資源的設(shè)計(jì)是至關(guān)重要的,1G的數(shù)據(jù)容量和1T的數(shù)據(jù)容量對(duì)于設(shè)計(jì)思路是完全不一樣的
Plans in future?
1.slave sync改造
全部改造線上master-slave數(shù)據(jù)同步機(jī)制,這一點(diǎn)我們借鑒了MySQL Replication的思路,使用rdb+aof+pos作為數(shù)據(jù)同步的依據(jù),這里簡(jiǎn)要說(shuō)明為什么官方提供的psync沒(méi)有很好的滿(mǎn)足我們的需求:
假設(shè)A有兩個(gè)從庫(kù)B及C,及 A `— BC,這時(shí)我們發(fā)現(xiàn)master A服務(wù)器有宕機(jī)隱患需要重啟或者A節(jié)點(diǎn)直接宕機(jī),需要切換B為新的主庫(kù),如果A、B、C不共享rdb及aof信息,C在作為B的從庫(kù)時(shí),仍會(huì)清除自身數(shù)據(jù),因?yàn)镃節(jié)點(diǎn)只記錄了和A節(jié)點(diǎn)的同步狀況。
故我們需要有一種將A`–BC 結(jié)構(gòu)切換切換為A`–B`–C結(jié)構(gòu)的同步機(jī)制,psync雖然支持?jǐn)帱c(diǎn)續(xù)傳,但仍無(wú)法支持master故障的平滑切換。
實(shí)際上我們已經(jīng)在我們定制的Redis計(jì)數(shù)服務(wù)上使用了如上功能的同步,效果非常好,解決了運(yùn)維負(fù)擔(dān),但仍需向所有Redis服務(wù)推廣,如果可能我們也會(huì)向官方Redis提出相關(guān)sync slave的改進(jìn)。
2.更適合redis的name-system Or proxy
細(xì)心的同學(xué)發(fā)現(xiàn)我們除了使用DNS作為命名系統(tǒng),也在zookeeper中有一份記錄,為什么不讓用戶(hù)直接訪問(wèn)一個(gè)系統(tǒng),zk或者DNS選擇其一呢?
其實(shí)還是很簡(jiǎn)單,命名系統(tǒng)是個(gè)非常重要的組件,而dns是一套比較完善的命名系統(tǒng),我們?yōu)榇俗隽撕芏喔倪M(jìn)和試錯(cuò),zk的實(shí)現(xiàn)還是相對(duì)復(fù)雜,我們還沒(méi)有較強(qiáng)的把控粒度。我們也在思考用什么做命名系統(tǒng)更符合我們需求。
3.后端數(shù)據(jù)存儲(chǔ)
大內(nèi)存的使用肯定是一個(gè)重要的成本優(yōu)化方向,flash盤(pán)及分布式的存儲(chǔ)也在我們未來(lái)計(jì)劃之中。
二、Pinterest:Reids維護(hù)上百億的相關(guān)性
Pinterest已經(jīng)成為硅谷最瘋故事之一,在2012年,他們基于PC的業(yè)務(wù)增加1047%,移動(dòng)端采用增加1698%, 該年3月其獨(dú)立訪問(wèn)數(shù)量更飆升至533億。在Pinterest,人們關(guān)注的事物以百億記——每個(gè)用戶(hù)界面都會(huì)查詢(xún)某個(gè)board或者是用戶(hù)是否關(guān)注的行為促成了異常復(fù)雜的工程問(wèn)題。這也讓Redis獲得了用武之地。經(jīng)過(guò)數(shù)年的發(fā)展,Pinterest已經(jīng)成為媒體、社交等多個(gè)領(lǐng)域的佼佼者,其輝煌戰(zhàn)績(jī)?nèi)缦拢?/p>
獲得的推薦流量高于Google+、YouTube及LinkedIn三者的總和
與Facebook及Twitter一起成為最流行的三大社交網(wǎng)絡(luò)
參考Pinterest進(jìn)行購(gòu)買(mǎi)的用戶(hù)比其它網(wǎng)站更高
如您所想,基于其獨(dú)立訪問(wèn)數(shù),Pinterest的高規(guī)模促成了一個(gè)非常高的IT基礎(chǔ)設(shè)施需求。
1.通過(guò)緩存來(lái)優(yōu)化用戶(hù)體驗(yàn)
近日,Pinterest工程經(jīng)理Abhi Khune對(duì)其公司的用戶(hù)體驗(yàn)需求及Redis的使用經(jīng)驗(yàn) 進(jìn)行了分享。即使是滋生的應(yīng)用程序打造者,在分析網(wǎng)站的細(xì)節(jié)之前也不會(huì)理解這些特性,因此先大致的理解一下使用場(chǎng)景:首先,為每個(gè)粉絲進(jìn)行提及到的預(yù)檢查;其次,UI將準(zhǔn)確的顯示用戶(hù)的粉絲及關(guān)注列表分頁(yè)。高效的執(zhí)行這些操作,每次點(diǎn)擊都需要非常高的性能架構(gòu)。
不能免俗,Pinterest的軟件工程師及架構(gòu)師已經(jīng)使用了MySQL及memcache,但是緩存解決方案仍然達(dá)到了他們的瓶頸;因此為了擁有更好的用戶(hù)體驗(yàn),緩存必須被擴(kuò)充。而在實(shí)際操作過(guò)程中,工程團(tuán)隊(duì)已然發(fā)現(xiàn)緩存只有當(dāng)用戶(hù)sub-graph已經(jīng)在緩存中時(shí)才會(huì)起到作用。因此。任何使用這個(gè)系統(tǒng)的人都需要被緩存,這就導(dǎo)致了整個(gè)圖的緩存。同時(shí),最常見(jiàn)的查詢(xún)“用戶(hù)A是否關(guān)注了用戶(hù)B”的答案經(jīng)常是否定的,然而這卻被作為了緩存丟失,從而促成一個(gè)數(shù)據(jù)庫(kù)查詢(xún),因此他們需要一個(gè)新的方法來(lái)擴(kuò)展緩存。最終,他們團(tuán)隊(duì)決定使用Redis來(lái)存儲(chǔ)整個(gè)圖,用以服務(wù)眾多的列表。
2.使用Redis存儲(chǔ)大量的Pinterest列表
Pinterest使用了Redis作為解決方案,并將性能推至了內(nèi)存數(shù)據(jù)庫(kù)等級(jí),為用戶(hù)保存多種類(lèi)型列表:
關(guān)注者列表
你所關(guān)注的board列表
粉絲列表
關(guān)注你board的用戶(hù)列表
某個(gè)用戶(hù)中board中你沒(méi)有關(guān)注的列表
每個(gè)board的關(guān)注者及非關(guān)注者
Redis為其7000萬(wàn)用戶(hù)存儲(chǔ)了以上的所有列表,本質(zhì)上講可以說(shuō)是儲(chǔ)存了所有粉絲圖,通過(guò)用戶(hù)ID分片。鑒于你可以通過(guò)類(lèi)型來(lái)查看以上列表的數(shù)據(jù),分析概要信息被用看起來(lái)更像事務(wù)的系統(tǒng)儲(chǔ)存及訪問(wèn)。Pinterest當(dāng)下的用戶(hù)like被限制為10萬(wàn),初略進(jìn)行統(tǒng)計(jì):如果每個(gè)用戶(hù)關(guān)注25個(gè)board,將會(huì)在用戶(hù)及board間產(chǎn)生17.5億的關(guān)系。同時(shí)更加重要的是,這些關(guān)系隨著系統(tǒng)的使用每天都會(huì)增加。
3.Pinterest的Reids架構(gòu)及運(yùn)營(yíng)
通過(guò)Pinterest的一個(gè)創(chuàng)始人了解到,Pinterest開(kāi)始使用Python及訂制的Django編寫(xiě)應(yīng)用程序,并一直持續(xù)到其擁有1800萬(wàn)用戶(hù)級(jí)日410TB用戶(hù)數(shù)據(jù)的時(shí)候。雖然使用了多個(gè)存儲(chǔ)對(duì)數(shù)據(jù)進(jìn)行儲(chǔ)存,工程師根據(jù)用戶(hù)id使用了8192個(gè)虛擬分片,每個(gè)分片都運(yùn)行在一個(gè)Redis DB之上,同時(shí)1個(gè)Redis實(shí)例將運(yùn)行多個(gè)Redis DB。為了對(duì)CPU核心的充分使用,同一臺(tái)主機(jī)上同時(shí)使用多線程和單線程Redis實(shí)例。
鑒于整個(gè)數(shù)據(jù)集運(yùn)行在內(nèi)存當(dāng)中,Redis在Amazon EBS上對(duì)每秒傳輸進(jìn)來(lái)的寫(xiě)入都會(huì)進(jìn)行持久化。擴(kuò)展主要通過(guò)兩個(gè)方面進(jìn)行:第一,保持50%的利用率,通過(guò)主從轉(zhuǎn)換,機(jī)器上運(yùn)行的Redis實(shí)例一半會(huì)轉(zhuǎn)譯到一個(gè)新機(jī)器上;第二,擴(kuò)展節(jié)點(diǎn)和分片。整個(gè)Redis集群都會(huì)使用一個(gè)主從配置,從部分將被當(dāng)做一個(gè)熱備份。一旦主節(jié)點(diǎn)失敗,從部分會(huì)立刻完成主的轉(zhuǎn)換,同時(shí)一個(gè)新的從部分將會(huì)被添加,ZooKeeper將完成整個(gè)過(guò)程。同時(shí)他們每個(gè)小時(shí)都會(huì)在Amazon S3上運(yùn)行BGsave做更持久的儲(chǔ)存——這項(xiàng)Reids操作會(huì)在后端進(jìn)行,之后Pinterest會(huì)使用這些數(shù)據(jù)做MapReduce和分析作業(yè)。
三、Viacom:Redis在系統(tǒng)中的用例盤(pán)點(diǎn)
Viacom是全球最大的傳媒集體之一,同時(shí)也遭遇了當(dāng)下最大的數(shù)據(jù)難題之一:如何處理日益劇增的動(dòng)態(tài)視頻內(nèi)容。
著眼這一挑戰(zhàn)的上升趨勢(shì),我們會(huì)發(fā)現(xiàn):2010年世界上所有數(shù)據(jù)體積達(dá)到ZB級(jí),而單單2012這一年,互聯(lián)網(wǎng)產(chǎn)生的數(shù)據(jù)就增加了2.8個(gè)ZB,其中大部分的數(shù)據(jù)都是非結(jié)構(gòu)化的,包括了視頻和圖片。
覆蓋MVN(以前稱(chēng)為MTV Networks、Paramount及BET),Viacom是個(gè)名副其實(shí)的傳媒巨頭,支持眾多人氣站點(diǎn),其中包括The Daily Show、osh.0、South Park Studios、GameTrailers.com等。作為媒體公司,這些網(wǎng)站上的文檔、圖片、視頻短片都在無(wú)時(shí)無(wú)刻的更新。長(zhǎng)話(huà)短說(shuō),下面就進(jìn)入Viacom高級(jí)架構(gòu)師Michael Venezia 分享的Redis實(shí)踐:
1.Viacom的網(wǎng)站架構(gòu)背景
對(duì)于Viacom,橫跨多個(gè)站點(diǎn)傳播內(nèi)容讓必須專(zhuān)注于規(guī)模的需求,同時(shí)為了將內(nèi)容竟可能快的傳播到相應(yīng)用戶(hù),他們還必須聚焦內(nèi)容之間的關(guān)系。然而即使The Daily Show、Nickelodeon、Spike或者是VH1 這些單獨(dú)的網(wǎng)站上,日平均PV都可以達(dá)到千萬(wàn),峰值時(shí)流量更會(huì)達(dá)到平均值的20-30倍。同時(shí)基于對(duì)實(shí)時(shí)的需求,動(dòng)態(tài)的規(guī)模及速度已成為架構(gòu)的基礎(chǔ)之一。
除去動(dòng)態(tài)規(guī)模之外,服務(wù)還必須基于用戶(hù)正在瀏覽的視頻或者是地理位置來(lái)推測(cè)用戶(hù)的喜好。比如說(shuō),某個(gè)頁(yè)面可能會(huì)將一個(gè)獨(dú)立的視頻片段與本地的促銷(xiāo),視頻系列的額外部分,甚至是相關(guān)視頻聯(lián)系起來(lái)。為了能讓用戶(hù)能在網(wǎng)站上停留更長(zhǎng)的時(shí)間,他們建立了一個(gè)能基于詳細(xì)元數(shù)據(jù)自動(dòng)建立頁(yè)面的軟件引擎,這個(gè)引擎可以根據(jù)用戶(hù)當(dāng)下興趣推薦額外的內(nèi)容。鑒于用于興趣的隨時(shí)改變,數(shù)據(jù)的類(lèi)型非常廣泛——類(lèi)似graph-like,實(shí)際上做的是大量的join。
這樣做有利于減少類(lèi)似視頻的大體積文件副本數(shù),比如數(shù)據(jù)存儲(chǔ)中一個(gè)獨(dú)立的記錄是Southpark片段“Cartman gets an Anal Probe”,這個(gè)片段可能也會(huì)出現(xiàn)在德語(yǔ)的網(wǎng)站上。雖然視頻是一樣的,但是英語(yǔ)用戶(hù)搜索的可能就是另一個(gè)不同的詞語(yǔ)。元數(shù)據(jù)的副本轉(zhuǎn)換成搜索結(jié)果,并指向相同的視頻。因此在美國(guó)用戶(hù)搜索真實(shí)標(biāo)題的情況下,德國(guó)瀏覽者可能會(huì)使用轉(zhuǎn)譯的標(biāo)題——德國(guó)網(wǎng)站上的“Cartman und die Analsonde”。
這些元數(shù)據(jù)覆蓋了其它記錄或者是對(duì)象,同時(shí)還可以根據(jù)使用環(huán)境來(lái)改變內(nèi)容,通過(guò)不同的規(guī)則集來(lái)限制不同地理位置或者是設(shè)備請(qǐng)求的內(nèi)容。
2.Viacom的實(shí)現(xiàn)方法
盡管許多機(jī)構(gòu)通過(guò)使用ORM及傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)來(lái)解決這個(gè)問(wèn)題,Viacom卻使用了一個(gè)迥然不同的方法。
本質(zhì)上,他們完全承擔(dān)不了對(duì)數(shù)據(jù)庫(kù)的直接訪問(wèn)。首先,他們處理的大部分都是流數(shù)據(jù),他們偏向于使用Akamai從地理上來(lái)分配內(nèi)容。其次,基于頁(yè)面的復(fù)雜性可能會(huì)取上萬(wàn)個(gè)對(duì)象。取如此多的數(shù)據(jù)顯然會(huì)影響到性能,因此JSON在1個(gè)數(shù)據(jù)服務(wù)中投入了使用。當(dāng)然,這些JSON對(duì)象的緩存將直接影響到網(wǎng)站性能。同時(shí),當(dāng)內(nèi)容或者是內(nèi)容之間的關(guān)系發(fā)生改變時(shí),緩存還需要?jiǎng)討B(tài)的進(jìn)行更新。
Viacom依靠對(duì)象基元和超類(lèi)解決這個(gè)問(wèn)題,繼續(xù)以South Park為例:一個(gè)私有的“episode”類(lèi)包含了所有該片段相關(guān)信息,一個(gè)“super object”將有助于發(fā)現(xiàn)實(shí)際的視頻對(duì)象。超類(lèi)這個(gè)思想確實(shí)非常有益于建設(shè)低延遲頁(yè)面的自動(dòng)建設(shè),這些超類(lèi)可以幫助到基元對(duì)象到緩存的映射及保存。
3.Viacom為什么要使用Redis
每當(dāng)Viacom上傳一個(gè)視頻片段,系統(tǒng)將建立一個(gè)私有的對(duì)象,并于1個(gè)超類(lèi)關(guān)聯(lián)。每一次修改,他們都需要重估私有對(duì)象的每個(gè)改變,并更新所有復(fù)合對(duì)象。同時(shí),系統(tǒng)還需要無(wú)效Akamail中的URL請(qǐng)求。系統(tǒng)現(xiàn)有架構(gòu)的組合及更敏捷的管理方法需求將Viacom推向了Redis。
基于Viacom主要基于PHP,所以這個(gè)解決方案必須支持PHP。他們首先選擇了memcached做對(duì)象存儲(chǔ),但是它并不能很好的支持hashmap;同時(shí)他們還需要一個(gè)更有效的進(jìn)行無(wú)效步驟的重估,即更好的理解內(nèi)容的依賴(lài)性。本質(zhì)上說(shuō),他們需要時(shí)刻跟進(jìn)無(wú)效步驟中的依賴(lài)性改變。因此他們選擇了Redis及Predis的組合來(lái)解決這個(gè)問(wèn)題。
他們團(tuán)隊(duì)使用Redis給southparkstudios.com和thedailyshow.com兩個(gè)網(wǎng)站建設(shè)依賴(lài)性圖,在取得了很大的成功后他們開(kāi)始著眼Redis其它適合場(chǎng)景。
Redis的其它使用場(chǎng)景
顯而易見(jiàn),如果有人使用Redis來(lái)建設(shè)依賴(lài)性圖,那么使用它來(lái)做對(duì)象處理也是說(shuō)得通的。同樣,這也成了架構(gòu)團(tuán)隊(duì)為Redis選擇的第二使用場(chǎng)景。Redis的復(fù)制及持久化特性同時(shí)也征服了Viacom的運(yùn)營(yíng)團(tuán)隊(duì),因此在幾個(gè)開(kāi)發(fā)周期后,Redis成為他們網(wǎng)站的主要數(shù)據(jù)及依賴(lài)性?xún)?chǔ)存。
后兩個(gè)用例則是行為追蹤及瀏覽計(jì)數(shù)的緩沖,改變后的架構(gòu)是Redis每幾分鐘向MySQL中儲(chǔ)存一次,而瀏覽計(jì)數(shù)則通過(guò)Redis進(jìn)行存儲(chǔ)及計(jì)數(shù)。同時(shí)Redis還被用來(lái)做人氣的計(jì)算,一個(gè)基于訪問(wèn)數(shù)及訪問(wèn)時(shí)間的得分系統(tǒng)——如果某個(gè)視頻最近被訪問(wèn)的次數(shù)越多,它的人氣就越高。在如此多內(nèi)容上每隔10-15分鐘做一次計(jì)算絕對(duì)不是類(lèi)似MySQL這樣傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)的強(qiáng)項(xiàng),Viacom使用Redis的理由也非常簡(jiǎn)單——在1個(gè)存儲(chǔ)瀏覽信息的Redis實(shí)例上運(yùn)行Lua批處理作業(yè),計(jì)算出所有的得分表。信息被拷貝到另一個(gè)Redis實(shí)例上,用以支持相關(guān)的產(chǎn)品查詢(xún)。同時(shí)還在MySQL上做了另一個(gè)備份,用以以后的分析,這種組合會(huì)將這個(gè)過(guò)程耗費(fèi)的時(shí)間降低60倍。
Viacom還使用Redis存儲(chǔ)一步作業(yè)信息,這些信息被插入一個(gè)列表中,工作人員則使用BLPOP命令行在隊(duì)列中抓取頂端的任務(wù)。同時(shí)zsets被用于從眾多社交網(wǎng)絡(luò)(比如Twitter及Tumblr)上綜合內(nèi)容,Viacom通過(guò)Brightcove視頻播放器來(lái)同步多個(gè)內(nèi)容管理系統(tǒng)。
橫跨這些用例,幾乎所有的Redis命令都被使用——sets、lists、zlists、hashmaps、scripts、counters等。同時(shí),Redis也成為Viacom可擴(kuò)展架構(gòu)中不可或缺的一環(huán)。