提高電信級呼叫中心可靠性的策略
2006/05/10
呼叫中心是一個高度集成的復雜系統(tǒng),集成了眾多第三方的硬件、系統(tǒng)軟件和應用軟件,先進軟硬件設備和技術(shù)的引入,大大提高了系統(tǒng)平臺的處理能力和效率,提升了系統(tǒng)平臺對服務的支撐能力,但同時也增加了系統(tǒng)出現(xiàn)故障的概率,任何關(guān)鍵軟硬件設備的失效都將導致災難性的后果。
電信級呼叫中心要求系統(tǒng)具有提供7×24小時不間斷服務的能力,因此對系統(tǒng)的可靠性要求非常高。電信級呼叫中心可靠性的提高,不但需要系統(tǒng)集成商具有堅實的技術(shù)實力、大型電信級呼叫中心的成功實施經(jīng)驗、嚴格規(guī)范的項目管理體系,而且需要有嚴格的系統(tǒng)可靠性分析和保障能力。
一、呼叫中心可靠性分析的目標
呼叫中心可靠性分析的目標是:網(wǎng)絡關(guān)鍵設備和呼叫路徑不存在單點故障;預防為主,通過有效的監(jiān)控、維護最大限度降低故障風險;建立故障處理的應急預案,保證有效收集數(shù)據(jù)并減少故障處理時間。因此,呼叫中心可靠性分析將首先考慮設計上的可靠性(包括設備/鏈路冗余備份),從系統(tǒng)設計上保證關(guān)鍵路徑不存在單點故障,并能在關(guān)鍵設備失效時,提供保證人工呼叫接續(xù)的能力。
關(guān)鍵設備可靠性不可能達到100%,因此為了避免設備失效情況的發(fā)生,設備的監(jiān)控和預防是首要的工作,通過有效的系統(tǒng)監(jiān)控和日常維護,80%的故障隱患是可以預先發(fā)現(xiàn)并消除的。
在系統(tǒng)的監(jiān)控、維護以及可靠性措施均得到有效執(zhí)行時,設備失效的概率大大降低了,但設備失效的可能性仍然存在,在設備失效時如何采取快速有效的措施,收集足夠的分析數(shù)據(jù),減少故障歷時,快速恢復系統(tǒng),使故障造成的損失降到最低,將變得尤為重要。
呼叫中心系統(tǒng)本身的高集成度決定了每個設備都與其它設備有著緊密的聯(lián)系,因此某個節(jié)點設備的失效,可能影響到其它關(guān)聯(lián)的設備,從而使故障恢復要涉及到除故障點外的其它設備。
二、呼叫中心的可靠性模型
呼叫中心可靠性分析對于提升呼叫中心系統(tǒng)的穩(wěn)定性,建立系統(tǒng)故障的主動預警監(jiān)控體系,保證在故障發(fā)生時呼叫的正常接續(xù),縮短故障處理時長,收集故障數(shù)據(jù),從而持續(xù)改進呼叫中心的可靠性具有非常重要的意義。
呼叫中心系統(tǒng)的高集成性和復雜性,對呼叫中心進行系統(tǒng)的可靠性分析,帶來了很大的挑戰(zhàn)。現(xiàn)有呼叫中心系統(tǒng)的可靠性多建立在解決方案提供商實踐經(jīng)驗的基礎上,目前仍缺乏相關(guān)的系統(tǒng)理論模型來確保高可靠性目標的實現(xiàn)。
根據(jù)多年的實踐經(jīng)驗,對電信級呼叫中心提出如下高可靠性分析模型,如圖1所示。該模型將電信級呼叫中心可靠性分析分為四個維度:網(wǎng)絡可靠性、呼叫路徑可靠性、邊界可靠性、非呼叫路徑可靠性。

1.網(wǎng)絡可靠性
呼叫中心集成了大量的軟硬件設備,不同的軟硬件設備通過網(wǎng)絡進行信息的交互,協(xié)同完成呼叫的接續(xù)和處理。網(wǎng)絡系統(tǒng)作為呼叫中心信息處理的載體,其穩(wěn)定性和可靠性是整體系統(tǒng)穩(wěn)定的基礎。網(wǎng)絡可靠性包括:網(wǎng)絡設備的可靠性、網(wǎng)絡傳輸鏈路的可靠性、防御網(wǎng)絡外部攻擊的可靠性。
2.呼叫路徑可靠性
呼叫中心的基本功能是實現(xiàn)呼叫的接續(xù)和處理,一個呼叫的接續(xù)過程涉及到不同設備的協(xié)同處理,呼叫信息的接續(xù)過程定義為呼叫路徑,呼叫路徑的任何節(jié)點/鏈接失效,都將導致呼叫接續(xù)的中斷。因此,呼叫路徑可靠性對整個系統(tǒng)的可靠性具有舉足輕重的意義。
3.邊界可靠性
呼叫中心需要與其它外部系統(tǒng)進行信息的交互,要保證呼叫中心的可靠性,同樣要考慮與呼叫中心交互的外部系統(tǒng)對呼叫中心的影響,包括網(wǎng)絡的隔離、信息有效性的驗證、外部系統(tǒng)故障的影響、呼叫量的雪崩效應,以提高呼叫中心系統(tǒng)自身的免疫力和抗干擾能力。
4.非呼叫路徑可靠性
呼叫中心系統(tǒng)集成的軟硬件產(chǎn)品,除呼叫路徑上的關(guān)鍵節(jié)點設備外,還包括了實現(xiàn)輔助支撐功能的設備,這些設備的失效不會對正常的呼叫接續(xù)和處理造成影響,但會影響呼叫中心輔助功能的實現(xiàn),在此將這些設備定義為非呼叫路徑設備。非呼叫路徑設備包括:消息服務器、監(jiān)控服務器、接口服務器、接口鏈路。從呼叫中心的投入和產(chǎn)出角度考慮,非呼叫路徑設備一般不提供備份功能。
三、呼叫中心的可靠性分析方法
呼叫中心可靠性模型的每個維度都有一些設備/軟件節(jié)點組成,每個維度的可靠性需要通過組成節(jié)點以及節(jié)點之間鏈路的可靠性來實現(xiàn),節(jié)點可靠性的實現(xiàn)可以抽象為3個層次:設計可靠性、主動預警能力和應急預案。通過對所有節(jié)點3個層次的可靠性分析,可以實現(xiàn)可靠性模型每個維度的可靠性,從而實現(xiàn)系統(tǒng)可靠性。根據(jù)圖2的可靠性分析矩陣,可以建立呼叫中心可靠性分析方法。

對于呼叫中心而言,客戶從發(fā)起呼叫到呼叫中心服務人員接聽呼叫的路徑,是呼叫中心提供服務能力的關(guān)鍵路徑,因此呼叫中心可靠性分析的核心即是如何保證呼叫路徑的可靠性。網(wǎng)絡作為呼叫中心系統(tǒng)賴以運行的基礎,其可靠性不言而喻,鑒于網(wǎng)絡可靠性方面已經(jīng)具有大量的理論和實踐指導,因此本文不做詳細分析。對于呼叫中心可靠性模型的非呼叫路徑可靠性和邊界可靠性,限于篇幅原因,本文也不做詳細介紹。
在客戶向呼叫中心發(fā)起人工服務的呼叫請求時,電信網(wǎng)的信令數(shù)據(jù)、客戶的按鍵選擇數(shù)據(jù)、呼叫的路由選擇數(shù)據(jù)以及客戶信息數(shù)據(jù)等,在多個設備節(jié)點之間進行交換,從而協(xié)同實現(xiàn)呼叫的接續(xù)過程,構(gòu)成了呼叫中心的呼叫路徑。
呼叫路徑上的每一個節(jié)點(設備或軟件系統(tǒng))都是呼叫路徑的關(guān)鍵節(jié)點,任何節(jié)點的失效,都將直接中斷或影響正常的呼叫接續(xù)。因此,企業(yè)必須對呼叫路徑上的每個節(jié)點進行全面系統(tǒng)的可靠性分析,以確保呼叫路徑的高可靠性和高可用性。
呼叫路徑的節(jié)點可靠性分析包括以下3個層次,即節(jié)點的設計可靠性、節(jié)點主動預警能力、節(jié)點的故障應急預案。
1.設計可靠性
節(jié)點需要支持雙機熱備,保證不存在單點故障,同時必要時還可以設置一臺獨立的冷備份系統(tǒng),以應對雙熱備系統(tǒng)同時失效的小概率故障事件。
2.主動預警
節(jié)點應具備主動預警監(jiān)控模塊,從而改變傳統(tǒng)的由維護人員被動響應故障的局面,實時對系統(tǒng)的運行數(shù)據(jù)進行監(jiān)測(如CPU、內(nèi)存、硬盤容量、網(wǎng)絡通信、節(jié)點負載等),對超過預警閥值的參數(shù)進行主動預警,通過短信、呼叫等手段主動通知維護人員,以利于維護人員提前發(fā)現(xiàn)故障的隱患,為故障隱患的排除爭取寶貴的時間。
3.故障應急預案
即使在設計上已經(jīng)保證了系統(tǒng)的可靠性,并且設置了系統(tǒng)運行主動預警模塊,故障的出現(xiàn)還是不能100%避免的。根據(jù)故障處理的指導原則,以最短的時間完成故障的處理和系統(tǒng)的恢復,最大限度地減少故障造成的運營損失,必須建立節(jié)點的故障應急預案,包括故障點的快速確認方法、故障數(shù)據(jù)收集、處理和恢復的詳細步驟,從而保證在故障處理時能夠游刃有余。
通信世界網(wǎng)(www.cww.net.cn)
相關(guān)鏈接:
卢龙县|
离岛区|
巴彦淖尔市|
奉新县|
鞍山市|
原阳县|
嘉峪关市|
大城县|
铜梁县|
江西省|
都江堰市|
衡南县|
东明县|
周至县|
麻栗坡县|
新蔡县|
嘉定区|
中阳县|
库车县|
方山县|
登封市|
镇坪县|
信宜市|
岑溪市|
洛宁县|
江津市|
缙云县|
天祝|
天门市|
山阳县|
沧州市|
白朗县|
衡阳市|
南雄市|
澄江县|
西乌|
黔江区|
甘洛县|
萍乡市|
灵丘县|
无极县|