首先,Linux運維在工作中需要掌握哪些核心技術(shù)?
第一,最主要的排錯。分析部分程序不能運行或沒有按預(yù)想結(jié)果運行的原因,對程序運行跟蹤,查看系統(tǒng)調(diào)用的過程;較深入的系統(tǒng)瓶頸點分析。包括:查看剩余內(nèi)存、系統(tǒng)信息、日志管理常用內(nèi)容、硬件信息。
第二,優(yōu)化。優(yōu)化是根據(jù)實際的現(xiàn)場環(huán)境硬件各個參數(shù)進行部分優(yōu)化,提高軟件性能和網(wǎng)站性能。這個我只能講半知半解,當(dāng)時優(yōu)化MySQL和Tomcat參數(shù)也是根據(jù)網(wǎng)上文章和官網(wǎng)文檔查找參數(shù)在虛擬機上測試然后查看性能。優(yōu)化可以說是運維最吃香的技能,基本會優(yōu)化的運維普遍工資很高,而且優(yōu)化是要承擔(dān)風(fēng)險的,并不是網(wǎng)上搜個文章改一下配置文件或者參數(shù)就叫優(yōu)化了,這樣很容易造成宕機。
第三,開發(fā)技能。隨著云計算時代的來臨,中小型公司不需要運維了,大型公司沒有工程開發(fā)能力的運維,是沒有競爭力的。
優(yōu)選 Shell 和 Python,現(xiàn)在 Shell 無法滿足你的需求或者效率很低,那么選擇自動化 Python 是最好的選擇,F(xiàn)在普遍招聘需求要求,會寫 Shell 或者 Python、Perl 腳本,個人選擇還是選 Python。
Python 這門語言上手比較快,容易理解。在服務(wù)器管理工具上非常豐富,配置管理(Saltstack) 批量執(zhí)行(Fabric、Saltstack) 監(jiān)控(Zenoss、Nagios 插件) 虛擬化管理( python-libvirt) 進程管理 (Supervisor) 云計算(OpenStack) ...... 還有大部分系統(tǒng) C 庫都有 Python 綁定。
除了核心技術(shù),還要有運維意識。運維意識包含一些什么呢?
一、安全意識
運維人員的權(quán)限很大,所以一定要保證帳號/私鑰的安全。所以給出衷心建議:最好使用加密工具存儲,比如Truecrypt、lpassword;SSH私鑰添加密碼;基于本地存儲,切勿用網(wǎng)盤,也不建議用lastpass等。
二、計劃意識
復(fù)雜的變更操作比如多臺主機以及牽涉到san存儲,最好先作 操作計劃,寫計劃文檔,詳細(xì)致每條命令,然后請高手幫忙審核。 這樣能最大程度使整個操作過程安全。如果是重要的客戶業(yè)務(wù)系統(tǒng),操作最好有回退方案,而一旦變更失敗,客戶可以在短時間內(nèi)將業(yè)務(wù)回退。
三、記錄分享意識
遇到自己認(rèn)為較特殊的案例時,記得要寫案例過程及分析的文檔。也方便自己以后翻看,或者和其他人分享,當(dāng)作知識的傳播以便于大家以后都能少走彎路。
四、磨刀意識
關(guān)于任何操作配置,最好先搞明白操作或配置的原理,然后再去操作。應(yīng)一句話叫做“磨刀不誤砍柴功”,而且對于類似的操作可以舉一反三。
五、業(yè)務(wù)意識
盡量了解維護的各主機上業(yè)務(wù)類型,以及各主機業(yè)務(wù)之間的關(guān)聯(lián)性。因為任何維護工作都是為主機能提供業(yè)務(wù)服務(wù)的,當(dāng)某業(yè)務(wù)中斷,能最快的知道與此業(yè)務(wù)相關(guān)的主機群,從而縮小故障排查范圍,最快定位故障。
六、監(jiān)控意識
運維來說,監(jiān)控是非常重要的,監(jiān)控是發(fā)現(xiàn)系統(tǒng)各種異常的眼睛,所以運維應(yīng)該和監(jiān)控緊密配合。
小白和大神的區(qū)別就是技術(shù)和意識的進階,所以想要不被你所在的職業(yè)淘汰,總是需要不斷學(xué)習(xí)。而且很多時候是多一點技術(shù)就可以有更多的薪資,這一點何樂而不為呢?
上一個教程:Linux運維工程師的基本技能,全會的才合格!
下一個教程:女生不適合進IT行業(yè)做Linux運維?