Monitoring

Z VirtlabWiki

(Rozdíly mezi verzemi)
Přejít na: navigace, hledání
Verze z 10:18, 11. 3. 2008
Gry72 (Diskuse | příspěvky)

← Předchozí porovnání
Aktuální verze
Gry72 (Diskuse | příspěvky)
(https://virtlab.cs.vsb.cz/cons-logs/ Logy konzolového serveru)
Řádka 8: Řádka 8:
PHPMyAdmin: [https://virtlab.cs.vsb.cz/phpmyadmin Ostrava], [https://virtlab.opf.slu.cz/phpmyadmin Karviná] PHPMyAdmin: [https://virtlab.cs.vsb.cz/phpmyadmin Ostrava], [https://virtlab.opf.slu.cz/phpmyadmin Karviná]
 +
 +== e-mailový hlídač/agregátor Syslogu ==
 +
 +* CRON v Ostravě i Karviné
 +* 3.minutu v kazde hodine se spousti testsrv.php
 +* Agregaovane info za posledni hodinu ze Syslogu se posila kazdou hodinu v 6.minute
=== Zabbix === === Zabbix ===
Řádka 15: Řádka 21:
Po přihlášení viz Po přihlášení viz
-* [http://zabbix.opf.slu.cz/events.php?groupid=100100000000002&hostid=0 Events]+* [http://zabbix.opf.slu.cz/events.php?groupid=100100000000002&hostid=0 Events (all)]
-* [http://zabbix.opf.slu.cz/report2.php?groupid=100100000000002&hostid=100100000000016 vailability]+* [http://zabbix.opf.slu.cz/report2.php?groupid=100100000000002&hostid=100100000000016 Availability (Virtlab sites events)]
-* [http://zabbix.opf.slu.cz/report2.php?hostid=100100000000016&triggerid=100100000000064 Reports]+* [http://zabbix.opf.slu.cz/report2.php?hostid=100100000000016&triggerid=100100000000064 Daily availability graph (Virtlab sites)]
 +* [http://zabbix.opf.slu.cz/charts.php?groupid=0&hostid=100100000000016&graphid=100100000000001 Virtlab Karvina - availaility graph]
 + 
 +''Jsou tri druhy pingu ktere se delaji: ping co umi jen 0 a 1, odezva v sec a packetloss. Ping 0/1 se dela co 30 sec, zbytek co 300 sec. Jsou maximalne 3
 +dny historie. Zpetne se pak zachovavaji 351 dni pouze alerty, tedy stavy, kdy ty cislicka vyboci z povolenych mezi. Coz vicemene staci (na vypocet SLA, apod).''
 + 
[[Private:Zabbix - správce a účty]] [[Private:Zabbix - správce a účty]]
-'''Na mape propojeni Virtlabu vsb-opf jsou veskere spoje jsou brany ze smeru z VSB'''. +'''Na mape propojeni Virtlabu vsb-opf jsou veskere spoje jsou brany ze smeru z VSB'''. Spoj hlasi chybu, pokud je nasledujici prvek neaktivni (napr. pokud nejede hned hlavni prvek na opf, tak spoj mezi virtlab.cs.vsb.cz a timto prvkem zcervena a tim oznami problem).
Co by se hodilo monitorovat Co by se hodilo monitorovat
Řádka 28: Řádka 39:
* Dostupnost jednotlivych softwarovych serveru (asi 5 komponent v Ove a v )Karvine. Vzdy jde o to napojit se na ne jejich CLI pres TCP a zkusit poslat prikaz exit - spojeni by se melo navazat a po exist zase ukoncit. Tohle by se dalo udelat treba 4x za hodinu. My bychom si pak jen do logu pridali podminku, ze pokud se takto pta vas zabbix z nejake (jake?) IP adresy, ani bychom to nelogovali, at si ty logy zbytecne nezacpavame. * Dostupnost jednotlivych softwarovych serveru (asi 5 komponent v Ove a v )Karvine. Vzdy jde o to napojit se na ne jejich CLI pres TCP a zkusit poslat prikaz exit - spojeni by se melo navazat a po exist zase ukoncit. Tohle by se dalo udelat treba 4x za hodinu. My bychom si pak jen do logu pridali podminku, ze pokud se takto pta vas zabbix z nejake (jake?) IP adresy, ani bychom to nelogovali, at si ty logy zbytecne nezacpavame.
 +
 +== [[Private:Pomocné utility, skripty a postupy pro monitoring]] ==
 +
 +== [https://virtlab.cs.vsb.cz/cons-logs/ Logy konzolového serveru] ==

Aktuální verze

Obsah

monitor.dvirtlab.net

https://monitor.dvirtlab.net/ (heslo do SVN)

Postaru:

Stav serverů: Ostrava, Karviná

PHPMyAdmin: Ostrava, Karviná

e-mailový hlídač/agregátor Syslogu

  • CRON v Ostravě i Karviné
  • 3.minutu v kazde hodine se spousti testsrv.php
  • Agregaovane info za posledni hodinu ze Syslogu se posila kazdou hodinu v 6.minute

Zabbix

http://zabbix.opf.slu.cz/

Po přihlášení viz

Jsou tri druhy pingu ktere se delaji: ping co umi jen 0 a 1, odezva v sec a packetloss. Ping 0/1 se dela co 30 sec, zbytek co 300 sec. Jsou maximalne 3 dny historie. Zpetne se pak zachovavaji 351 dni pouze alerty, tedy stavy, kdy ty cislicka vyboci z povolenych mezi. Coz vicemene staci (na vypocet SLA, apod).


Private:Zabbix - správce a účty

Na mape propojeni Virtlabu vsb-opf jsou veskere spoje jsou brany ze smeru z VSB. Spoj hlasi chybu, pokud je nasledujici prvek neaktivni (napr. pokud nejede hned hlavni prvek na opf, tak spoj mezi virtlab.cs.vsb.cz a timto prvkem zcervena a tim oznami problem).

Co by se hodilo monitorovat

  • Historie konektivity mezi Ova a Ka (rekneme 2x za minutu zkusit ping na virtlab.opf.slu.cz a virtlab.cs.vsb.cz, mezi nimi primo to asi nezkusime. Idealni by bylo, kdyby se nekde vynasel nejaky trendovy graf, na kterem bychom napr. zjistili, ze napr. konektivita v nejakem casovem intervalu 10 minut upadla (takze my za nic nemuzeme, kdyz po nas nekdo rve, ze se na Virtlab v te dobe nedostal). V idealnim pripade pri vypadcich konektivity vetsich nez rekneme 1h + po obnoveni poslat email na dvirtlab-admin@dvirtlab.net.
  • Dostupnost jednotlivych softwarovych serveru (asi 5 komponent v Ove a v )Karvine. Vzdy jde o to napojit se na ne jejich CLI pres TCP a zkusit poslat prikaz exit - spojeni by se melo navazat a po exist zase ukoncit. Tohle by se dalo udelat treba 4x za hodinu. My bychom si pak jen do logu pridali podminku, ze pokud se takto pta vas zabbix z nejake (jake?) IP adresy, ani bychom to nelogovali, at si ty logy zbytecne nezacpavame.

Private:Pomocné utility, skripty a postupy pro monitoring

Logy konzolového serveru

Osobní nástroje