Как эффективно админить много виртуальный серверов.

Настраивай Puppet master и будет тебе счастье, у меня 30+ серверов так работает, и никаких проблем нет, единственное что Puppet ооочень капризный
 
Не путайте "Админить" и "Мониторить"...

Мониторингом вообще другие люди должны заниматься... Как правило вообще с другого отдела...
Я не путаю.
У топикстартера не указано, что он работает в большой корпорации, где ИТ - это несколько отделов. Если он при этом интересуется администрированием многих виртуалок, то скорее всего он либо фрилансер, либо часть админ небольшой фирмы (команды фрилансеров), который сам принимает решения. Иначе он бы спрашивал начальника отдела, а не задавал вопросы на форуме.
Исходя из этого, я предполагаю что "мониторить" - это очень важная часть от "админить". И без мониторинга администрирование превращается в... нечто нецензурное, скажем так :)

Поэтому и рекомендую задачу "администрирование многих серверов" рассматривать в комплексе с "мониторить что же я наадминистрировал".

единственное что Puppet ооочень капризный
Тоже администрирую слегка побольше 30 серверов. Капризов не встречал. Где и как их искать?
 
tuthanhamon, ну не знаю, я работал в очень крупной государственной компании... Был и начальник, и отдел администрирования железа, и отдел мониторинга, и отдел виртуализации... И мне было ровно пох*й на них всех :) Я ставил то, что считал необходимым и админил/мониторил так, как считал нужным... А кто был не согласен - предлагал письменно написать "Я такой-то такой-то беру на себя ответственность если это ***но умрёт"... Желающих не нашлось и все споры быстро прекратились.
P.s. админил я только ПО, даже операционки не касался...
P.p.s. на мне было порядка 110-115 серверов.
 
Я ставил то, что считал необходимым и админил/мониторил так, как считал нужным... А кто был не согласен - предлагал письменно написать "Я такой-то такой-то беру на себя ответственность если это ***но умрёт"... Желающих не нашлось и все споры быстро прекратились.
Прерогатива хорошего специалиста :)
И тем не менее, парой постов назад ты предлагал автору ограничиться администрированием, а мониторинг спихнуть на других ;)

P.S. Кстати, как можно админить ПО не касаясь ОСи? Ведь лезут же постоянно нюансы типа "Софтине ХХХ нужно ядро УУУ или там обновление KB-ZZZ"...
 
P.S. Кстати, как можно админить ПО не касаясь ОСи? Ведь лезут же постоянно нюансы типа "Софтине ХХХ нужно ядро УУУ или там обновление KB-ZZZ"...
Элдементарно - пинались соответсвующие отделы
И тем не менее, парой постов назад ты предлагал автору ограничиться администрированием, а мониторинг спихнуть на других ;)
Да, потому что я чётко разделяю мониторинг и администрирование... И когда я задаю вопрос "Чем админить" - я подразумеваю:
- Как давать массовые команды (сказать всем серверам сделать то--то)
- Как удалённо, не заходя на сервер, включить/выключить службу
- Как удалённо и в нужной последовательности по расписанию перезапустить все сервера
Ну и так далее...
Ну а если мне нужно мониторить, то вопросы будут:
- Как собрать статистику ххх с ххх по ххх, не лазия по серверам
- Как оповестить ххх по событию ххх
- Как обеспечить показ онлайн-данных с серверов

Короче, это реально разные вещи :) Если мне нужны средства администрирования - подразумеваю, что у меня уже стоит тот же Zabbix или есть отдел, который этим занимается. А меня за....ло каждое утро раскидывать хххх файликов по ххх серверам.... :)

P.s. о мониторинге, я думаю мало кто поспорит, что правильно настроенный и допиленный Zabbix требует чего-то дополнительного :) Оповещения есть, события есть, мониторить можно хоть "сколько файликов привалилось в папку", "сколько трафика по порту ХХХ пришло от IP ххх" и т.д., статистика тоже есть - в общем, универсальная штука, которую можно допиливать как хочешь :)
 
Да, потому что я чётко разделяю мониторинг и администрирование... И когда я задаю вопрос "Чем админить" - я подразумеваю:
- Как давать массовые команды (сказать всем серверам сделать то--то)
- Как удалённо, не заходя на сервер, включить/выключить службу
- Как удалённо и в нужной последовательности по расписанию перезапустить все сервера
Ну и так далее...
Ну а если мне нужно мониторить, то вопросы будут:
- Как собрать статистику ххх с ххх по ххх, не лазия по серверам
- Как оповестить ххх по событию ххх
- Как обеспечить показ онлайн-данных с серверов

Короче, это реально разные вещи :)
Согласен насчет разных вещей, но абсолютно не представляю себе администрирования без мониторинга. Пример. Обновил я как-то puppet-ом локальные DNS-ы на серверах подконтрольных фирм - чтобы везде forwarder-ом у BIND-a был гугловый 8.8.8.8, а то пара крупных провайдеров достала со своими проблемами. Сразу после этого на паре серверов перестала почта ходить, о чем nagios чесно отрапортовал. Оказалось, там почта бегала через почтовики локальных провайдеров типа mail.providername, которые перестали резолвиться. Соответственно, тут же докручивал exim не отходя от кассы и понимая откуда у проблемы ноги ростут. Как бы все это делалось без мониторинга - слабо себе представляю. Хотя нет, представляю, конечно. На другой день звонки "у нас вроде почта не работает", разбирательства задним числом и все такое.
P.s. о мониторинге, я думаю мало кто поспорит, что правильно настроенный и допиленный Zabbix требует чего-то дополнительного :) Оповещения есть, события есть, мониторить можно хоть "сколько файликов привалилось в папку", "сколько трафика по порту ХХХ пришло от IP ххх" и т.д., статистика тоже есть - в общем, универсальная штука, которую можно допиливать как хочешь :)
Не знаю как насчет zabbix-a, но правильно настроенный nagios ;) таки да - и рулит и педалит. Особенно в связке с puppet-ом.
 
Был лучшего мнения о технарях из Яндекса, честно говоря. Из главных ошибок :
1. Нагиос не рисует графики сам и, как результат, не хранит данные для них. Лично я, например, красоту рисую графитом, и данные хранит именно графит (whisper, если уж дотошно), но ничто не мешает через NDOutils писать их во внешнюю базу данных и хранить сколько хочется. Почему автор презентации заявил об RRD и тут же записал это в недостатки - оставим на его совести.
2. Нагиос кроме "сломалось или нет" тоже собирает количественные характеристики.
3. Нагиос реагирует на kill -HUP, так что перезапускать его для перечитывания конфига не надо. Должен признаться, что не знаю, сколько времени он будет перечитывать конфигурацию из десятков тысяч хостов/сервисов. Как, впрочем, и заббикс.
4. В нормальной системе конфигурация нагиоса - это Для просмотра ссылки Войди или Зарегистрируйся, а не один. Вопрос же хранения конфигурации в базе или во многих файлах - очень непростой. Достоинства и недостатки есть у обеих подходов.
5. Интервал проверки можно указывать для каждого сервера или сервиса отдельно. Или для группы серверов/сервисов. Или в шаблонах. Или дефолтный для всех указать.
6. Отказоустойчивость, как видно по презентации, у заббикса ничуть не лучше. Надо строить отдельно - что для одной системы, что для другой.

В целом. У нагиоса есть недостатки, само собой. Но данная презентация ни об одном из них не упомянула. Такое впечатление, что автору надо было отмазаться перед некомпетентными в техническом плане людьми о причинах смены системы мониторинга. Причем именно отмазаться - реальные причины остались в стороне.

P.S. Не имею никакого отношения к nagios-у за исключением того, что его использую и иногда матерю, когда что-то не получается :)

Заббикс, кстати, в свое время покорил просто прекрасной документацией. Но разочаровал тем, что всю конфигурацию надо накликать мышкой. Иногда правка текстовых файлов быстрее и удобнее.
 
Самопальные скрипты хороши до тех пор, пока кто-нить ручками что-то на сервере не поменяет и забудет. Менеджеры конфигурации навроде паппета и ансибла хороши тем, что они же и за консистенцией файлов следят. Сам использую паппет на парку в полторы тысячи машин, но всегда напрягало то, что он тянет за собой руби. Так что если бы мне нужно было бы выбирать, выбрал бы ансибл.
 
Сам использую паппет на парку в полторы тысячи машин
А можно узнать чуток деталей? Например, как организованы манифесты (структура папок)? Что юзается для конфигурирования нод - HIERA? Foreman? site.pp? :) Используется ли веб-интерфейс для просмотра статуса нод? Юзаете ли готовые сторонние манифесты, или пишете свои?
 
Назад
Сверху