Построение комплексного мониторинга ЦОД для чайников
Построение комплексного мониторинга ЦОД для чайников Константин Струлёв Расшифровка видео с доклада на Big Monitoring Meetup 8, состоявшегося в Москве, все мероприятия сообщества Monhouse:Прежде чем мы углубимся в этот рассказ, я хочу предварительно сказать, что весь доклад построен на моем предыдущем опыте. У меня достаточно заметный опыт в эксплуатации, он…
Read More
Аутсорсинг и кастомизация Zabbix: централизация, сопровождение и развитие платформы
Аутсорсинг и кастомизация Zabbix: централизация, сопровождение и развитие платформы Коробов Денис, Лукиных Александр Расшифровка видео с доклада на Big Monitoring Meetup 9, состоявшегося в Санкт-Петербурге, все мероприятия сообщества Monhouse:Меня зовут Лукиных Александр, я начальник Управления централизованного мониторинга X5 Технологий. Со мной мой коллега Коробов Денис, руководитель команды разработки направления сервисного…
Read More
Как вовремя разбудить дежурного админа? Мониторинг облака Selectel
Как вовремя разбудить дежурного админа? Мониторинг облака Selectel Александр Барсков Расшифровка видео с доклада на Big Monitoring Meetup 9, состоявшегося в Санкт-Петербурге, все мероприятия сообщества Monhouse:Меня зовут Александр Барсков, я системный администратор дежурной службы облака в компании «Selectel». Сегодня я расскажу, как мы в дежурной службе обрабатываем алерты, как мы…
Read More
Общий обзор и классификация систем мониторинга (Вячеслав Милованов, Paessler)
Когда используемый сценарий мониторинга, построенная инфраструктура перестают быть адекватной, становятся слишком сложными, проявляются серьезные пробелы в знаниях о мониторинге. Все это осложняется отсутствием документов. При таком беглом обзоре очевидно: тема сложная, а решения бесчисленны. Практически каждое решение обещает идеальный мониторинг, предлагает самые разные концепции, самый разные методы. Давайте попробуем сегодня…
Read More
Работа с мониторингом облака Selectel. Регламенты и процессы (Александр Бондарев, Selectel)
Сегодня мы с вами поговорим о том, как компания Selectel работает с мониторингом. Поделюсь опытом, покажу наши кейсы, а также попрошу вас поучаствовать в этом. Я не зря вышел сюда с нашим талисманом - Ти-Рексом. У меня их три штуки, одного я отдам за лучший вопрос, два других отдам самым…
Read More
Observability Whitepaper от Cloud Native Computing Foundation
Observability Whitepaper от Cloud Native Computing FoundationCloud Native Computing Foundation приступил к созданию документации по наблюдаемости(observability). На Github доступна промежуточная версия, так же CNCF приглашает принять участие в написании документа. "Цель этого документа - внести ясность, чтобы большее количество программных и операционных групп могло получить преимущества наблюдаемости в своих системах."…
Read More
“Vmagent — комбайн для мониторинга” (Николай Храмчихин, VictoriaMetrics)
ПрезентацияДобрый день, меня зовут Николай Храмчихин. Сегодня я расскажу о vmagent’е, нашем комбайне для мониторинга. Вначале краткий экскурс в историю - с чего все началось и зачем был разработан vmagent. Сначала была VictoriaMetrics, это быстрая и простая в установке БД для временных рядов. Она принимала данные в себя из…
Read More
Что такое мониторинг реальных пользователей (RUM — Real User Monitoring)?
Что такое мониторинг реальных пользователей (RUM - Real User Monitoring)? Выбор подходящих инструментов и подходов для мониторинга производительностью приложений - сложная и важная задача. Стоит помнить, что конечная цель APM (Application Performance Monitoring) - ответить на два вопроса: Как конечные пользователи используют ваш сайт или мобильное приложение? Как превратить полученные…
Read More
Что такое Mean Time to Repair (MTTR)?
Среднее время восстановления (mean time to repair - MTTR) является важным показателем, который представляет собой среднее время, необходимое для ремонта и восстановления работоспособности компонента или системы. MTTR - это один из критериев ремонтопригодности систем, оборудования, приложений и инфраструктуры организации, а также эффективности ремонта этого оборудования при возникновении ИТ-инцидента. Время восстановления…
Read More
Упрощение гибридных и многопользовательских сред: важность наглядности при многопользовательском подходе
Упрощение гибридных и многопользовательских сред: важность наглядности при многопользовательском подходе За последние пять лет мы стали свидетелями быстрого развития гибридных и многопользовательских облачных сред, на наших глазах появились новые архитектуры приложений и методологии разработки. Всё это дает организациям возможность быстро реагировать на изменяющиеся требования рынка. Сегодня технологическим командам приходится иметь…
Read More
Однопользовательские и многопользовательские облачные модели: сравниваем подходы
В статье расскажем о преимуществах и недостатках однопользовательского (однотенантного) и многопользовательского (мультитенантного) облаков. Введение За последнее десятилетие облачные вычисления стали применяться практически везде. Прежде крупные предприятия самостоятельно создавали ИТ-инфраструктуру и управляли ею. Несмотря на “традиционность” подхода, у него есть определенные преимущества: изолированность, конфиденциальность и высокий контроль над системой. Это…
Read More
11 сетевых терминов, которые вам следует знать
В каждой отрасли существует свой жаргон и знакомая экспертам терминология. ИТ-индустрия не является исключением. Множество слов, связанных с сетевым трафиком,я ничего не значат за пределами технологического мира. И чтобы действительно понять сетевой трафик, осознать роль, которую он играет в вопросах безопасности и управлении сетью, необходимо разобраться в используемой лексике. Расскажем…
Read More
Как телекоммуникационная компания “BT Group” использует Amazon CloudWatch для мониторинга миллионов устройств
Британская телекоммуникационная компания “BT Group” создала с помощью Amazon Web Services интересное решение для мониторинга. Для сбора и анализа телеметрических данных с миллионов устройств используются следующие инструменты: дашборды Amazon CloudWatch; “аварии со сложным условием” (composite alarms - такой сигнал об аварии будет подан только в том случае, если в аварийное…
Read More
Эпоха наблюдаемости: почему будущее открыто, взаимосвязано и программируемо
Введение Когда основатель "New Relic" Лью Сирн (Lew Cirne) создал систему мониторинга производительности приложений (APM), его ключевым нововведением стала возможность глубокая просматриваемость кода в монолитных приложениях, работающих в центре обработки данных. Затем его система стала доступна в виде SaaS, и ей может воспользоваться каждый инженер, занимающийся разработкой и эксплуатацией программного…
Read More
Что нового в Grafana v.7.3
На днях вышла новая версия всем известного дашборда для отображения метрик - Grafana. Посмотрим, что добавили разработчики в v.7.3. Улучшение таблицы. Был доработан режим отображения в виде таблицы - теперь при наведении курсора на ячейку вы увидите всё её содержимое (если ширина столбца не позволяет увидеть всё сразу). Еще одна…
Read More
Red Hat выпустили новую версию Ansible Automation Platform 1.2
Red Hat выпустили новую версию Ansible Automation Platform - 1.2. Разработчики сосредоточились на повышении эффективности, увеличении производительности и усилении контроля над рисками и расходами. Что такое Ansible Automation Platform? Ansible Automation Platform - система ИТ-автоматизации. Важное отличие платформы от других, по заявлению создателей, заключается в её многофункциональности: это система…
Read More
IBM приобрел IT-компанию Instana
18 ноября IBM приобрел фирму Instana - немецко-американскую IT-компанию, разрабатывающую APM-софт (Application Perfomance Management). Это показательно: IBM продолжает инвестировать в технологии гибридного облака, искусственного интеллекта и Big Data. Условия сделки не разглашаются. Компании по мере развития рабочих процессов переходят от монолитных приложений (monolithic apps) к более сложным распределенным системам (complex…
Read More
HashiCorp анонсировала Nomad 1.0 Beta
Полгода назад Splunk представил платформу для мониторинга приложений - SignalFx Microservices APM. Компания провела масштабное обновление (теперь приложение называется Splunk APM) и планирует в ближайшем будущем добавить новые функции. Выходит публичная бета-версия HashiCorp Nomad 1.0. Nomad - это оркестратор для развертывания и управления контейнерами и неконтейнерными приложениями в локальных и…
Read More
Облачные сервисы AWS, Azure, GCP
В последние годы возможность использования облачных инфраструктур все прочнее укрепляется в сознании владельцев корпоративных бизнес-решений (ИТ-решений). Даже если предприятие не делает крупных ставок на вычисления в публичных облаках, использование облачных решений в той или иной форме является неотъемлемой частью стратегии и планов развития инфраструктуры большинства предприятий в силу доступности, экономической…
Read More
Каталог цифровых услуг
Информационные и коммуникационные технологии всё глубже проникают в нашу жизнь сегодня. Всё чаще мы слышим про дигитализацию или проникновение цифровых технологий. Не только слышим, но и ощущаем каждый день — всё более совершенные мобильные телефоны, достижения в скорости вычислений и сопутствующие возможности в области машинного анализа, искусственных нейронных сетей и…
Read More
Мониторинговый словарь
Мониторинговый словарь Зарегистрированное системами изменение нормального поведения системы, окружения, процесса, системы или человека. В современной цифровой действительности рассматривают потоки событий - инфраструктуры предоставления инфокоммуникационных услуг генерируют тысячи и сотни тысяч событий в единицу времени. Для анализа таких потоков событий требуются специальные системы.Уведомление о том, что конкретное событие или группа событий…
Read More
Best Practices For Monitoring Modern IT Infrastructures
David Linthicum IT Infrastructures power an application’s experience. But today’s IT infrastructures are moving to the cloud and are becoming more and more hybrid in nature. They require a modern approach to monitoring so that they can deliver the right experience. Renowned industry thought leader and blogger, David Linthicum shares…
Read More