Software de Detección
para los servidores críticos de la institución, existentes que prove mecanismos proactivos y reactivos para garantizar la continuidad de
las aplicaciones vitales de nuestra institución.
Objetivo:
Adquirir una herramienta de software que a permita al personal de
Tecnología de Información, a saber, los Administradores de las bases de datos,
al personal de soporte, al personal de soporte a usuarios (Help
Desk), a los usuarios finales responsables de las
aplicaciones, identificar en forma proactiva y reactiva, mediante una interfaz gráfica, fácil
de utilizar que permita establecer una metodología efectiva e integrada para
detectar los problemas de desempeño, disponibilidad, eficacia y eficiencia en
los equipos servidores, plataformas tecnológicas varias, comunicaciones y
sistemas operativos que conforman las aplicaciones criticas de la institución.
La institución requiere que la solución cubra la siguiente base
instalada de servidores:
Servidores y Plataformas a monitorear:
|
Cant |
Sistema
Operativo |
N° Proc. |
Aplicación |
|
1 |
MS Windows (NT, 2000 ó 2003) |
2 |
SQL Server |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Se requiere que la herramienta ofertada sea cotizada tomando en cuenta
que se requiere licenciamiento para que el siguiente personal de las diferentes
áreas de la institución utilice las herramientas en forma continua, a saber:
|
Cant |
Descripción |
|
|
Administradores de Servidores Windows |
|
|
Administradores de Infraestructura
Microsoft (Active Directory) |
|
|
Administradores de Exchange |
|
|
Administradores de Bases de Datos Sybase |
|
|
Administradores de Bases de Datos MS
SQL Server |
|
|
Operadores de centro de Monitoreo |
|
|
Personal de Soporte a Usuarios/Help Desk |
|
|
Auditores de Informática |
|
|
Administradores de Aplicaciones |
La solución ofrece las características que se enumeran a continuación:
1.
La herramienta
viene pre-programado y configurado de fábrica con los
umbrales y conocimiento necesarios para la detección de problemas, anomalías,
violación de buenas prácticas del fabricante de cada servidor monitoreado que
se solicite. Viene listo para la detección de las circunstancias que puedan
comprometer la continuidad del servicio de las plataformas tecnológicas
monitoreadas.
2.
[f1]
3.
La solución
provee un mecanismo para ajustar los umbrales específicos de fábrica a las
necesidades de la institución para cada servidor individual, grupos de servidores
con características afines en forma simple y sin requerimientos de
programación, o sea a través de una
interfase gráfica y modificación simple de parámetros.
4.
Este hecho puede
comprobarse fácilmente para cualquier aspecto de monitoreo solicitado. Para la institución es
indispensable obtener resultados en forma expedita de la solución adquirida
para obtener un beneficio inmediato de esta inversión.
5.
La solución se
entrega completamente instalada de acuerdo a las normas del fabricante en
nuestra institución para la población de servidores indicados anteriormente.
6.
La instalación
de los componentes de la herramienta se realiza desde el centro de monitoreo de
nuestras oficinas centrales, de forma tal que no sea necesario el trasladar
personal o medios (CD´s, DVD´s,
disquettes u otros) al sitio en donde se encuentra la
pieza o capa tecnológica a monitorear.
Esto aplica a todo servidor
solicitado (Sistemas Operativos,
Dispositivos de comunicación, Bases de Datos, Servidores de Internet, etc).
7.
Esta facilidad
es necesaria puesto que los equipos de la institución se encuentran dispersos
en todo el país y deseamos evitar los costos directos, así como el tiempo
requeridos por una instalación que requiera presencia física de nuestro
personal o personal de proveedor.
8.
Los requisitos
de puertos de comunicación requeridos en un ambiente seguro institucional, las
estrategias para obtención de información necesaria para el monitoreo en un
ambiente que cuenta con firewalls, y los protocolos
necesarios que deben habilitarse para que el software funcione correctamente
son los siguientes:
1.
Las mediciones
deben tomarse en el equipo monitoreado con un mínimo de impacto en el desempeño
del mismo. La solución no excede un 3%
para cualquier parámetro monitoreado de cualquier tipo de servidor solicitado
(Sistemas Operativos, Dispositivos de comunicación, Bases de Datos, Servidores
de Internet, etc).
2.
La taza de obtención
de información de cada dispositivo o pieza tecnológica monitoreada puede
regularse fácilmente mediante modificación de parámetros en la consola o
mediante una interfase gráfica que permite la modificación de parámetros del
sistema de monitoreo por parte del administrador del sistema para controlar el
impacto en la red y el dispositivo monitoreado.
1.
La solución
cuenta con un mínimo de 10 consolas que permitirán al centro de monitoreo de la
institución visualizar las alarmas de los incidentes detectados, borrarlas y
ver los detalles específicos relacionados con cada evento en forma gráfica, en
forma de tablas o través de reportes (prediseñados de fábrica o diseñados a
discreción del administrador del sistema) para lograr una efectiva detección,
diagnóstico y resolución de los incidentes que ocurran en cualquier aspecto de
la plataforma tecnológica.
2.
La herramienta
cuenta con un mecanismo que permite a diferentes grupos relacionados con la
continuidad de las aplicaciones de negocios (infraestructura tecnológica,
administradores de bases de datos, soporte a usuarios, comunicaciones, personal
de campo, etc) puedan acceder la información
pertinente a cada uno de sus ámbitos de acción particulares para visualizar el
estado de las aplicaciones de negocios.
1.
La solución
cuenta con un mecanismo para examinar los incidentes abiertos, eliminarlos, obtener gráficos y tablas
detallados relacionados con los mismos, poder generar reportes y realizar la
modificación de parámetros principales del sistema sin estar presentes en el
centro de monitoreo.
2.
La solución
provee para este requerimiento con una combinación de las siguientes
estrategias: consolas de operación,
acceso al software ofertado por medio de un esquema cliente servidor, interfase Internet / Intranet segura, etc.
3.
Esto por cuanto
esta herramienta tiene una cobertura total de la institución y por lo tanto es
necesario que funcionarios de múltiples áreas y ubicaciones físicas
relacionados con Tecnología de Información puedan utilizar el sistema para
monitoreo, diagnóstico y detección de incidentes desde sus estaciones de
trabajo o en donde se encuentren en la institución a la hora de un suceso sin
los inconvenientes de tener que utilizar únicamente las consolas del sistema.
La solución cuenta con mecanismos de notificación de incidentes para
garantizar la pronta atención y comunicación de los incidentes que comprometen
la continuidad de negocios y el servicio al cliente, a través de los siguientes
medios:
1.
Consola de
Operación
2.
Envío de correo
electrónicos
3.
Envío de
mensajes vía beeper o mensajes a teléfonos celulares
4.
Notificación vía
mensajes textuales a estaciones de trabajo especificas dentro de la red de la institución
utilizando mecanismos de mensajería directa de la red.
5.
Notificación
audible (Frases tipo "WAV" o similares) a estaciones específicas para aviso de
alarmas importantes.
6.
Notificación a
personal relacionado con los incidentes, a saber, operadores, personal técnico especializado,
supervisores, jefes de áreas, usuarios finales, para cada tipo de incidente,
grado de severidad encontrado y capacidad para definición en forma
personalizada de cada tipo de incidente, estado de gravedad del incidente para servidor o pieza tecnológica
monitoreada.
7.
Permite la
personalización de estos mensajes para cada tipo de notificación para cada
servidor requerido, permite el envío simultáneo a una o varias personas de
acuerdo a la gravedad del incidente ó el tiempo transcurrido después de la
notificación inicial.
8.
Cuenta con
mecanismos que permiten filtrar los incidentes producidos por eventos puntales
o instantáneos de aquellos eventos que realmente representan un problema al que
debe brindarse atención. Este mecanismo
es simple y puede ser modificado en cualquier momento por el administrador del
sistema.
9.
La configuración
de los mecanismos de notificación puede ser realizado por el
"administrador del sistema" en forma simple mediante cambio de
parámetros a través de la consola del sistema sin requerimientos de
programación o modificaciones al software.
10.
El objetivo es
contar con una flexibilidad tal, que permita a la institución ajustar la
herramienta a las cambiantes necesidades del monitoreo de plataformas tecnológicas
sin dependencias externas.
1.
El sistema
cuenta con un mecanismo de seguridad para controlar que servidores pueden ver,
administrar o modificar cada uno de los usuarios del sistema de monitoreo.
2.
El software
puede mostrar a los usuarios únicamente las partes de la plataforma tecnológica
de la institución a la cual tienen derecho a ver, administrar o monitorear.
3.
La solución pode
realizar el monitoreo de los servidores solicitados accesibles a través de firewalls o dispositivos de seguridad instalados en la
institución.
4.
El sistema
permite realizar el monitoreo en forma encriptada
para que entes no autorizados internos o externos a la institución estén
impedidos a obtener información que a la larga pueda representar riesgos de
seguridad para la institución.
1.
La herramienta
incluye una base de datos para el almacenamiento de los datos históricos
recolectados y su análisis retrospectivo.
2.
La solución
almacena por un tiempo definido por el administrador del sistema en lapsos de
tres meses hasta un mínimo de un año los datos recolectados de los equipos para
poder realizar análisis históricos.
3.
Los datos no
indispensables, pueden eliminarse automáticamente de la base de datos de
monitoreo para aprovechar el espacio en discos para los datos históricos.
1.
El software
cuenta con reportes predefinidos para todos y cada uno de los servidores
solicitados que se monitorean o cualquier combinación de ellas, sin importar
que dichas combinaciones sean datos básicos de servidores o aspectos monitoreables de distinta especie. Estos reportes se pueden componer de una
combinación de gráficos, tablas o ambos para cada aspecto capturado por el software
de monitoreo.
2.
El administrador
del sistema sin necesidad de programación o componentes adicionales a los ofertados, puede
seleccionar cualquier combinación de los datos capturados por la herramienta
para confeccionar el reporte personalizado que se requiera.
3.
Los reportes
pueden ser analizados en la consola de operación ó la interfase en Internet por
cualquier usuario con derechos de acceso a ellos.
4.
El software
puede enviar los reportes en forma recurrente
(todos los días, todas las semanas,
todos los meses, etc.) y automática a cualquier usuario de correo
electrónico de la institución en momentos predefinidos del tiempo. Esta facilidad es fácilmente modificable y
ajustable por el administrador del sistema.
5.
El rango de
análisis de los datos en los reportes generados por el software puede definirse
en lapsos de tiempo variables sin necesidad de modificar el formato del
reporte, a saber: inmediato, 1 hora, 2 horas, 4 horas, 1 día, 1 semana, 1 mes,
1 año o similares desde la consola o la interfase Internet.
6.
Los reportes son
generados en formatos que pueden ser enviados por medio de correo electrónico,
ser utilizados para su incorporación en informes y almacenaje histórico como
mínimo los siguientes formatos: HTML ó PDF.
Con esta solución se garantiza que cada uno de los servidores o piezas
tecnológicas monitoreadas pueden comunicarse con los elementos críticos de la
plataforma tecnológica de la institución validando las siete capas del modelo
OSI de comunicaciones desde una perspectiva de continuidad de las
comunicaciones necesarias para que las aplicaciones finales de usuario no
interrumpan su servicio.
En caso de detectarse una interrupción de la comunicación o que los
tiempos de respuesta excedan los umbrales normales de operación pre-establecidos de fábrica o designados por el
administrador del sistema, la solucion inicia un
mecanismo de notificación de este incidente.
Para cualquier servidor monitoreado por la herramienta esta provee la
facilidad para la validación de la disponibilidad y desempeño normal de los
siguientes aspectos relacionados con las comunicaciones de la institución:
1.
La herramienta
permite medir la disponibilidad de los
protocolos vitales en los servidores o piezas tecnológicas monitoreadas de la red tales como TCP/IP, Telnet, FTP, TNS Listener (Oracle), http, SMTP, SMNP, etc.
2.
La herramienta
mide la disponibilidad y tiempo de respuesta de servicios necesarios para
realizar en forma exitosa la comunicación TCP/IP dentro y fuera de la red de la
tales como LDAP, DNS, DHCP, etc.
3.
La herramienta
mide la disponibilidad de "servicios" o "procesos"
(Servicios o Procesos) vitales que deben estar activos en servidores designados
por el administrador del sistema con un número mínimo de instancias funcionales,
tales como por ejemplo: servicios DNS en un Active Directory, Servicio de HTTP
en un Web Server, Servidores de
conversión protocolos especializados (ej. SNA Services, Gateways
especializados, etc), componentes de Servidores de
Aplicaciones para servicios de Internet Interactivos (Microsoft .COM´s, Java Enterprise Java Beam´s (EJB´s), etc), Listeners de Bases de
Datos, Agentes de limpieza o profilaxis de la red (software Antivirus, Anti-span, detectores de
intrusos, controladores de uso de Internet (Websense), etc), software para realizar la programación de POS´s, etc.
4.
La herramienta
mide la Continuidad de Comunicaciones entre dos puntos cualesquiera de la red
de comunicaciones para garantizar la disponibilidad de los servicios de
comunicaciones de los medios de transporte subcontratados por la
institución.
5.
Esta medición
garantiza la disponibilidad de los medios de comunicación, que el camino
utilizado por dicha comunicación sea el correcto y que los tiempos necesarios
para recorrer cada tracto requerido en dicha comunicación se encuentren en los
umbrales de operación normal pre-establecidos.
6.
La herramienta
permite medir la disponibilidad y el desempeño de los dispositivos de
comunicaciones desde los servidores o piezas tecnológicas monitoreadas,
garantiza la accesibilidad a routers, switches, firewalls, etc.
7.
Las
comunicaciones desde una perspectiva global de una aplicación de usuario final
para así verificar todas las capas necesarias para una aplicación de usuario
final especifica.
8.
Dispositivos de
comunicación de red de los servidores monitoreados con información detallada de
su desempeño, velocidad de transmisión, errores, saturación y disponibilidad.
1.
La herramienta
permite medir y predecir a partir de los datos históricos los requerimientos
futuros de los aspectos más importantes de la infraestructura de servidores de
la plataforma tecnológica de la institución.
2.
Los datos
mínimos que puede proyectar son los siguientes:
a.
Utilización de
CPU del servidor
b.
Utilización de
Memoria del servidor
c.
Utilización de
Discos utilizados por el servidor
d.
Utilización de
Paginación en le servidor
3.
Estas mediciones
se generan por medio de reportes para uno o cualquier grupo de servidores monitoreados
por la herramienta ofertada.
4.
Los reportes
pueden ser obtenidos para períodos de análisis de un día, una semana, un mes,
varios meses o un año.
5.
Estos reportes
pueden ser definidos por el administrador del sistema a su discreción sin
necesidad de componentes adicionales a los ofertados o programación adicional a
la herramienta para así garantizar la independencia de la institución del
proveedor.
Objetivo:
Cumplir con la normativa de TI para Monitorear todos los servidores y equipos
críticos de la institución que utilizan sistema operativo Microsoft Windows
NT4.0 SP6, 2000, 2003 y Windows Cluster que efectivamente permita la detección proactiva y reactiva de los problemas a nivel de los
servidores de esta plataforma que comprometan la continuidad de las
aplicaciones criticas de la institución.
La herramienta permite monitorear todos los servidores de la
institución simultáneamente. La Solución cumple con todos los requerimientos
generales de un software de detección y específicamente con los siguientes requerimientos, a saber:
Captura de Datos y muestra en forma gráfica o de tablas los siguientes
aspectos para lograr el monitoreo de
cada sistema solicitado:
Sistema Operativo (CPU, Memoria y Procesos)
·
Resumen del
Sistema Operativo
o
Utilización del
CPU
o
Número de
Procesos ejecutándose
o
Porcentaje de
Memoria libre disponible
o
Porcentaje de
Memoria virtual libre
o
Porcentaje de
Memoria Cache
·
Utilización del
CPU
o
Utilización
Total del CPU
o
Utilización del CPU
del Sistema Operativo
o
Utilización del
CPU de los Usuarios
o
Longitud de cola
de procesos
o
Número de
procesos en ejecución
·
Procesos y
Servicios Críticos del Servidor
o
Grupos de
Procesos y Servicios que debe correr en el Servidor siempre.
o
Número de
instancias mínimo permitido de cada proceso o Servicio
·
Utilización del
CPU de los Procesos
o
Identificador
del proceso
o
Nombre del
usuario dueño del proceso
o
Consumo de
Recursos de CPU por proceso
·
Utilización de
Memoria de los Procesos
o
Identificador
del proceso
o
Nombre del
usuario dueño del proceso
o
Consumo de
Memoria fija por proceso
o
Consumo de
Memoria virtual por proceso
·
Utilización de
Recursos de Entrada y Salida de los Procesos
o
Identificador
del proceso
o
Nombre del
usuario dueño del proceso
o
Consumo de Kbytes por segundo por proceso
Discos Duros (Almacenamiento)
·
Resumen del
Almacenamiento en Discos del servidor
o
Porcentaje de
Utilización Total
o
Porcentaje de
Lecturas a Disco
o
Porcentaje de
Escrituras a Disco
·
Colas de Lectura
o Escritura de los discos del Servidor
o
Longitud de Cola
de escritura a disco
o
Longitud de Cola
de lectura a disco
·
Desempeño de
Lecturas y Escrituras de los discos del Servidor
o
Kbytes leídos por
segundo
o
Kbytes escritos a
disco por segundo
·
Controlador de
Dispositivo
o
Lecturas del Controlador
o
Escrituras del
Controlador
o
Tasa de
Transferencia del Controlador (Kb/seg)
o
Tiempo de
Servicio Total de Controlador
o
Porcentaje de
Utilización Real
·
Bitácora de
Eventos
o
Filtraje de
eventos y asignación correspondiente de alarma
en el software de diagnóstico con un grado definido de criticidad para
cada evento tipificado en las bitácoras.
o
Selección por
parte del administrador del sistema de bitácoras diversas del servidor para
incorporarlas en los mecanismos de detección del software.
o
El software
cuenta con la posibilidad de definir, filtrar e integrar las bitácoras de
software de infraestructura, servicios críticos (Web servers,
servidores de aplicación, gateways, etc) y de
aplicaciones finales de usuario que formen parte de una aplicación crítica para
la institución.
Discos Duros Lógicos
·
Resumen del
Almacenamiento en Discos lógicos del servidor (para cada disco lógico)
o
Porcentaje de
Utilización Total
o
Porcentaje
utilizado del Tiempo de Transferencia total
o
Porcentaje de
Lecturas a Disco Lógico
o
Porcentaje de
Escrituras a Disco Lógico
·
Colas de Lectura
o Escritura de los discos lógicos del Servidor
o
Longitud de Cola
de escritura a disco
o
Longitud de Cola
de lectura a disco
·
Desempeño de
Lecturas y Escrituras de los discos lógicos del Servidor
o
Kbytes leídos por
segundo
o
Kbytes escritos a
disco por segundo
File System Space
·
Resumen del File
Systems del servidor (para cada File System)
o
Porcentaje de
Espacio Utilizado
o
Porcentaje de
Espacio Libre
Utilización de Tarjetas de Comunicación de Red de Area
Local (NIC´s)
·
Resumen de uso
de las Tarjetas de Comunicación de LAN (NIC´s) del
servidor
o
Porcentaje de
Utilización de las NIC´s
o
Porcentaje de
Errores
o
Porcentaje de
Colisiones
·
Trafico de las
Tarjetas de Comunicación de LAN (NIC´s) del
servidor (por cada NIC)
o
Paquetes de
Entrada por segundo
o
Paquetes de
Salida por segundo
·
Errores de
Comunicación de las Tarjetas de Comunicación de LAN (NIC´s)
del servidor
(por cada NIC)
o
No. Errores de
Entrada
o
No. Errores de
Salida
·
Colisiones de
Comunicación de las Tarjetas de Comunicación de LAN (NIC´s)
del servidor
(por cada NIC)
o
No. Paquetes
transmitidos
o
No.
Colisiones
La solución cuenta con mecanismos de detección, control de alarmas y
mecanismos de notificación apropiada de acuerdo a umbrales predefinidos para
los componentes monitoreados para las siguientes situaciones anómalas
enumeradas:
·
Control de la
utilización del espacio libre en un File System del
servidor
·
Sobrecarga en la
utilización o consumo del CPU por los procesos ejecutándose en el servidor
·
Disponibilidad
de la paginación del servidor
·
Memoria
disponible para los procesos en ejecución
·
Alto porcentaje
de interrupciones provocados por contención en dispositivos de entrada y salida
·
Niveles críticos
de utilización de los discos instalados y
en uso por el servidor
·
Servicios
definidos por el administrador del sistema o drivers
críticos monitoreados que cambian de estado (ejecutándose / inactivo) o que dejan de estar disponibles
·
Errores
detectados en las bitácoras del Sistema Operativo
·
Tasa de
colisiones de tarjeta de comunicación de red de área local excedida de un
umbral definido por el administrador
·
Problemas en
la transmisión de paquetes de datos
("Diferidos") de una tarjeta de red de área local.
·
Error critico
designado por el administrador en entrada de una bitácora del sistema definido
por un una expresión regular o palabra clave.
·
Cuellos de
botella en la utilización de los discos y los controladores de almacenamiento
Objetivo:
Cumplir con la normativa de TI para Monitorear todos los servidores y
equipos críticos de la institución que utilizan SQL Server versión 7.0, 2000 ó
2005 sea en modalidad de servidor independiente o cluster de acuerdo a lo
establecido por Microsoft que efectivamente permita la detección proactiva y reactiva de los problemas a nivel de los
servidores de esta plataforma que comprometan la continuidad de las
aplicaciones críticas de la institución.
La herramienta permite monitorear todos los servidores de la
institución simultáneamente. La Solución cumple con todos los requerimientos generales
de un software de detección y específicamente con los siguientes requerimientos, a saber:
Captura de Datos permanente y muestra en forma gráfica o de tablas los
siguientes aspectos para lograr el monitoreo
de cada base de datos solicitada:
Almacenamiento
·
Resumen de
consumo de espacio en disco de los
archivos de datos ("Data Files") de una bases de datos SQL Server
o
Espacio
utilizado por archivo de datos
o
Espacio
disponible por archivo de datos
o
Crecimiento
potencial de los archivos de datos
·
Utilización de
archivos ("Files") para cada instancia de base de datos
o
MB´s Totales
asignados al "File"
o
MB´s usados en
"File"
o
MB ´s de crecimiento potencial del "File"
·
Utilización de
archivos ("File Groups") para cada
instancia de base de datos
o
MB´s Totales
asignados al "File Group"
o
MB´s usados en
"File Group"
o
MB ´s de crecimiento potencial del "File Group"
·
Crecimiento de Tablas
críticas de una base de datos a través del tiempo
o
Número de filas
en cada tabla especificada
o
Tamaño de la
tabla en MB
Conexiones
·
Control de licencias
conectadas a la instancia
o
Limite de
licencias concurrentes
o
Cantidad de
conexiones concurrentes
·
Control de usuarios
conectados a cada instancia de base de datos
o
Número de
usuarios conectados a cada instancia de base de datos
·
Control de nuevas
conexiones de usuarios a cada instancia de base de datos
o
Número de
usuarios conexiones nuevas a cada instancia de base de datos por segundo
Bloqueos (Deadlock´s)
·
Cantidad de bloqueos
en la instancia
o
Cantidad de deadlock´s por segundo.
o
Límite de tiempo
excedido ("Timeout") por segundo
o
Tiempo de espera
por bloqueo por segundo
·
Cantidad de
tiempo máximo de bloqueo en la instancia
o
Cantidad de
tiempo máximo de bloqueo en milisegundos
Memoria
·
Utilización de Memoria
total utilizada por instancia en MB´s
o
Consumo de
"buffer cache"
o
Free Lists
o
Área de
conexiones
o
Área de bloqueos
o
Áreas de
optimización
o
Áreas de Sort/Hash
o
Procedimientos
activos en cache
o
Total de
procedimientos en cache
·
Utilización de
memoria "Buffer Cache" utilizado por instancia
o
Consumo de
buffer cache
o
Páginas de
Buffer Cache Disponibles
·
Utilización de
memoria "Server Cache" utilizado por
instancia en MB´s
o
Porcentaje de hits positivos al "buffer Cache"
o
Porcentaje de hits positivos al "Procedure Cache"
Tiempo de Respuesta
·
Tiempo de
respuesta de la instancia
o
Tiempo de
respuesta en milisegundos a lo largo del tiempo
·
Cantidad de
Conexiones activos en la base de Datos
o
Conexiones del
"Sistema"
o
Conexiones de
usuarios
o
Conexiones de
usuarios activos
o
Conexiones de
usuarios inactivos
·
Estadísticas de
Compilaciones de estatutos SQL en la instancia
o
Tasa de
compilación de SQL por segundo
o
Tasa de recompilación de SQL por segundo
Bitácoras y Estadísticas
·
Bitácora de
transacciones de cada instancia
o
Espacio libre en
bitácoras
o
Espacio usado en
bitácoras
o
Potencial de
crecimiento posible de bitácoras
·
Estadísticas del SQL Server
o
Tasa de Procesos
batch por segundo
o
Tasa de
escrituras del Checkpoint por segundo
o
Tasa de
escrituras de Lazy-writer
por segundo
o
Tasa de Read-ahead pages
por segundo
o
Tasa de lecturas
sincrónicas por segundo
o
Tasa de
escrituras sincrónicas por segundo
La solución cuenta con mecanismos de
detección, alarmas y notificación apropiada de acuerdo a los umbrales predefinidos
para los componentes, situaciones anómalas detectadas para los siguientes
aspectos:
·
Base de datos no
activa
·
Control de
Actividad de los "Agentes de SQL Server"
o
Agent Mail
o
SQL Agent Mail
o
SQL Server Agent
o
Replication Agent
o
Distributed Transaction Coordinator
o
Full Text Search
o
OLAP Services
o
Cluster Services
·
SQL Server Cache Free Pages menor a un
umbral mínimo
·
SQL Server
Buffer Cache Hit menor a un umbral mínimo
·
Salida de
operación de uno de los miembros de un "Cluster SQL Server"
·
Estado de la
base de datos (se activa cuando una base de datos pasa a estado "Read Only" ó no esta
disponible)
·
Tiempo máximo de
respaldos de la base de datos a sido excedido
·
Detección de un
estado de "Deadlock" en la base de datos
·
Errores graves
detectados en las bitácoras de SQL Server
·
Job crítico
especificado con problemas de ejecución
·
Limite de
licencias de SQL Server excedido
·
Problema de
replicación detectado
·
Cantidad de
conexiones nuevas excedido
·
Tiempo máximo de
bloqueo de un proceso excedido
·
Cantidad máxima
de memoria asignada al SQL Server excede máximo de memoria física
·
Cantidad de
espacio de crecimiento de un Filegroup es menor a un
umbral mínimo definido
·
Cantidad de hits al "Procedure Cache" es menor a un umbral mínimo
·
Recopilaciones
de SQL´s exceden un umbral máximo permitido
·
Problemas o
conflictos detectados en el proceso de
replicación de la base de datos
·
Tiempo de
respuesta excede un umbral predefinido
Objetivo:
Cumplir con la normativa de TI para monitorear todos los servidores y
equipos críticos de la institución que utilizan un Web Server (Apache, Oracle http Server, IBM HTTP
Server, o cualquier versión de Apache) ya sea en modalidad de servidor
independiente o cluster para el sistema operativo Microsoft Windows 2000, 2003,
Windows Cluster, que efectivamente permita la detección proactiva
y reactiva de los problemas al nivel del Web Server de esta plataforma que comprometan la
continuidad de las aplicaciones críticas de la institución.
La herramienta permite monitorear a tiempo real o almacenar las
estadísticas recolectadas a través del tiempo de los Web Servers
indicados de la institución en forma simultánea. La solución cumple con todos
los requerimientos generales de un software de detección y específicamente
con los siguientes requerimientos, a saber:
Captura de Datos y mostrar en
forma gráfica o de tablas los siguientes aspectos para lograr el monitoreo o
detección de cada Web Server solicitado:
Desempeño
La Solución captura métricas sobre el desempeño del Web Server para
diagnosticar los siguientes aspectos:
·
Estadísticas de Errores del Web Server
o
Errores internos
o
Gateways malos
o
Requerimientos
fallidos (no encontrados)
o
Páginas movidas
permanentemente
o
Páginas movidas
temporalmente
o
Páginas no
encontradas
o
Servicios no
disponibles
o
Requerimientos
no autorizados
·
Estadísticas de Generales del Web Server
o
Hits por segundo
o
Errores por
segundo
o
Transacciones
por segundo
o
Desempeño del
Web Server (Kb transmitidos por segundo)
·
Estadísticas de Hits del Web
Server
o
N° Hits por intervalo de tiempo
·
Recursos tipo
Audio
·
CGI-BIN´s
·
Páginas HTML
·
Gráficos
·
Objetos JAVA
·
Objetos
Multimedia
·
Otro tipo de
objetos
o
N° hosts únicos por
intervalo de tiempo
o
N° Url únicos por intervalo de tiempo
·
Estadísticas de Transacciones del Web Server
o
N° Transacciones
por segundo
o
Kb´s de transmisión
por segundo
o
Tamaño promedio
de transacciones
o
Tipo de
transacción
·
Get
·
Put
·
Info
·
Estadísticas de Desempeño del Web Server
o
Velocidad (Kb por segundo)
o
Cantidad de
Información transmitida (Kb por intervalo de tiempo)
·
Objetos de Audio
·
Transacciones
CGI-BIN
·
Páginas HTML
·
Gráficos
·
Objetos JAVA
·
Objetos
Multimedia
·
Texto
·
Objetos Zippeados
·
Otro tipo de
objetos
·
Estadísticas de Disponibilidad del Web Server (Tiempo en
que se encuentra atendiendo requerimientos de usuarios)
o
Nombre del Host: Nombre o dirección IP del host
o
Indicación de
Disponibilidad del Web Server: Estados (No Disponible o Disponible).
·
Manejo de Peticiones
(por módulo)
o
Nombre del
Módulo
o
Número de
peticiones declinadas
o
Número de
Manijas (Handlers) activas
o
Número de
Manijas (Handlers) completadas
·
Duración de Peticiones
( por módulo )
o
Módulo: Nombre
del módulo (e.g. http_core.c)
o
Duración máxima
en el manipulador (Handler)
o
Duración
promedio en el manipulador (Handler)
o
Duración mínima
en el manipulador (Handler)
o
Tiempo máximo de
petición
o
Tiempo promedio
de petición
o
Tiempo mínimo de
petición
·
Cantidad de Procesos
o
Procesos Activos
o
Cantidad Máxima
de Procesos
(El número máximo de procesos permitido en el pool
para la instancia)
o
Procesos
Inactivos
·
Duración de Conexiones
(Para peticiones http)
o
Tiempo promedio
de conexión
o
Tiempo máximo de
conexión
o
Tiempo mínimo de
conexión
·
La utilización
de solicitudes de conexión activas para determinar la actividad actual
del Web Server
o
Conexiones
activas (abiertas)
o
Número de
módulos (dándole servicio a una petición http)
o
Solicitudes
activas (Número de servidores procesando una solicitud)
·
Tamaño del Heap
o
Nombre del Host: Nombre o dirección IP del host
o
Tamaño del Heap: Tamaño del Heap en uso por
el Web Server
La solución cuenta con mecanismos de
detección, alarmas y notificación apropiada de acuerdo a los umbrales
predefinidos para los componentes, situaciones anómalas detectadas para los
siguientes aspectos:
·
Interrupción de
la Disponibilidad del Web Server
·
Detección de
crecimiento anormal del Heap del servidor Web que
pueda darse como producto de programas que tengan “Memory
Leaks” (No liberación apropiada de memoria del
servidor)
·
Errores Críticos
o advertencias detectadas por el servidor Web que puedan poner en peligro la
continuidad operativa del servidor de Web, extraídas de las bitácoras del Web
Server.
[f1]Indicar la descripción del equipo
donde se instalará la herramienta de Monitoreo