Software de Detección para los servidores críticos de la institución, existentes  que prove mecanismos proactivos y reactivos para garantizar la continuidad de las aplicaciones vitales de nuestra institución.

 

Objetivo:

 

Adquirir una herramienta de software que a permita al personal de Tecnología de Información, a saber, los Administradores de las bases de datos, al personal de soporte, al personal de soporte a usuarios (Help Desk), a los usuarios finales responsables de las aplicaciones,  identificar en forma proactiva y reactiva, mediante una interfaz gráfica, fácil de utilizar que permita establecer una metodología efectiva e integrada para detectar los problemas de desempeño, disponibilidad, eficacia y eficiencia en los equipos servidores, plataformas tecnológicas varias, comunicaciones y sistemas operativos que conforman las aplicaciones criticas de la institución.

 

La institución requiere que la solución cubra la siguiente base instalada de servidores:

 

Servidores y Plataformas a monitorear:

 

Cant

Sistema Operativo

N° Proc.

Aplicación

1

MS Windows (NT, 2000 ó 2003)

2

SQL Server

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Se requiere que la herramienta ofertada sea cotizada tomando en cuenta que se requiere licenciamiento para que el siguiente personal de las diferentes áreas de la institución utilice las herramientas en forma continua, a saber:

 

 

Cant

Descripción

 

Administradores de Servidores Windows

 

Administradores de Infraestructura Microsoft (Active Directory)

 

Administradores de Exchange

 

Administradores de Bases de Datos Sybase

 

Administradores de Bases de Datos MS SQL Server

 

Operadores de centro de Monitoreo

 

Personal de Soporte a Usuarios/Help Desk

 

Auditores de Informática

 

Administradores de Aplicaciones

             

 


La solución ofrece las características que se enumeran a continuación:

1         Generalidades del software (Detección)

 

1.1      Facilidad de Instalación:

 

1.       La herramienta viene pre-programado y configurado de fábrica con los umbrales y conocimiento necesarios para la detección de problemas, anomalías, violación de buenas prácticas del fabricante de cada servidor monitoreado que se solicite. Viene listo para la detección de las circunstancias que puedan comprometer la continuidad del servicio de las plataformas tecnológicas monitoreadas.

 

2.       [f1] 

 

3.       La solución provee un mecanismo para ajustar los umbrales específicos de fábrica a las necesidades de la institución para cada servidor individual, grupos de servidores con características afines en forma simple y sin requerimientos de programación,  o sea a través de una interfase gráfica y modificación simple de parámetros.

 

4.       Este hecho puede comprobarse fácilmente para cualquier aspecto de  monitoreo solicitado. Para la institución es indispensable obtener resultados en forma expedita de la solución adquirida para obtener un beneficio inmediato de esta inversión.

 

5.       La solución se entrega completamente instalada de acuerdo a las normas del fabricante en nuestra institución para la población de servidores indicados anteriormente.

 

6.       La instalación de los componentes de la herramienta se realiza desde el centro de monitoreo de nuestras oficinas centrales, de forma tal que no sea necesario el trasladar personal o medios (CD´s, DVD´s, disquettes u otros) al sitio en donde se encuentra la pieza o capa tecnológica a monitorear.  Esto aplica a todo servidor  solicitado  (Sistemas Operativos, Dispositivos de comunicación, Bases de Datos, Servidores de Internet, etc).

 

7.       Esta facilidad es necesaria puesto que los equipos de la institución se encuentran dispersos en todo el país y deseamos evitar los costos directos, así como el tiempo requeridos por una instalación que requiera presencia física de nuestro personal o personal de proveedor.

 

8.       Los requisitos de puertos de comunicación requeridos en un ambiente seguro institucional, las estrategias para obtención de información necesaria para el monitoreo en un ambiente que cuenta con firewalls, y los protocolos necesarios que deben habilitarse para que el software funcione correctamente son los siguientes:

 

 

1.2      Impacto en dispositivos monitoreados:

 

1.       Las mediciones deben tomarse en el equipo monitoreado con un mínimo de impacto en el desempeño del mismo.  La solución no excede un 3% para cualquier parámetro monitoreado de cualquier tipo de servidor solicitado (Sistemas Operativos, Dispositivos de comunicación, Bases de Datos, Servidores de Internet, etc).

 

2.       La taza de obtención de información de cada dispositivo o pieza tecnológica monitoreada puede regularse fácilmente mediante modificación de parámetros en la consola o mediante una interfase gráfica que permite la modificación de parámetros del sistema de monitoreo por parte del administrador del sistema para controlar el impacto en la red y el dispositivo monitoreado.

 

1.3      Consola de Monitoreo

 

1.       La solución cuenta con un mínimo de 10 consolas que permitirán al centro de monitoreo de la institución visualizar las alarmas de los incidentes detectados, borrarlas y ver los detalles específicos relacionados con cada evento en forma gráfica, en forma de tablas o través de reportes (prediseñados de fábrica o diseñados a discreción del administrador del sistema) para lograr una efectiva detección, diagnóstico y resolución de los incidentes que ocurran en cualquier aspecto de la plataforma tecnológica.

 

2.       La herramienta cuenta con un mecanismo que permite a diferentes grupos relacionados con la continuidad de las aplicaciones de negocios (infraestructura tecnológica, administradores de bases de datos, soporte a usuarios, comunicaciones, personal de campo, etc) puedan acceder la información pertinente a cada uno de sus ámbitos de acción particulares para visualizar el estado de las aplicaciones de negocios. 

 

1.       La solución cuenta con un mecanismo para examinar los incidentes abiertos,  eliminarlos, obtener gráficos y tablas detallados relacionados con los mismos, poder generar reportes y realizar la modificación de parámetros principales del sistema sin estar presentes en el centro de monitoreo.

 

2.       La solución provee para este requerimiento con una combinación de las siguientes estrategias: consolas de operación,  acceso al software ofertado por medio de un esquema cliente servidor,  interfase Internet / Intranet segura, etc.

 

3.       Esto por cuanto esta herramienta tiene una cobertura total de la institución y por lo tanto es necesario que funcionarios de múltiples áreas y ubicaciones físicas relacionados con Tecnología de Información puedan utilizar el sistema para monitoreo, diagnóstico y detección de incidentes desde sus estaciones de trabajo o en donde se encuentren en la institución a la hora de un suceso sin los inconvenientes de tener que utilizar únicamente las consolas del sistema.

1.1      Mecanismos de Notificación:

 

La solución cuenta con mecanismos de notificación de incidentes para garantizar la pronta atención y comunicación de los incidentes que comprometen la continuidad de negocios y el servicio al cliente, a través de los siguientes medios:

 

1.       Consola de Operación

 

2.       Envío de correo electrónicos

 

3.       Envío de mensajes vía beeper o mensajes a teléfonos celulares

 

4.       Notificación vía mensajes textuales a estaciones de trabajo especificas dentro de la red de la institución utilizando mecanismos de mensajería directa de la red.

 

5.       Notificación audible (Frases tipo "WAV" o similares)  a estaciones específicas para aviso de alarmas importantes.

 

6.       Notificación a personal relacionado con los incidentes, a saber,  operadores, personal técnico especializado, supervisores, jefes de áreas, usuarios finales, para cada tipo de incidente, grado de severidad encontrado y capacidad para definición en forma personalizada de cada tipo de incidente, estado de gravedad del incidente para  servidor o pieza tecnológica monitoreada. 

 

7.       Permite la personalización de estos mensajes para cada tipo de notificación para cada servidor requerido, permite el envío simultáneo a una o varias personas de acuerdo a la gravedad del incidente ó el tiempo transcurrido después de la notificación inicial.

 

8.       Cuenta con mecanismos que permiten filtrar los incidentes producidos por eventos puntales o instantáneos de aquellos eventos que realmente representan un problema al que debe brindarse atención.  Este mecanismo es simple y puede ser modificado en cualquier momento por el administrador del sistema.

 

9.       La configuración de los mecanismos de notificación puede ser realizado por el "administrador del sistema" en forma simple mediante cambio de parámetros a través de la consola del sistema sin requerimientos de programación o modificaciones al software.

 

10.   El objetivo es contar con una flexibilidad tal, que permita a la institución ajustar la herramienta a las cambiantes necesidades del monitoreo de plataformas tecnológicas sin dependencias externas.

 

 

1.2      Seguridad: 

 

1.       El sistema cuenta con un mecanismo de seguridad para controlar que servidores pueden ver, administrar o modificar cada uno de los usuarios del sistema de monitoreo. 

 

2.       El software puede mostrar a los usuarios únicamente las partes de la plataforma tecnológica de la institución a la cual tienen derecho a ver, administrar o monitorear.

 

3.       La solución pode realizar el monitoreo de los servidores solicitados accesibles a través de firewalls o dispositivos de seguridad instalados en la institución.

 

4.       El sistema permite realizar el monitoreo en forma encriptada para que entes no autorizados internos o externos a la institución estén impedidos a obtener información que a la larga pueda representar riesgos de seguridad para la institución.

 

1.3      Base de Datos y Almacenamiento de los Datos Históricos:

 

1.       La herramienta incluye una base de datos para el almacenamiento de los datos históricos recolectados y su análisis retrospectivo.

 

2.       La solución almacena por un tiempo definido por el administrador del sistema en lapsos de tres meses hasta un mínimo de un año los datos recolectados de los equipos para poder realizar análisis históricos.

 

3.       Los datos no indispensables, pueden eliminarse automáticamente de la base de datos de monitoreo para aprovechar el espacio en discos para los datos históricos.

 

1.4      Reportes

 

1.       El software cuenta con reportes predefinidos para todos y cada uno de los servidores solicitados que se monitorean o cualquier combinación de ellas, sin importar que dichas combinaciones sean datos básicos de servidores o aspectos monitoreables de distinta especie.  Estos reportes se pueden componer de una combinación de gráficos, tablas o ambos para cada aspecto capturado por el software de monitoreo.

 

2.       El administrador del sistema sin necesidad de programación o componentes  adicionales a los ofertados, puede seleccionar cualquier combinación de los datos capturados por la herramienta para confeccionar el reporte personalizado que se requiera.

 

3.       Los reportes pueden ser analizados en la consola de operación ó la interfase en Internet por cualquier usuario con derechos de acceso a ellos.

 

4.       El software puede enviar los reportes en forma recurrente  (todos los días, todas las semanas,  todos los meses, etc.) y automática a cualquier usuario de correo electrónico de la institución en momentos predefinidos del tiempo.  Esta facilidad es fácilmente modificable y ajustable por el administrador del sistema.

 

5.       El rango de análisis de los datos en los reportes generados por el software puede definirse en lapsos de tiempo variables sin necesidad de modificar el formato del reporte, a saber: inmediato, 1 hora, 2 horas, 4 horas, 1 día, 1 semana, 1 mes, 1 año o similares desde la consola o la interfase Internet.

 

6.       Los reportes son generados en formatos que pueden ser enviados por medio de correo electrónico, ser utilizados para su incorporación en informes y almacenaje histórico como mínimo los siguientes formatos: HTML ó PDF.

 

1.5      Comunicaciones

 

Con esta solución se garantiza que cada uno de los servidores o piezas tecnológicas monitoreadas pueden comunicarse con los elementos críticos de la plataforma tecnológica de la institución validando las siete capas del modelo OSI de comunicaciones desde una perspectiva de continuidad de las comunicaciones necesarias para que las aplicaciones finales de usuario no interrumpan su servicio.

 

En caso de detectarse una interrupción de la comunicación o que los tiempos de respuesta excedan los umbrales normales de operación pre-establecidos de fábrica o designados por el administrador del sistema, la solucion inicia un mecanismo de notificación de este incidente.

 

Para cualquier servidor monitoreado por la herramienta esta provee la facilidad para la validación de la disponibilidad y desempeño normal de los siguientes aspectos relacionados con las comunicaciones de la institución:

 

1.       La herramienta permite medir la disponibilidad de los  protocolos vitales en los servidores o piezas tecnológicas  monitoreadas de la red tales como TCP/IP, Telnet, FTP, TNS Listener (Oracle), http, SMTP, SMNP, etc.

 

2.       La herramienta mide la disponibilidad y tiempo de respuesta de servicios necesarios para realizar en forma exitosa la comunicación TCP/IP dentro y fuera de la red de la tales como LDAP, DNS, DHCP, etc.

 

3.       La herramienta mide la disponibilidad de "servicios" o "procesos" (Servicios o Procesos) vitales que deben estar activos en servidores designados por el administrador del sistema con un número mínimo de instancias funcionales, tales como por ejemplo: servicios DNS en un Active Directory, Servicio de HTTP en un  Web Server, Servidores de conversión protocolos especializados (ej. SNA Services, Gateways especializados, etc), componentes de Servidores de Aplicaciones para servicios de Internet Interactivos (Microsoft .COM´s, Java Enterprise Java Beam´s (EJB´s), etc), Listeners de Bases de Datos, Agentes de limpieza o profilaxis de la red (software Antivirus, Anti-span, detectores de intrusos, controladores de uso de Internet (Websense),  etc),  software para realizar la programación de POS´s, etc.

 

4.       La herramienta mide la Continuidad de Comunicaciones entre dos puntos cualesquiera de la red de comunicaciones para garantizar la disponibilidad de los servicios de comunicaciones de los medios de transporte subcontratados por la institución. 

 

5.       Esta medición garantiza la disponibilidad de los medios de comunicación, que el camino utilizado por dicha comunicación sea el correcto y que los tiempos necesarios para recorrer cada tracto requerido en dicha comunicación se encuentren en los umbrales de operación normal pre-establecidos.

 

6.       La herramienta permite medir la disponibilidad y el desempeño de los dispositivos de comunicaciones desde los servidores o piezas tecnológicas monitoreadas, garantiza la accesibilidad a routers, switches, firewalls, etc.

 

7.       Las comunicaciones desde una perspectiva global de una aplicación de usuario final para así verificar todas las capas necesarias para una aplicación de usuario final especifica.

 

8.       Dispositivos de comunicación de red de los servidores monitoreados con información detallada de su desempeño, velocidad de transmisión, errores, saturación y disponibilidad.

 

1.6        Planeamiento de Capacidades futuras: "Capacity Planning"

 

1.       La herramienta permite medir y predecir a partir de los datos históricos los requerimientos futuros de los aspectos más importantes de la infraestructura de servidores de la plataforma tecnológica de la institución.

 

2.       Los datos mínimos que puede proyectar son los siguientes:

 

a.       Utilización de CPU del servidor

b.      Utilización de Memoria del servidor

c.       Utilización de Discos utilizados por el servidor

d.      Utilización de Paginación en le servidor

 

3.       Estas mediciones se generan por medio de reportes para uno o cualquier grupo de servidores monitoreados por la herramienta ofertada.

 

4.       Los reportes pueden ser obtenidos para períodos de análisis de un día, una semana, un mes, varios meses o un año.

 

5.       Estos reportes pueden ser definidos por el administrador del sistema a su discreción sin necesidad de componentes adicionales a los ofertados o programación adicional a la herramienta para así garantizar la independencia de la institución del proveedor.

 

1.7        Medición de los Niveles de Servicio Acordados “SLA’s”

1.       La herramienta permite medir a partir de los datos históricos determinar el nivel de servicio de los sistemas operativos de los servidores críticos de la institución.

2.       Para cada medición de nivel de servicio acordado, la herramienta puede generar un reporte que calcule el nivel de servicio total de cada aplicación requerida, esta definición puede realizarla el Administrador del Sistema sin requerimientos de programación o integración de otros componentes distintos a la herramienta ofertada. 

3.       En el calculo del nivel de servicio acordado la herramienta cuenta con mecanismos que permiten al administrador designar tiempos pre-definidos de labores de mantenimiento o tiempo fuera de servicio definidos por la administración de tecnologia de Información o el dueño de la aplicación de tal suerte  que a la hora de calcular el nivel de servicio acordado no deben considerarse como “interrupción del servicio”. 

4.       La definición de los elementos que componen el nivel de servicio deben pueden ser definidas por el administrador del sistema caso a caso sin necesidad de programación o herramientas adicionales para las aplicaciones monitoreadas por la herramienta.

5.       La herramienta ofertada cuenta con la capacidad de correlacionar diversos aspectos de la plataforma tecnológica de una aplicación crítica para realizar una medición integral de todos los elementos críticos que afectan el nivel de servicio acordado, a saber,  comunicaciones, servidor, software de base de datos, servidores de aplicaciones, correo electrónico, sistemas operativos.

 


2         Áreas de Cumplimiento Especificas

 

2.1      Sistema Operativo Windows (NT 4.0, 2000, 2003, Windows Cluster)

 

Objetivo:

 

Cumplir con la normativa de TI para Monitorear todos los servidores y equipos críticos de la institución que utilizan sistema operativo Microsoft Windows NT4.0 SP6, 2000, 2003 y Windows Cluster que efectivamente permita la detección proactiva y reactiva de los problemas a nivel de los servidores de esta plataforma que comprometan la continuidad de las aplicaciones criticas de la institución.

 

2.1.1        Detección

 

La herramienta permite monitorear todos los servidores de la institución simultáneamente. La Solución cumple con todos los requerimientos generales de un software de detección y específicamente con  los siguientes requerimientos,  a saber:

 

Captura de Datos y muestra en forma gráfica o de tablas los siguientes aspectos para lograr el monitoreo  de cada sistema solicitado:

 

Sistema Operativo (CPU, Memoria y Procesos)

 

·         Resumen del Sistema Operativo

o        Utilización del CPU

o        Número de Procesos ejecutándose

o        Porcentaje de Memoria libre disponible

o        Porcentaje de Memoria virtual libre

o        Porcentaje de Memoria Cache

 

·         Utilización del CPU

o        Utilización Total del CPU

o        Utilización del CPU del Sistema Operativo

o        Utilización del CPU de los Usuarios

o        Longitud de cola de procesos

o        Número de procesos en ejecución

 

·         Procesos y Servicios Críticos del Servidor

o        Grupos de Procesos y Servicios que debe correr en el Servidor siempre.

o        Número de instancias mínimo permitido de cada proceso o Servicio

 

·         Utilización del CPU de los Procesos

o        Identificador del proceso

o        Nombre del usuario dueño del proceso

o        Consumo de Recursos de CPU por proceso

 

·         Utilización de Memoria de los Procesos

o        Identificador del proceso

o        Nombre del usuario dueño del proceso

o        Consumo de Memoria fija por proceso

o        Consumo de Memoria virtual por proceso

 

·         Utilización de Recursos de Entrada y Salida de los Procesos

o        Identificador del proceso

o        Nombre del usuario dueño del proceso

o        Consumo de Kbytes por segundo por proceso

 

Discos Duros (Almacenamiento)

 

·         Resumen del Almacenamiento en Discos del servidor

o        Porcentaje de Utilización Total

o        Porcentaje de Lecturas a Disco

o        Porcentaje de Escrituras a Disco

 

·         Colas de Lectura o Escritura de los discos del Servidor

o        Longitud de Cola de escritura a disco

o        Longitud de Cola de lectura a disco

 

·         Desempeño de Lecturas y Escrituras de los discos del Servidor

o        Kbytes leídos por segundo

o        Kbytes escritos a disco por segundo

 

·         Controlador de Dispositivo

o        Lecturas del Controlador

o        Escrituras del Controlador

o        Tasa de Transferencia del Controlador (Kb/seg)

o        Tiempo de Servicio Total de Controlador

o        Porcentaje de Utilización Real

 

·         Bitácora de Eventos

o        Filtraje de eventos y asignación correspondiente de alarma  en el software de diagnóstico con un grado definido de criticidad para cada evento tipificado en las bitácoras.

o        Selección por parte del administrador del sistema de bitácoras diversas del servidor para incorporarlas en los mecanismos de detección del software.

o        El software cuenta con la posibilidad de definir, filtrar e integrar las bitácoras de software de infraestructura, servicios críticos (Web servers, servidores de aplicación, gateways, etc)  y de aplicaciones finales de usuario que formen parte de una aplicación crítica para la institución.

 

Discos Duros  Lógicos

 

·         Resumen del Almacenamiento en Discos lógicos del servidor (para cada disco lógico)

o        Porcentaje de Utilización Total

o        Porcentaje utilizado del Tiempo de Transferencia total 

o        Porcentaje de Lecturas a Disco Lógico

o        Porcentaje de Escrituras a Disco Lógico

 

·         Colas de Lectura o Escritura de los discos lógicos del Servidor

o        Longitud de Cola de escritura a disco

o        Longitud de Cola de lectura a disco

 

·         Desempeño de Lecturas y Escrituras de los discos lógicos del Servidor

o        Kbytes leídos por segundo

o        Kbytes escritos a disco por segundo

 

 

File System Space 

 

·         Resumen del File Systems del servidor (para cada File System)

o        Porcentaje de Espacio Utilizado

o        Porcentaje de Espacio Libre

 

Utilización de Tarjetas de Comunicación de Red de Area Local (NIC´s)

 

·         Resumen de uso de las Tarjetas de Comunicación de LAN (NIC´s) del servidor

o        Porcentaje de Utilización de las NIC´s

o        Porcentaje de Errores

o        Porcentaje de Colisiones

 

·         Trafico de las Tarjetas de Comunicación de LAN (NIC´s) del servidor  (por cada NIC)

o        Paquetes de Entrada por segundo

o        Paquetes de Salida por segundo

 

·         Errores de Comunicación de las Tarjetas de Comunicación de LAN (NIC´s) del servidor 
(por cada NIC)

o        No. Errores de Entrada

o        No. Errores de Salida

 

·         Colisiones de Comunicación de las Tarjetas de Comunicación de LAN (NIC´s) del servidor 
(por cada NIC)

o        No. Paquetes transmitidos

o        No. Colisiones 

 

La solución cuenta con mecanismos de detección, control de alarmas y mecanismos de notificación apropiada de acuerdo a umbrales predefinidos para los componentes monitoreados para las siguientes situaciones anómalas enumeradas:

 

·         Control de la utilización del espacio libre en un File System del servidor

·         Sobrecarga en la utilización o consumo del CPU por los procesos ejecutándose en el servidor

·         Disponibilidad de  la paginación del servidor

·         Memoria disponible para los procesos en ejecución

·         Alto porcentaje de interrupciones provocados por contención en dispositivos de entrada y salida

·         Niveles críticos de utilización de los discos instalados y  en uso por el servidor

·         Servicios definidos por el administrador del sistema o drivers críticos monitoreados que cambian de estado (ejecutándose / inactivo)  o que dejan de estar disponibles

·         Errores detectados en las bitácoras del Sistema Operativo

·         Tasa de colisiones de tarjeta de comunicación de red de área local excedida de un umbral definido por el administrador

·         Problemas en la  transmisión de paquetes de datos ("Diferidos") de una tarjeta de red de área local.

·         Error critico designado por el administrador en entrada de una bitácora del sistema definido por un una expresión regular o palabra clave.

·         Cuellos de botella en la utilización de los discos y los controladores de almacenamiento

 

 

 

 

 

 

 

 


 

2.2      Base de Datos Microsoft SQL Server (Versión 7.0,  2000, 2005 o Microsoft Cluster para SQL Server)

 

Objetivo:

 

Cumplir con la normativa de TI para Monitorear todos los servidores y equipos críticos de la institución que utilizan SQL Server versión 7.0, 2000 ó 2005 sea en modalidad de servidor independiente o cluster de acuerdo a lo establecido por Microsoft que efectivamente permita la detección proactiva y reactiva de los problemas a nivel de los servidores de esta plataforma que comprometan la continuidad de las aplicaciones críticas de la institución.

 

2.2.1        Detección

 

La herramienta permite monitorear todos los servidores de la institución simultáneamente. La Solución cumple con todos los requerimientos generales de un software de detección y específicamente con  los siguientes requerimientos,  a saber:

 

Captura de Datos permanente y muestra en forma gráfica o de tablas los siguientes aspectos para lograr el monitoreo  de cada base de datos solicitada:

 

Almacenamiento

 

·         Resumen de consumo de  espacio en disco de los archivos de datos ("Data Files") de una bases de datos SQL Server

o        Espacio utilizado  por archivo de datos

o        Espacio disponible por archivo de datos

o        Crecimiento potencial de los archivos de datos

 

·         Utilización de archivos ("Files") para cada instancia de base de datos

o        MB´s Totales asignados al "File"

o        MB´s usados en "File"

o        MB ´s de crecimiento potencial del "File"

 

·         Utilización de archivos ("File Groups") para cada instancia de base de datos

o        MB´s Totales asignados al "File Group"

o        MB´s usados en "File Group"

o        MB ´s de crecimiento potencial del "File Group"

 

·         Crecimiento de Tablas críticas de una base de datos a través del tiempo

o        Número de filas en cada tabla especificada

o        Tamaño de la tabla en MB

 

Conexiones

 

·         Control de licencias conectadas a la instancia

o        Limite de licencias concurrentes

o        Cantidad de conexiones concurrentes

 

·         Control de usuarios conectados a cada instancia de base de datos

o        Número de usuarios conectados a cada instancia de base de datos

 

·         Control de nuevas conexiones de usuarios a cada instancia de base de datos

o        Número de usuarios conexiones nuevas a cada instancia de base de datos por segundo

 

Bloqueos (Deadlock´s)

 

·         Cantidad de bloqueos en la instancia

o        Cantidad de deadlock´s por segundo.

o        Límite de tiempo excedido ("Timeout") por segundo

o        Tiempo de espera por bloqueo por segundo

 

·         Cantidad de tiempo máximo de bloqueo en la instancia

o        Cantidad de tiempo máximo de bloqueo en milisegundos

 

Memoria

 

·         Utilización de Memoria total utilizada por instancia en MB´s

o        Consumo de "buffer cache"

o        Free Lists

o        Área de conexiones

o        Área de bloqueos

o        Áreas de optimización

o        Áreas de Sort/Hash

o        Procedimientos activos en cache

o        Total de procedimientos en cache

 

·         Utilización de memoria "Buffer Cache"  utilizado por instancia

o        Consumo de buffer cache

o        Páginas de Buffer Cache Disponibles

 

·         Utilización de memoria "Server Cache" utilizado por instancia en MB´s

o        Porcentaje de hits positivos al "buffer Cache"

o        Porcentaje de hits positivos al "Procedure  Cache"

 

 

Tiempo de Respuesta

 

·         Tiempo de respuesta de la instancia

o        Tiempo de respuesta en milisegundos a lo largo del tiempo

 

·         Cantidad de Conexiones  activos en la base de Datos

o        Conexiones del "Sistema"

o        Conexiones de usuarios

o        Conexiones de usuarios activos

o        Conexiones de usuarios inactivos

 

·         Estadísticas de Compilaciones de estatutos SQL en la instancia

o        Tasa de compilación de SQL por segundo

o        Tasa de recompilación de SQL por segundo

 

Bitácoras y Estadísticas

 

·         Bitácora de transacciones de cada instancia

o        Espacio libre en bitácoras

o        Espacio usado en bitácoras

o        Potencial de crecimiento posible de bitácoras

 

·         Estadísticas del SQL Server 

o        Tasa de Procesos batch por segundo

o        Tasa de escrituras del Checkpoint por segundo

o        Tasa de escrituras de Lazy-writer por segundo

o        Tasa de Read-ahead pages por segundo

o        Tasa de lecturas sincrónicas por segundo

o        Tasa de escrituras sincrónicas por segundo

 

La solución cuenta con mecanismos de detección, alarmas y notificación apropiada de acuerdo a los umbrales predefinidos para los componentes, situaciones anómalas detectadas para los siguientes aspectos:

 

·         Base de datos no activa

·         Control de Actividad de los "Agentes de SQL Server"

o        Agent Mail

o        SQL Agent Mail

o        SQL Server Agent

o        Replication Agent

o        Distributed Transaction Coordinator

o        Full Text Search

o        OLAP Services

o        Cluster Services

 

·         SQL Server Cache Free Pages menor a un umbral mínimo

·         SQL Server Buffer Cache Hit menor a un umbral mínimo

·         Salida de operación de uno de los miembros de un "Cluster SQL Server"

·         Estado de la base de datos (se activa cuando una base de datos pasa a estado "Read Only" ó no esta disponible)

·         Tiempo máximo de respaldos de la base de datos a sido excedido

·         Detección de un estado de "Deadlock" en la base de datos

·         Errores graves detectados en las bitácoras de SQL Server

·         Job crítico especificado con problemas de ejecución

·         Limite de licencias de SQL Server excedido

·         Problema de replicación detectado

·         Cantidad de conexiones nuevas excedido

·         Tiempo máximo de bloqueo de un proceso excedido

·         Cantidad máxima de memoria asignada al SQL Server excede máximo de memoria física

·         Cantidad de espacio de crecimiento de un Filegroup es menor a un umbral mínimo definido

·         Cantidad de hits al "Procedure Cache" es menor a un umbral mínimo

·         Recopilaciones de SQL´s exceden un umbral máximo permitido

·         Problemas o conflictos  detectados en el proceso de replicación de la base de datos

·         Tiempo de respuesta excede un umbral predefinido

 

 

 

 

 


2.3      Web Servers (IIS, Apache, IBM HTTP Server)

 

Objetivo:

 

Cumplir con la normativa de TI para monitorear todos los servidores y equipos críticos de la institución que utilizan un Web Server (Apache, Oracle http Server, IBM HTTP Server, o cualquier versión de Apache) ya sea en modalidad de servidor independiente o cluster para el sistema operativo Microsoft Windows 2000, 2003, Windows Cluster, que efectivamente permita la detección proactiva y reactiva de los problemas al nivel del Web Server  de esta plataforma que comprometan la continuidad de las aplicaciones críticas de la institución.

 

2.3.1        Detección para Web Servers

 

La herramienta permite monitorear a tiempo real o almacenar las estadísticas recolectadas a través del tiempo de los Web Servers indicados de la institución en forma simultánea. La solución cumple con todos los requerimientos generales de un software de detección y específicamente con  los siguientes requerimientos,  a saber:

 

Captura de Datos  y mostrar en forma gráfica o de tablas los siguientes aspectos para lograr el monitoreo o detección de cada Web Server solicitado:

 

Desempeño

 

La Solución captura métricas sobre el desempeño del Web Server para diagnosticar los siguientes aspectos:

 

·         Estadísticas de Errores del Web Server

 

o        Errores internos

o        Gateways malos

o        Requerimientos fallidos (no encontrados)

o        Páginas movidas permanentemente

o        Páginas movidas temporalmente

o        Páginas no encontradas

o        Servicios no disponibles

o        Requerimientos no autorizados

 

·         Estadísticas de Generales del Web Server

 

o        Hits por segundo

o        Errores por segundo

o        Transacciones por segundo

o        Desempeño del Web Server (Kb transmitidos por segundo)

 

·         Estadísticas de Hits del Web Server

 

o        Hits por intervalo de tiempo

·         Recursos tipo Audio

·         CGI-BIN´s

·         Páginas HTML

·         Gráficos

·         Objetos JAVA

·         Objetos Multimedia

·         Otro tipo de objetos

 

o          hosts únicos por intervalo de tiempo

o        Url únicos por intervalo de tiempo

 

·         Estadísticas de Transacciones del Web Server

 

o        Transacciones por segundo

o        Kb´s de transmisión por segundo

o        Tamaño promedio de transacciones

o        Tipo de transacción

·         Get

·         Put

·         Info

 

·         Estadísticas de Desempeño del Web Server

o        Velocidad (Kb por segundo)

o        Cantidad de Información transmitida (Kb por intervalo de tiempo)

·         Objetos de Audio

·         Transacciones CGI-BIN

·         Páginas HTML

·         Gráficos

·         Objetos JAVA

·         Objetos Multimedia

·         Texto

·         Objetos Zippeados

·         Otro tipo de objetos

 

·         Estadísticas de Disponibilidad del Web Server (Tiempo en que se encuentra atendiendo requerimientos de usuarios)

 

o        Nombre del Host: Nombre o dirección IP del host

o        Indicación de Disponibilidad del Web Server: Estados (No Disponible o Disponible).

 

·         Manejo de Peticiones (por módulo)

 

o        Nombre del Módulo

o        Número de peticiones declinadas

o        Número de Manijas (Handlers) activas

o        Número de Manijas (Handlers) completadas

 

·         Duración de Peticiones ( por módulo )

 

o        Módulo: Nombre del módulo (e.g. http_core.c)

o        Duración máxima en el manipulador (Handler)

o        Duración promedio en el manipulador (Handler)

o        Duración mínima en el manipulador (Handler)

o        Tiempo máximo de petición

o        Tiempo promedio de petición

o        Tiempo mínimo de petición

 

 

 

·         Cantidad de Procesos

 

o        Procesos Activos

o        Cantidad Máxima de Procesos

(El número máximo de procesos permitido en el pool para la instancia)

o        Procesos Inactivos

 

·         Duración de Conexiones (Para peticiones http)

 

o        Tiempo promedio de conexión

o        Tiempo máximo de conexión

o        Tiempo mínimo de conexión

 

·         La utilización de solicitudes de conexión activas para determinar la actividad actual del Web Server

 

o        Conexiones activas (abiertas)

o        Número de módulos (dándole servicio a una petición http)

o        Solicitudes activas (Número de servidores procesando una solicitud)

 

·         Tamaño del Heap

 

o        Nombre del Host: Nombre o dirección IP del host

o        Tamaño del Heap: Tamaño del Heap en uso por el Web Server

 

 

La solución cuenta con mecanismos de detección, alarmas y notificación apropiada de acuerdo a los umbrales predefinidos para los componentes, situaciones anómalas detectadas para los siguientes aspectos:

 

·         Interrupción de la Disponibilidad del Web Server

·         Detección de crecimiento anormal del Heap del servidor Web que pueda darse como producto de programas que tengan “Memory Leaks” (No liberación apropiada de memoria del servidor)

·         Errores Críticos o advertencias detectadas por el servidor Web que puedan poner en peligro la continuidad operativa del servidor de Web, extraídas de las bitácoras del Web Server.

 

 


 


 [f1]Indicar la descripción del equipo donde se instalará la herramienta de Monitoreo