ELODIE : Panique

Les situations d'erreurs rencontrées sont indiquées ci-dessous, avec des pistes pour y faire face. En premier, les outils utiles sont :


maintenance

maintenance vous permet en particulier d'examiner l'état des process, afin d'intervenir sur tel ou tel qui bloquerait le système, ou qui manquerait . On peut aussi, sur archiv, tuer tous les process liés à Elodie, ce qui permet de redémarrer dans les conditions initiales (Rappel : même après une fin de travail, certains process de la couche d'acquisition continuent à fonctionner, pour servir d'autres clients que les organes de LIDO)


ipcstat

ipcstat , sur stel, permet d'examiner l'état des communications entre process liés à INTER, et d'intervenir sur leur déroulement (en particulier en forçant la libération du sémaphore d'allocation de la mémoire partagée, s'il est bloqué par un client)


ipckill

ipckill élimine sans réfléchir les organes de communication entre process de stel : mémoires partagées et sémaphores. Il élimine du même coup les process qui les utilisent, c'est à dire la majorité de ce qui tourne sur stel pour Elodie. Il faut le faire tourner deux fois de suite pour que tout soit éliminé. On obtient donc une situation propre à un redémarrage correct.

Incidents

- La pose reste bloquée en CCD--> acqui

Il peut arriver que la réduction reste bloquée (sur un problème de sémaphore), et donc que l'image acquise ne puisse être présentée à INTER.
Dans ce cas, on peut essayer les manoeuvres suivantes :

- examiner avec l'indicateur de charge du réseau, si l'échange entre la caméra et stel s'est bien passé (il faut pour cela que la fenêtre de l'indicateur de charge ne soit pas recouverte par des autres fenêtres, sinon l'information ancienne est perdue ).

- examiner avec ipcstat l'état des sémaphores de INTER : si la réduction est terminée, le serveur doit être en attente de commande, et aucun client ne doit avoir la main.

Si un client a la main, et un autre est en attente de commande (et si on est sûr qu'il ne traîne pas un client, de type xdbox, par exemple, qui attend une réponse à l'écran), on peut permettre au second de passer en cliquant Reset #0 dans la fenêtre de ipcstat. L'acquisition peut alors redémarrer.

- sortir de LIDO par fin de travail; cela doit ranger INTER, mais la pose ne sera pas transmise à INTER, il faudra faire une relecture de l'image après être rentré dans LIDO et continué la nuit.

- tout se passe mal, INTER n'est pas sorti après la fin de travail de LIDO, il faut donc intervenir manuellement: on nettoie stel en lançant deux fois ipckill, qui tue tous les process liés à la mémoire partagée et aux sémaphores d'INTER.

- on doit alors redémarrer sans problème. Il reste cependant deux armes absolues supplémentaires : /elodie/panique sur archiv (avec redémarrage de pcelodie), et le redémarrage de la caméra.