Rétrospective 1

Rétrospective de le l’itération 1

Date: 11 octobre 2023

1. Travail réalisé

TâcheResponsable
Préparer les questionnaires par clientJonathan / Thomas
Entrevue AlgoETSJonathan
Entrevue des membres du clubThomas / Jonathan
Entrevue club Raconteurs d’anglesJonathan
Entrevue club Saveurs de génieJonathan
Entrevue services TIThomas
À partir des entrevues, définir métriques de succèsJonathan / Thomas / Simon / Michael
Deployer le cluster physique avec Talos/OmniMichael / Simon
Configuration de base de Rook/CephMichael / Simon
Evaluer stack networking k8sSimon
Mise en place d’un wiki pour la documentationJonathan
Rédaction initiale du document de visionJonathan / Thomas / Simon / Michael
Migrer les serveurs physiques vers la salle de serveursSimon / Jonathan / Thomas
Configuration de KubeVirtThomas

2. Travail non terminé

2.1 En cours

  • Achat des nouveaux disques : L’évaluation de nos besoins a été complétée, la requête au TI est sur le point d’être envoyée.

2.2 Ne sera pas fait

  • Ajouter le réseautage pour le provideur Terraform XCP-NG : Nous avons pris la décision de ne pas utiliser XCP-NG comme hyperviseur pour nos serveurs. Cette décision s’explique par le fait que nous désirons minimiser la complexité de l’infrastructure et qu’il n’y avait pas assez de valeurs ajoutées pour justifier cette configuration. Nous avons opté pour l’outil Vcluster comme alternative pour permettre de configurer différents environnements virtuels à l’intérieur de notre cluster Kubernetes.

3. Problèmes et défis

  • Installation (bootstrap) du cluster Kubernetes / Talos: Installation du OS Talos Linux a partir de l’ISO généré par Sidero Omni et creation du cluster avec toutes les machines.

    • Problème: Impossibilité de décrypter les disques durant le premier démmrarage après l’installation d’une machine.
      • Cause: Malheuresement, après plusieurs ré-installation, on n’a pas pu identifier la cause.
      • Solution: Désactiver l’option de cryptage avant l’installation.
    • Problème: L’installation est brisée dès que la clé USB est retirée de la machine après l’installation.
      • Cause: L’identifiant du disque avec l’OS /dev/sdb n’est plus valide si la clé USB est retirée.
      • Solution: Ré-installation du cluster en spécifiant des identifiants de disque durable (/dev/disk/by-id/...) pour chaque machine.
  • Configuration d’un ISO/image dans un PVC pour KubeVirt: Utiliser un ISO ubuntu dans un PVC pour l’utiliser comme CD-ROM lors du boot de la VM.

    • Solution : Installer le CDI de KubeVirt qui permet d’importer des images disque depuis un serveur web ou un registre de conteneurs, de cloner des volumes persistants existants, et de télécharger des images disque locales, le tout vers un DataVolume. Bref, il simplifie et optimise l’utilisation des revendications de volumes persistants (PVCs) comme disques pour les machines virtuelles.
  • Installation initiale de Rook-Ceph : Installation initiale de rook-ceph (système de fichiers distribué) comme preuve de concept sur notre cluster Kubernetes.

    • Problème : Le cluster Ceph est inutilisable
    • Cause : La configuration des OSD (Object Storage Daemons) échoue.
    • Solution : Manuellement effacer tous les disques et redémarrer l’opérateur rook-ceph.
  • Problème 2 : Description détaillée du problème et de son impact.

    • Solution envisagée : Description de la solution ou des étapes pour résoudre le problème.
  • Défi 3 : Description du défi et pourquoi il a été un obstacle.

    • Solution envisagée : Mesures ou étapes pour surmonter ce défi à l’avenir.


Dernière modification December 19, 2023: retrospective jonathan et conclusion (e7b197a)