Merge branch 'main' of ssh://edp.buildth.ing/DevFW-CICD/stacks-instances

2025-08-13 10:59:20 +02:00 · 2025-08-13 10:59:20 +02:00 · 2b0c062a2a
commit 2b0c062a2a
parent 54eb8164f4 9087b823a1
15 changed files with 175 additions and 186 deletions
--- a/otc/edp.buildth.ing/stacks/forgejo/forgejo-server/manifests/forgejo-s3-backup-cronjob.yaml
+++ b/otc/edp.buildth.ing/stacks/forgejo/forgejo-server/manifests/forgejo-s3-backup-cronjob.yaml
@ -5,57 +5,69 @@ metadata:
  namespace: gitea
 spec:
  schedule: "0 1 * * *"
  concurrencyPolicy: "Forbid"
  successfulJobsHistoryLimit: 5
  failedJobsHistoryLimit: 5
  startingDeadlineSeconds: 600 # 10 minutes
  jobTemplate:
    spec:
      # 60 min until backup - 10 min start - (backoffLimit * activeDeadlineSeconds) - some time sync buffer
      activeDeadlineSeconds: 1350
      backoffLimit: 2
      ttlSecondsAfterFinished: 259200 #
      template:
        spec:
          containers:
-          - name: rclone
+            - name: rclone
-            image: rclone/rclone:1.70
+              image: rclone/rclone:1.70
-            imagePullPolicy: IfNotPresent
+              imagePullPolicy: IfNotPresent
-            env:
+              env:
-            - name: SOURCE_BUCKET
+                - name: SOURCE_BUCKET
-              valueFrom:
+                  valueFrom:
-                secretKeyRef:
+                    secretKeyRef:
-                  name: forgejo-cloud-credentials
+                      name: forgejo-cloud-credentials
-                  key: bucket-name
+                      key: bucket-name
-            - name: AWS_ACCESS_KEY_ID
+                - name: AWS_ACCESS_KEY_ID
-              valueFrom:
+                  valueFrom:
-                secretKeyRef:
+                    secretKeyRef:
-                  name: forgejo-cloud-credentials
+                      name: forgejo-cloud-credentials
-                  key: access-key
+                      key: access-key
-            - name: AWS_SECRET_ACCESS_KEY
+                - name: AWS_SECRET_ACCESS_KEY
-              valueFrom:
+                  valueFrom:
-                secretKeyRef:
+                    secretKeyRef:
-                  name: forgejo-cloud-credentials
+                      name: forgejo-cloud-credentials
-                  key: secret-key
+                      key: secret-key
-            volumeMounts:
+              volumeMounts:
-            - name: rclone-config
+                - name: rclone-config
-              mountPath: /config/rclone
+                  mountPath: /config/rclone
-              readOnly: true
+                  readOnly: true
-            - name: backup-dir
+                - name: backup-dir
-              mountPath: /backup
+                  mountPath: /backup
-              readOnly: false
+                  readOnly: false
-            command:
+              command:
-            - /bin/sh
+                - /bin/sh
-            - -c
+                - -c
-            - |
+                - |
-              rclone sync source:/${SOURCE_BUCKET}/packages /backup -v --ignore-checksum
+                  rclone sync source:/${SOURCE_BUCKET} /backup -v --ignore-checksum
          restartPolicy: OnFailure
          volumes:
-          - name: rclone-config
+            - name: rclone-config
-            secret:
+              secret:
-              secretName: forgejo-s3-backup
+                secretName: forgejo-s3-backup
-          - name: backup-dir
+            - name: backup-dir
-            persistentVolumeClaim:
+              persistentVolumeClaim:
-              claimName: s3-backup
+                claimName: s3-backup
 ---
 apiVersion: v1
 kind: PersistentVolumeClaim
 metadata:
  name: s3-backup
  namespace: gitea
  annotations:
    everest.io/disk-volume-type: SATA
    everest.io/crypt-key-id: 7032bf53-33aa-4bfa-bca2-052df19f6225
 spec:
  storageClassName: csi-disk
  accessModes:
    - ReadWriteOnce
  resources:
--- a/otc/edp.buildth.ing/stacks/forgejo/forgejo-server/values.yaml
+++ b/otc/edp.buildth.ing/stacks/forgejo/forgejo-server/values.yaml
@ -17,8 +17,10 @@ postgresql-ha:
 persistence:
  enabled: true
  size: 200Gi
  storageClass: csi-disk
  annotations:
    everest.io/crypt-key-id: 7032bf53-33aa-4bfa-bca2-052df19f6225
    everest.io/disk-volume-type: GPSSD
 test:
  enabled: false
--- a/otc/edp.buildth.ing/stacks/observability/grafana-operator/manifests/grafana.yaml
+++ b/otc/edp.buildth.ing/stacks/observability/grafana-operator/manifests/grafana.yaml
@ -6,7 +6,12 @@ metadata:
    dashboards: "grafana"
 spec:
  persistentVolumeClaim:
    metadata:
      annotations:
        everest.io/disk-volume-type: SATA
        everest.io/crypt-key-id: 7032bf53-33aa-4bfa-bca2-052df19f6225
    spec:
      storageClassName: csi-disk
      accessModes:
        - ReadWriteOnce
      resources:
--- a/otc/edp.buildth.ing/stacks/observability/victoria-k8s-stack/manifests/alerts.yaml
+++ b/otc/edp.buildth.ing/stacks/observability/victoria-k8s-stack/manifests/alerts.yaml
@ -11,8 +11,19 @@ spec:
          expr: sum by(cluster_environment) (up{pod=~"forgejo-server-.*"}) < 1
          for: 30s
          labels:
-            severity: major
+            severity: critical
            job:  "{{ $labels.job }}"
          annotations:
            value: "{{ $value }}"
            description: 'forgejo is down in cluster environment {{ $labels.cluster_environment }}'
    - name: forgejo-backup
      rules:
        - alert: forgejo s3 backup job failed
          expr: max by(cluster_environment) (kube_job_status_failed{job_name=~"forgejo-s3-backup-.*"}) != 0
          for: 30s
          labels:
            severity: critical
            job:  "{{ $labels.job }}"
          annotations:
            value: "{{ $value }}"
            description: 'forgejo s3 backup job failed in cluster environment {{ $labels.cluster_environment }}'
--- a/otc/edp.buildth.ing/stacks/observability/victoria-k8s-stack/manifests/vlogs.yaml
+++ b/otc/edp.buildth.ing/stacks/observability/victoria-k8s-stack/manifests/vlogs.yaml
@ -9,7 +9,9 @@ spec:
  storageMetadata:
    annotations:
      everest.io/crypt-key-id: 7032bf53-33aa-4bfa-bca2-052df19f6225
      everest.io/disk-volume-type: SATA
  storage:
    storageClassName: csi-disk
    accessModes:
      - ReadWriteOnce
    resources:
--- a/otc/edp.buildth.ing/stacks/observability/victoria-k8s-stack/values.yaml
+++ b/otc/edp.buildth.ing/stacks/observability/victoria-k8s-stack/values.yaml
@ -289,7 +289,9 @@ vmsingle:
    storageMetadata:
      annotations:
        everest.io/crypt-key-id: 7032bf53-33aa-4bfa-bca2-052df19f6225
        everest.io/disk-volume-type: SATA
    storage:
      storageClassName: csi-disk
      accessModes:
        - ReadWriteOnce
      resources:
@ -536,108 +538,30 @@ alertmanager:
  # If you're migrating existing config, please make sure that `.Values.alertmanager.config`:
  # - with `useManagedConfig: false` has structure described [here](https://prometheus.io/docs/alerting/latest/configuration/).
  # - with `useManagedConfig: true` has structure described [here](https://docs.victoriametrics.com/operator/api/#vmalertmanagerconfig).
-  useManagedConfig: false
+  useManagedConfig: true
  # -- (object) Alertmanager configuration
  config:
    route:
      receiver: "blackhole"
-    #   group_by: ["alertgroup", "job"]
+      routes: 
-    #   group_wait: 30s
+        - matchers:
-    #   group_interval: 5m
+            - severity=~"critical|major"
-    #   repeat_interval: 12h
+          receiver: outlook
    #   routes:
    #
    #     # Duplicate code_owner routes to teams
    #     # These will send alerts to team channels but continue
    #     # processing through the rest of the tree to handled by on-call
    #     - matchers:
    #         - code_owner_channel!=""
    #         - severity=~"info|warning|critical"
    #       group_by: ["code_owner_channel", "alertgroup", "job"]
    #       receiver: slack-code-owners
    #
    #     # Standard on-call routes
    #     - matchers:
    #         - severity=~"info|warning|critical"
    #       receiver: slack-monitoring
    #       continue: true
    #
    # inhibit_rules:
    #   - target_matchers:
    #       - severity=~"warning|info"
    #     source_matchers:
    #       - severity=critical
    #     equal:
    #       - cluster
    #       - namespace
    #       - alertname
    #   - target_matchers:
    #       - severity=info
    #     source_matchers:
    #       - severity=warning
    #     equal:
    #       - cluster
    #       - namespace
    #       - alertname
    #   - target_matchers:
    #       - severity=info
    #     source_matchers:
    #       - alertname=InfoInhibitor
    #     equal:
    #       - cluster
    #       - namespace
    receivers:
      - name: blackhole
-    # - name: "slack-monitoring"
+      - name: outlook
-    #   slack_configs:
+        email_configs:
-    #     - channel: "#channel"
+          - smarthost: 'mail.mms-support.de:465'
-    #       send_resolved: true
+            auth_username: 'ipcei-cis-devfw@mms-support.de'
-    #       title: '{{ template "slack.monzo.title" . }}'
+            auth_password: 
-    #       icon_emoji: '{{ template "slack.monzo.icon_emoji" . }}'
+              name: email-user-credentials
-    #       color: '{{ template "slack.monzo.color" . }}'
+              key: connection-string
-    #       text: '{{ template "slack.monzo.text" . }}'
+            from: '"IPCEI CIS DevFW" <ipcei-cis-devfw@mms-support.de>'
-    #       actions:
+            to: 'f9f9953a.mg.telekom.de@de.teams.ms'
-    #         - type: button
+            headers:
-    #           text: "Runbook :green_book:"
+              subject: 'Grafana Mail Alerts'
-    #           url: "{{ (index .Alerts 0).Annotations.runbook_url }}"
+            require_tls: false
-    #         - type: button
+
    #           text: "Query :mag:"
    #           url: "{{ (index .Alerts 0).GeneratorURL }}"
    #         - type: button
    #           text: "Dashboard :grafana:"
    #           url: "{{ (index .Alerts 0).Annotations.dashboard }}"
    #         - type: button
    #           text: "Silence :no_bell:"
    #           url: '{{ template "__alert_silence_link" . }}'
    #         - type: button
    #           text: '{{ template "slack.monzo.link_button_text" . }}'
    #           url: "{{ .CommonAnnotations.link_url }}"
    # - name: slack-code-owners
    #   slack_configs:
    #     - channel: "#{{ .CommonLabels.code_owner_channel }}"
    #       send_resolved: true
    #       title: '{{ template "slack.monzo.title" . }}'
    #       icon_emoji: '{{ template "slack.monzo.icon_emoji" . }}'
    #       color: '{{ template "slack.monzo.color" . }}'
    #       text: '{{ template "slack.monzo.text" . }}'
    #       actions:
    #         - type: button
    #           text: "Runbook :green_book:"
    #           url: "{{ (index .Alerts 0).Annotations.runbook }}"
    #         - type: button
    #           text: "Query :mag:"
    #           url: "{{ (index .Alerts 0).GeneratorURL }}"
    #         - type: button
    #           text: "Dashboard :grafana:"
    #           url: "{{ (index .Alerts 0).Annotations.dashboard }}"
    #         - type: button
    #           text: "Silence :no_bell:"
    #           url: '{{ template "__alert_silence_link" . }}'
    #         - type: button
    #           text: '{{ template "slack.monzo.link_button_text" . }}'
    #           url: "{{ .CommonAnnotations.link_url }}"
    #
  # -- Better alert templates for [slack source](https://gist.github.com/milesbxf/e2744fc90e9c41b47aa47925f8ff6512)
  monzoTemplate:
    enabled: true
@ -880,7 +804,7 @@ grafana:
  enabled: false
  # all values for grafana helm chart can be specified here
  persistence:
-    enabled: true
+    enabled: false
    type: pvc
    storageClassName: "default"
  grafana.ini:
@ -1096,7 +1020,7 @@ kubeApiServer:
 # Component scraping the kube controller manager
 kubeControllerManager:
  # -- Enable kube controller manager metrics scraping
-  enabled: true
+  enabled: false
  # -- If your kube controller manager is not deployed as a pod, specify IPs it can be found on
  endpoints: []
@ -1229,7 +1153,7 @@ kubeEtcd:
 # Component scraping kube scheduler
 kubeScheduler:
  # -- Enable KubeScheduler metrics scraping
-  enabled: true
+  enabled: false
  # -- If your kube scheduler is not deployed as a pod, specify IPs it can be found on
  endpoints: []
--- a/otc/forgejo-test.t09.de/stacks/forgejo/forgejo-server/manifests/forgejo-s3-backup-cronjob.yaml
+++ b/otc/forgejo-test.t09.de/stacks/forgejo/forgejo-server/manifests/forgejo-s3-backup-cronjob.yaml
@ -5,57 +5,69 @@ metadata:
  namespace: gitea
 spec:
  schedule: "0 1 * * *"
  concurrencyPolicy: "Forbid"
  successfulJobsHistoryLimit: 5
  failedJobsHistoryLimit: 5
  startingDeadlineSeconds: 600 # 10 minutes
  jobTemplate:
    spec:
      # 60 min until backup - 10 min start - (backoffLimit * activeDeadlineSeconds) - some time sync buffer
      activeDeadlineSeconds: 1350
      backoffLimit: 2
      ttlSecondsAfterFinished: 259200 #
      template:
        spec:
          containers:
-          - name: rclone
+            - name: rclone
-            image: rclone/rclone:1.70
+              image: rclone/rclone:1.70
-            imagePullPolicy: IfNotPresent
+              imagePullPolicy: IfNotPresent
-            env:
+              env:
-            - name: SOURCE_BUCKET
+                - name: SOURCE_BUCKET
-              valueFrom:
+                  valueFrom:
-                secretKeyRef:
+                    secretKeyRef:
-                  name: forgejo-cloud-credentials
+                      name: forgejo-cloud-credentials
-                  key: bucket-name
+                      key: bucket-name
-            - name: AWS_ACCESS_KEY_ID
+                - name: AWS_ACCESS_KEY_ID
-              valueFrom:
+                  valueFrom:
-                secretKeyRef:
+                    secretKeyRef:
-                  name: forgejo-cloud-credentials
+                      name: forgejo-cloud-credentials
-                  key: access-key
+                      key: access-key
-            - name: AWS_SECRET_ACCESS_KEY
+                - name: AWS_SECRET_ACCESS_KEY
-              valueFrom:
+                  valueFrom:
-                secretKeyRef:
+                    secretKeyRef:
-                  name: forgejo-cloud-credentials
+                      name: forgejo-cloud-credentials
-                  key: secret-key
+                      key: secret-key
-            volumeMounts:
+              volumeMounts:
-            - name: rclone-config
+                - name: rclone-config
-              mountPath: /config/rclone
+                  mountPath: /config/rclone
-              readOnly: true
+                  readOnly: true
-            - name: backup-dir
+                - name: backup-dir
-              mountPath: /backup
+                  mountPath: /backup
-              readOnly: false
+                  readOnly: false
-            command:
+              command:
-            - /bin/sh
+                - /bin/sh
-            - -c
+                - -c
-            - |
+                - |
-              rclone sync source:/${SOURCE_BUCKET}/packages /backup -v --ignore-checksum
+                  rclone sync source:/${SOURCE_BUCKET} /backup -v --ignore-checksum
          restartPolicy: OnFailure
          volumes:
-          - name: rclone-config
+            - name: rclone-config
-            secret:
+              secret:
-              secretName: forgejo-s3-backup
+                secretName: forgejo-s3-backup
-          - name: backup-dir
+            - name: backup-dir
-            persistentVolumeClaim:
+              persistentVolumeClaim:
-              claimName: s3-backup
+                claimName: s3-backup
 ---
 apiVersion: v1
 kind: PersistentVolumeClaim
 metadata:
  name: s3-backup
  namespace: gitea
  annotations:
    everest.io/disk-volume-type: SATA
    everest.io/crypt-key-id: b0e0a24d-d5a6-4a16-b745-8af2ed8bf46d
 spec:
  storageClassName: csi-disk
  accessModes:
    - ReadWriteOnce
  resources:
--- a/otc/forgejo-test.t09.de/stacks/observability/grafana-operator/manifests/grafana.yaml
+++ b/otc/forgejo-test.t09.de/stacks/observability/grafana-operator/manifests/grafana.yaml
@ -6,7 +6,12 @@ metadata:
    dashboards: "grafana"
 spec:
  persistentVolumeClaim:
    metadata:
      annotations:
        everest.io/disk-volume-type: SATA
        everest.io/crypt-key-id: b0e0a24d-d5a6-4a16-b745-8af2ed8bf46d
    spec:
      storageClassName: csi-disk
      accessModes:
        - ReadWriteOnce
      resources:
--- a/otc/forgejo-test.t09.de/stacks/observability/victoria-k8s-stack/manifests/alerts.yaml
+++ b/otc/forgejo-test.t09.de/stacks/observability/victoria-k8s-stack/manifests/alerts.yaml
@ -11,8 +11,19 @@ spec:
          expr: sum by(cluster_environment) (up{pod=~"forgejo-server-.*"}) < 1
          for: 30s
          labels:
-            severity: major
+            severity: critical
            job:  "{{ $labels.job }}"
          annotations:
            value: "{{ $value }}"
            description: 'forgejo is down in cluster environment {{ $labels.cluster_environment }}'
    - name: forgejo-backup
      rules:
        - alert: forgejo s3 backup job failed
          expr: max by(cluster_environment) (kube_job_status_failed{job_name=~"forgejo-s3-backup-.*"}) != 0
          for: 30s
          labels:
            severity: critical
            job:  "{{ $labels.job }}"
          annotations:
            value: "{{ $value }}"
            description: 'forgejo s3 backup job failed in cluster environment {{ $labels.cluster_environment }}'
--- a/otc/forgejo-test.t09.de/stacks/observability/victoria-k8s-stack/manifests/vlogs.yaml
+++ b/otc/forgejo-test.t09.de/stacks/observability/victoria-k8s-stack/manifests/vlogs.yaml
@ -9,7 +9,9 @@ spec:
  storageMetadata:
    annotations:
      everest.io/crypt-key-id: b0e0a24d-d5a6-4a16-b745-8af2ed8bf46d
      everest.io/disk-volume-type: SATA
  storage:
    storageClassName: csi-disk
    accessModes:
      - ReadWriteOnce
    resources:
--- a/otc/forgejo-test.t09.de/stacks/observability/victoria-k8s-stack/values.yaml
+++ b/otc/forgejo-test.t09.de/stacks/observability/victoria-k8s-stack/values.yaml
@ -289,7 +289,9 @@ vmsingle:
    storageMetadata:
      annotations:
        everest.io/crypt-key-id: b0e0a24d-d5a6-4a16-b745-8af2ed8bf46d
        everest.io/disk-volume-type: SATA
    storage:
      storageClassName: csi-disk
      accessModes:
        - ReadWriteOnce
      resources:
@ -540,12 +542,13 @@ alertmanager:
  # -- (object) Alertmanager configuration
  config:
    route:
-      receiver: "outlook"
+      receiver: "blackhole"
      routes: 
        - matchers:
-            - alertname=~".*"
+            - severity=~"critical|major"
          receiver: outlook
    receivers:
      - name: blackhole
      - name: outlook
        email_configs:
          - smarthost: 'mail.mms-support.de:465'
@ -801,7 +804,7 @@ grafana:
  enabled: false
  # all values for grafana helm chart can be specified here
  persistence:
-    enabled: true
+    enabled: false
    type: pvc
    storageClassName: "default"
  grafana.ini:
@ -1017,7 +1020,7 @@ kubeApiServer:
 # Component scraping the kube controller manager
 kubeControllerManager:
  # -- Enable kube controller manager metrics scraping
-  enabled: true
+  enabled: false
  # -- If your kube controller manager is not deployed as a pod, specify IPs it can be found on
  endpoints: []
@ -1150,7 +1153,7 @@ kubeEtcd:
 # Component scraping kube scheduler
 kubeScheduler:
  # -- Enable KubeScheduler metrics scraping
-  enabled: true
+  enabled: false
  # -- If your kube scheduler is not deployed as a pod, specify IPs it can be found on
  endpoints: []
--- a/otc/observability.t09.de/stacks/forgejo/forgejo-server/manifests/forgejo-s3-backup-cronjob.yaml
+++ b/otc/observability.t09.de/stacks/forgejo/forgejo-server/manifests/forgejo-s3-backup-cronjob.yaml
@ -64,7 +64,7 @@ metadata:
  name: s3-backup
  namespace: gitea
  annotations:
-    everest.io/disk-volume-type: SATA
+    everest.io/disk-volume-type: GPSSD
    everest.io/crypt-key-id: b6a1d001-da76-48d7-a9ea-079512888d33
 spec:
  storageClassName: csi-disk
--- a/otc/observability.t09.de/stacks/observability/grafana-operator/manifests/grafana.yaml
+++ b/otc/observability.t09.de/stacks/observability/grafana-operator/manifests/grafana.yaml
@ -8,7 +8,7 @@ spec:
  persistentVolumeClaim:
    metadata:
      annotations:
-        everest.io/disk-volume-type: SATA
+        everest.io/disk-volume-type: GPSSD
        everest.io/crypt-key-id: b6a1d001-da76-48d7-a9ea-079512888d33
    spec:
      storageClassName: csi-disk
--- a/otc/observability.t09.de/stacks/observability/victoria-k8s-stack/manifests/vlogs.yaml
+++ b/otc/observability.t09.de/stacks/observability/victoria-k8s-stack/manifests/vlogs.yaml
@ -9,7 +9,7 @@ spec:
  storageMetadata:
    annotations:
      everest.io/crypt-key-id: b6a1d001-da76-48d7-a9ea-079512888d33
-      everest.io/disk-volume-type: SATA
+      everest.io/disk-volume-type: GPSSD
  storage:
    storageClassName: csi-disk
    accessModes:
--- a/otc/observability.t09.de/stacks/observability/victoria-k8s-stack/values.yaml
+++ b/otc/observability.t09.de/stacks/observability/victoria-k8s-stack/values.yaml
@ -289,7 +289,7 @@ vmsingle:
    storageMetadata:
      annotations:
        everest.io/crypt-key-id: b6a1d001-da76-48d7-a9ea-079512888d33
-        everest.io/disk-volume-type: SATA
+        everest.io/disk-volume-type: GPSSD
    storage:
      storageClassName: csi-disk
      accessModes: