predictive-maintenance

German Version

Beschreibung der Funtkionsweise der Klasse Predictive Maintenance Analyzer V5

Die Klasse PredictiveMaintenanceAnalyzer analysiert Sensordaten eines Fahrzeugs, erkennt Anomalien und sagt basierend auf diesen Daten und einem Machine-Learning-Modell zukünftige Defekte voraus. Die Ergebnisse werden in einem strukturierten Format bereitgestellt und können weiterverarbeitet werden.

Klasse: PredictiveMaintenanceAnalyzer

Konstruktor (`init`)

Zweck

Initialisiert die Klasse und stellt die Verbindung zur MongoDB sowie die Fahrzeug-ID her.

Parameter

client (MongoClient): Die Verbindung zur MongoDB.
db_name (str): Der Name der Datenbank.
vehicle_id (str): Die ID des Fahrzeugs, dessen Daten analysiert werden sollen.

Methode: analyze_vehicle

Zweck

Die zentrale Methode der Klasse, die:

Fahrzeug- und Sensordaten abruft,
Anomalien erkennt,
Ein Machine-Learning-Modell trainiert und evaluiert,
Die Ergebnisse in strukturierter Form zurückgibt.

Beschreibung der Funktion `detect_anomalies`

Die Funktion detect_anomalies identifiziert Anomalien in Sensordaten eines Fahrzeugs basierend auf dem Sensortyp. Sie verwendet das maschinelle Lernverfahren Isolation Forest, um ungewöhnliche Datenpunkte zu erkennen, erstellt Visualisierungen für die erkannten Anomalien und gibt die Ergebnisse in einem strukturierten Dictionary zurück.

Funktionalität und Schritte

1. Parameter

sensor_df (Pandas DataFrame):
- Enthält die Sensordaten des Fahrzeugs. Erwartete Spalten:
  - sensorType: Typ des Sensors (z. B. Temperatur, Druck).
  - value: Der gemessene Wert des Sensors.
  - timestamp: Zeitstempel der Messung.
  - mileage: Kilometerstand zum Zeitpunkt der Messung.
debug (bool, optional, Standard: False):
- Wenn aktiviert, werden die generierten Plots zur Visualisierung von Anomalien angezeigt.
contamination (float, optional, Standard: 0.01):
- Der Anteil der Daten, der als Anomalien behandelt wird. Ein kleiner Wert macht das Modell weniger empfindlich.
n_estimators (int, optional, Standard: 200):
- Anzahl der Bäume im Isolation Forest. Höhere Werte erhöhen die Genauigkeit, können jedoch die Laufzeit verlängern.

2. Rückgabe

results (dict):
- Enthält die erkannten Anomalien sowie Diagramme und zusätzliche Informationen.
- Schlüssel:
  - anomaly: Liste von Anomalieergebnissen pro Sensortyp:
    - sensor_type: Typ des Sensors.
    - vehicle_id: ID des Fahrzeugs.
    - anomaly_count: Anzahl der erkannten Anomalien.
    - anomaly_data: Liste der anomalen Messungen (Zeit, Wert, Kilometerstand).
    - plot: Base64-kodiertes Diagramm, das die Sensorwerte und die erkannten Anomalien zeigt.

3. Ablauf

3.1 Initialisierung

results = {"anomaly": []}
sensor_df['anomaly'] = 0
anomaly_counts = {}

results speichert die Ergebnisse der Anomalieerkennung.
anomaly_counts zählt die erkannten Anomalien pro Sensortyp.
Eine neue Spalte anomaly wird im DataFrame hinzugefügt, die später Anomalien markiert.

3.2 Iteration durch Sensortypen

for sensor_type in sensor_df['sensorType'].unique():
    sensor_subset = sensor_df[sensor_df['sensorType'] == sensor_type]

Die Daten werden nach sensorType gruppiert.
Für jeden Sensortyp wird ein Subset der Daten (sensor_subset) erstellt.

3.3 Isolation Forest: Anomalieerkennung

X_anomaly = sensor_subset[['value']]
anomaly_detector = IsolationForest(n_estimators=n_estimators, contamination=contamination, random_state=42)
anomaly_detector.fit(X_anomaly)
predictions = anomaly_detector.predict(X_anomaly)

Daten: Nur die Spalte value wird für die Erkennung verwendet.
Isolation Forest:
- Trainiert ein Modell, das ungewöhnliche Werte identifiziert.
- Gibt -1 für Anomalien und 1 für normale Daten zurück.

3.4 Speichern der Ergebnisse

sensor_df.loc[sensor_subset.index, 'anomaly'] = pd.Series(predictions, index=sensor_subset.index)
anomaly_count = (sensor_df.loc[sensor_subset.index, 'anomaly'] == -1).sum()
anomaly_counts[sensor_type] = anomaly_count

Die Ergebnisse werden im DataFrame sensor_df gespeichert.
Anomalien (-1) werden gezählt und in anomaly_counts gespeichert.

3.5 Konvertieren von Anomalie-Markierungen

sensor_df['anomaly'] = sensor_df['anomaly'].apply(lambda x: 1 if x == -1 else 0)

Die Werte -1 (Anomalie) werden in 1 umgewandelt, um die Markierung einfacher zu machen.

3.6 Ergebnisaggregation

Für jeden Sensortyp werden die Ergebnisse strukturiert gespeichert:

anomalies = sensor_df[(sensor_df['sensorType'] == sensor_type) & (sensor_df['anomaly'] == 1)]
anomaly_entry = {
    "sensor_type": sensor_type,
    "vehicle_id": self.vehicle_id,
    "anomaly_count": int(count),
    "anomaly_data": anomalies[['timestamp', 'value', 'mileage', 'anomaly']].to_dict(orient='records')
}

Die erkannten Anomalien werden extrahiert und in einem Dictionary gespeichert:
- sensor_type: Typ des Sensors.
- anomaly_count: Anzahl der erkannten Anomalien.
- anomaly_data: Detaillierte Informationen über jede Anomalie.

3.7 Visualisierung

Ein Diagramm wird erstellt, das die Sensorwerte und Anomalien darstellt:

fig, ax = plt.subplots(figsize=(14, 6))
ax.plot(sensor_df[sensor_df['sensorType'] == sensor_type]['timestamp'], sensor_df[sensor_df['sensorType'] == sensor_type]['value'], label='Sensorwert')
ax.scatter(anomalies['timestamp'], anomalies['value'], color='red', label='Anomalie', marker='x')

Darstellung:
- Blaue Linie: Sensorwerte.
- Rote Kreuze: Anomalien.

Debug-Ausgabe

if debug:
    plt.show()

Wenn debug aktiviert ist, wird das Diagramm angezeigt.

Base64-kodierte Speicherung

Das Diagramm wird als Base64-kodierter String gespeichert:

buf = io.BytesIO()
plt.savefig(buf, format='png')
buf.seek(0)
anomaly_entry["plot"] = base64.b64encode(buf.getvalue()).decode('utf-8')

3.8 Rückgabe

Die Ergebnisse werden im Dictionary results gespeichert und zurückgegeben:

results["anomaly"].append(anomaly_entry)
return results

Zusammenfassung der Funktionalität

Die Funktion gruppiert die Sensordaten nach sensorType.
Für jeden Sensortyp wird Isolation Forest verwendet, um Anomalien zu erkennen.
Ergebnisse werden in einem strukturierten Format (Daten und Diagramme) gespeichert.
Optional werden Debug-Diagramme angezeigt.

Beispiel für Rückgabewerte

1. Ergebnisse (Struktur)

{
    "anomaly": [
        {
            "sensor_type": "temperature",
            "vehicle_id": "V001",
            "anomaly_count": 5,
            "anomaly_data": [
                { "timestamp": "2024-01-01T12:00:00", "value": 150, "mileage": 12000, "anomaly": 1 },
                { "timestamp": "2024-01-01T12:05:00", "value": 170, "mileage": 12010, "anomaly": 1 }
            ],
            "plot": "<Base64-kodiertes Diagramm>"
        }
    ]
}

2. Beispielanwendung

anomalies = analyzer.detect_anomalies(sensor_df, debug=True)
print(anomalies)

Stärken der Funktion

Flexibilität:
- Anpassbare Parameter (contamination, n_estimators).
Strukturierte Rückgabe:
- Daten und Visualisierungen für jede Anomalie.
Integration mit Visualisierungen:
- Base64-Diagramme erleichtern die Weiterverarbeitung.

Verbesserungsmöglichkeiten

Speicherverbrauch optimieren:
- Große Plots können zu Speicherproblemen führen.
Fehlende Daten:
- Umgang mit fehlenden oder fehlerhaften Werten (NaN) verbessern.
Sensitivität:
- Dynamische Anpassung des contamination-Parameters basierend auf den Daten.

Beschreibung der Funktion: `detect_anomalies_thresholds`

Die Funktion detect_anomalies_thresholds dient zur Erkennung von Anomalien in Sensordaten basierend auf vordefinierten oberen und unteren Grenzwerten. Die Grenzwerte können entweder als Parameter übergeben oder aus einer MongoDB-Datenbank abgerufen werden. Die Methode markiert Anomalien im DataFrame und gibt die Ergebnisse in strukturierter Form zurück.

Zweck

Identifikation von Sensordaten, die außerhalb vordefinierter Grenzwerte liegen.
Gruppierung und Analyse der Anomalien nach Sensortyp.
Bereitstellung von Anomaliedaten und Statistiken in strukturierter Form.

Parameter

sensor_df (Pandas DataFrame):
- Enthält die Sensordaten mit den Spalten:
  - sensorType: Der Typ des Sensors (z. B. Temperatur, Druck).
  - value: Der gemessene Wert des Sensors.
  - Optional: timestamp, mileage für zusätzliche Informationen.

sensor_thresholds (dict):

Ein Dictionary, das Grenzwerte für jeden Sensortyp definiert:

{
    "sensorType1": {"min": min_value, "max": max_value},
    "sensorType2": {"min": min_value, "max": max_value}
}

Beispiel:

{
    "temperature": {"min": -20, "max": 120},
    "pressure": {"min": 0, "max": 300}
}

Rückgabewerte

Ein Dictionary mit den Anomalieergebnissen:

anomaly_threshold (list of dict):
- Liste der Anomalien pro Sensortyp:
  - sensor_type: Der Sensortyp (z. B. Temperatur).
  - vehicle_id: Die ID des Fahrzeugs.
  - anomaly_count: Die Anzahl der erkannten Anomalien.
  - anomaly_data: Eine Liste von Anomaliedatensätzen (Zeit, Wert, Kilometerstand, Anomalie-Markierung).

Funktionsweise: Schritt-für-Schritt

1. Grenzwerte initialisieren

if sensor_thresholds is None:
    vehicle_data = self.db["vehicles"].find_one({"vehicleId": self.vehicle_id}, {"_id": 0, "sensorGroup": 1})

    if "sensorGroup" in vehicle_data:
        sensor_group = vehicle_data["sensorGroup"]
        threshold_data = self.db["sensorGroups"].find_one({"sensorGroup": sensor_group}, {"_id": 0, "sensorTypes": 1})
        if threshold_data is not None:
            sensor_thresholds = threshold_data["sensorTypes"]

    if sensor_thresholds is None:
        sensor_thresholds = {
            "io58": {"min": 0, "max": 120},  # Standardgrenzwerte
            "io32": {"min": 0, "max": 120},
            "io66": {"min": 13000, "max": 30000}
        }

Wenn sensor_thresholds nicht übergeben wird:
- Die sensorGroup des Fahrzeugs wird aus der MongoDB-Collection vehicles abgerufen.
- Die zugehörigen Grenzwerte werden aus der Collection sensorThresholds geladen.
Wenn keine Grenzwerte gefunden werden, werden Standardwerte verwendet.

2. Anomalien initialisieren

sensor_df["anomaly_threshold"] = 0
anomaly_threshold_counts = {}

Eine neue Spalte anomaly_threshold wird im DataFrame hinzugefügt. Diese markiert Anomalien:
- 1: Wert liegt außerhalb der Grenzwerte (Anomalie).
- 0: Wert liegt innerhalb der Grenzwerte (kein Problem).
Ein Dictionary anomaly_threshold_counts wird erstellt, um die Anzahl der Anomalien pro Sensortyp zu speichern.

3. Iteration durch Sensortypen

for sensor_type, thresholds in sensor_thresholds.items():
    min_value = thresholds["min"]
    max_value = thresholds["max"]

    is_anomaly = (sensor_df["sensorType"] == sensor_type) & (
        (sensor_df["value"] < min_value) | (sensor_df["value"] > max_value)
    )
    sensor_df.loc[is_anomaly, "anomaly_threshold"] = 1

Für jeden sensorType werden die Grenzwerte (min_value, max_value) geladen.
Es wird überprüft, ob die Werte des Sensortyps außerhalb der Grenzwerte liegen:
- Werte < min_value oder > max_value werden als Anomalien markiert.
Diese Anomalien werden im DataFrame (sensor_df) in der Spalte anomaly_threshold gespeichert.

4. Anomalien zählen

anomaly_threshold_count = (
    sensor_df.loc[sensor_df['sensorType'] == sensor_type, 'anomaly_threshold'] == 1).sum()
anomaly_threshold_counts[sensor_type] = anomaly_threshold_count

Die Anzahl der Anomalien für jeden Sensortyp wird gezählt und im Dictionary anomaly_threshold_counts gespeichert.

5. Ergebnisse erstellen

Für jeden Sensortyp wird ein Eintrag in den Ergebnissen erstellt:

anomalies = sensor_df[(sensor_df['sensorType'] == sensor_type) & (sensor_df['anomaly_threshold'] == 1)]
anomaly_threshold_entry = {
    "sensor_type": sensor_type,
    "vehicle_id": self.vehicle_id,
    "anomaly_count": int(count),
    "anomaly_data": anomalies[['timestamp', 'value', 'mileage', 'anomaly_threshold']].to_dict(orient='records')
}
results["anomaly_threshold"].append(anomaly_threshold_entry)

Anomalien für den aktuellen Sensortyp werden aus dem DataFrame extrahiert.
Die Anomalien werden in strukturierter Form gespeichert:
- Sensortyp, Fahrzeug-ID, Anzahl der Anomalien und die Anomaliedaten.

6. Rückgabe

return results

Gibt das Dictionary results mit den Anomalien zurück.

Beispiel für Rückgabewerte

Input: Sensordaten

| sensorType | value | timestamp | mileage | |————-|——-|———————|———| | temperature | 150 | 2024-01-01 12:00:00 | 12000 | | pressure | 350 | 2024-01-01 12:01:00 | 12010 | | temperature | 100 | 2024-01-01 12:02:00 | 12020 |

Input: Grenzwerte

{
    "temperature": {"min": -20, "max": 120},
    "pressure": {"min": 0, "max": 300}
}

Output: Ergebnisse

{
    "anomaly_threshold": [
        {
            "sensor_type": "temperature",
            "vehicle_id": "V001",
            "anomaly_count": 1,
            "anomaly_data": [
                { "timestamp": "2024-01-01T12:00:00", "value": 150, "mileage": 12000, "anomaly_threshold": 1 }
            ]
        },
        {
            "sensor_type": "pressure",
            "vehicle_id": "V001",
            "anomaly_count": 1,
            "anomaly_data": [
                { "timestamp": "2024-01-01T12:01:00", "value": 350, "mileage": 12010, "anomaly_threshold": 1 }
            ]
        }
    ]
}

Zusammenfassung

Die Funktion detect_anomalies_thresholds ist ein effektives Werkzeug zur Überprüfung von Sensordaten auf Basis vordefinierter Grenzwerte. Sie ist flexibel, da die Grenzwerte entweder als Parameter übergeben oder dynamisch aus der MongoDB geladen werden können. Die Ergebnisse werden strukturiert bereitgestellt und können für weitere Analysen verwendet werden.

Zusammenfassung

Die Klasse PredictiveMaintenanceAnalyzer bietet ein leistungsstarkes Werkzeug für die Überwachung und Analyse von Fahrzeugdaten. Durch die Kombination von Anomalieerkennung und maschinellem Lernen liefert sie präzise Vorhersagen, die in Wartungssysteme integriert werden können. Die klare Trennung von Datenverarbeitung, Modellierung und Ergebnisausgabe macht die Klasse flexibel und anpassungsfähig.

—‚

Lizenz

Autor: Jörg Harzmann

Dieser Inhalt ist unter einer CC BY-NC Lizenz veröffentlicht. Jeglicher Quellcode ist urheberrechtlich geschützt!

predictive-maintenance

German Version

Beschreibung der Funtkionsweise der Klasse Predictive Maintenance Analyzer V5

Klasse: PredictiveMaintenanceAnalyzer

Konstruktor (__init__)

Zweck

Parameter

Methode: analyze_vehicle

Zweck

Beschreibung der Funktion detect_anomalies

Funktionalität und Schritte

1. Parameter

2. Rückgabe

3. Ablauf

3.1 Initialisierung

3.2 Iteration durch Sensortypen

3.3 Isolation Forest: Anomalieerkennung

3.4 Speichern der Ergebnisse

3.5 Konvertieren von Anomalie-Markierungen

3.6 Ergebnisaggregation

3.7 Visualisierung

Debug-Ausgabe

Base64-kodierte Speicherung

3.8 Rückgabe

Zusammenfassung der Funktionalität

Beispiel für Rückgabewerte

1. Ergebnisse (Struktur)

2. Beispielanwendung

Stärken der Funktion

Verbesserungsmöglichkeiten

Beschreibung der Funktion: detect_anomalies_thresholds

Zweck

Parameter

Rückgabewerte

Funktionsweise: Schritt-für-Schritt

1. Grenzwerte initialisieren

2. Anomalien initialisieren

3. Iteration durch Sensortypen

4. Anomalien zählen

5. Ergebnisse erstellen

6. Rückgabe

Beispiel für Rückgabewerte

Input: Sensordaten

Input: Grenzwerte

Output: Ergebnisse

Zusammenfassung

Zusammenfassung

Lizenz

Konstruktor (`init`)

Beschreibung der Funktion `detect_anomalies`

Beschreibung der Funktion: `detect_anomalies_thresholds`