Statistics

This notebook collects a small workflow around stats_utils: dataset loading, descriptive statistics, and covariance between two experimental columns.

from mespy import (
    covariance,
    load_csv,
    median,
    standard_deviation,
    variance,
    weighted_mean,
)


df = load_csv(
    "./data/test_misure.csv",
    required_columns=["misura_n", "lunghezza_mm", "sigma_mm"],
    missing="drop",
)

misura = df["misura_n"]
lunghezza = df["lunghezza_mm"]
weights = 1.0 / df["sigma_mm"] ** 2

summary = {
    "media": round(weighted_mean(lunghezza), 4),
    "media_pesata": round(weighted_mean(lunghezza, weights), 4),
    "mediana": round(median(lunghezza), 4),
    "varianza": round(variance(lunghezza), 4),
    "deviazione_standard": round(standard_deviation(lunghezza), 4),
}
summary

{'media': 25.2975,
 'media_pesata': 25.2975,
 'mediana': 25.3,
 'varianza': 0.0036,
 'deviazione_standard': 0.0602}

cov_lunghezza_misura = covariance(lunghezza, misura)
cov_lunghezza_misura

0.02124999999995225

Statistics

Related pages