Statistiche

Questo notebook raccoglie un piccolo workflow su stats_utils: caricamento del dataset, statistiche descrittive e covarianza tra due colonne sperimentali.

from mespy import (
    covariance,
    load_csv,
    median,
    standard_deviation,
    variance,
    weighted_mean,
)


df = load_csv(
    "./data/test_misure.csv",
    required_columns=["misura_n", "lunghezza_mm", "sigma_mm"],
    missing="drop",
)

misura = df["misura_n"]
lunghezza = df["lunghezza_mm"]
weights = 1.0 / df["sigma_mm"] ** 2

summary = {
    "media": round(weighted_mean(lunghezza), 4),
    "media_pesata": round(weighted_mean(lunghezza, weights), 4),
    "mediana": round(median(lunghezza), 4),
    "varianza": round(variance(lunghezza), 4),
    "deviazione_standard": round(standard_deviation(lunghezza), 4),
}
summary
{'media': 25.2975,
 'media_pesata': 25.2975,
 'mediana': 25.3,
 'varianza': 0.0036,
 'deviazione_standard': 0.0602}
cov_lunghezza_misura = covariance(lunghezza, misura)
cov_lunghezza_misura
0.02124999999995225

Pagine collegate