Statistics
This notebook collects a small workflow around stats_utils: dataset loading, descriptive statistics, and covariance between two experimental columns.
from mespy import (
covariance,
load_csv,
median,
standard_deviation,
variance,
weighted_mean,
)
df = load_csv(
"./data/test_misure.csv",
required_columns=["misura_n", "lunghezza_mm", "sigma_mm"],
missing="drop",
)
misura = df["misura_n"]
lunghezza = df["lunghezza_mm"]
weights = 1.0 / df["sigma_mm"] ** 2
summary = {
"media": round(weighted_mean(lunghezza), 4),
"media_pesata": round(weighted_mean(lunghezza, weights), 4),
"mediana": round(median(lunghezza), 4),
"varianza": round(variance(lunghezza), 4),
"deviazione_standard": round(standard_deviation(lunghezza), 4),
}
summary
{'media': 25.2975,
'media_pesata': 25.2975,
'mediana': 25.3,
'varianza': 0.0036,
'deviazione_standard': 0.0602}
cov_lunghezza_misura = covariance(lunghezza, misura)
cov_lunghezza_misura
0.02124999999995225