td = tdigest()
td = tdigest(compression)
td = tdigest(X)
td = tdigest(compression, X)
| Paramètre | Description |
|---|---|
| compression | facteur de compression : scalaire entier positif. |
| X | un tableau de double, single, entiers, ... |
| Paramètre | Description |
|---|---|
| td | représentation t-digest des éléments du tableau. |
td = tdigest(compression, X) renvoie une représentation t-digest des éléments du tableau X.
TDigest est une structure de données pour l'accumulation en ligne précise de statistiques basées sur les rangs telles que les quantiles et les fonctions de distribution cumulées. Elle est particulièrement efficace pour les grands jeux de données et pour estimer des quantiles extrêmes. L'algorithme est décrit en détail dans l'article "Computing Extremely Accurate Quantiles Using t-Digests" de Ted Dunning et Otmar Ertl.
Le t-digest est particulièrement utile pour :
Le facteur de compression (100 dans les exemples) contrôle le compromis entre précision et utilisation de la mémoire - des valeurs plus élevées donnent plus de précision mais utilisent plus de mémoire.
Une fois que vous avez un objet t-digest, vous pouvez ajouter de nouveaux points de données en utilisant l'opérateur +, et calculer des percentiles ou des quantiles en utilisant les méthodes percentile ou quantile.
Pour plus de détails, consultez l'article original référencé dans la bibliographie.
Méthodes disponibles :
Propriétés :
M = rand(1, 15000);
td = tdigest(100, M);
td = td + [1:15000];
td.percentile([5, 50, 95])
td.quantile([0.05 0.5 0.95])
td = tdigest(100);
while(1)
td = td + randn();
td.percentile([5, 50, 95])
end
| Version | Description |
|---|---|
| 1.15.0 | version initiale |