6 votos

¿Matrices de confusión con porcentajes en lugar de cantidad de instancias?

La mayoría de las matrices de confusión he visto contener el número de casos en cada celda. No es una matriz de confusión con el porcentaje de casos en cada celda más fácil de leer? Es este enfoque equivocado o no ir en contra de alguna regla no escrita con respecto a la confusión de las matrices?

Ejemplo de una matriz de confusión se verá como este, donde cada una de las 10 etiquetas de clase que hace que hasta un 10 por ciento del conjunto de datos y el total es el 100 por ciento. 9.06 por ciento del conjunto de datos pertenecían a la clase 1 y fue asignado a la clase 1. Por lo tanto 90.60% de la clase 1 de instancias clasificadas correctamente.

example

2voto

Una matriz de confusión en porcentajes sería apropiada si la distribución entre sus clases es plana (ya sea de forma natural o intencionalmente muestreada de esa manera). Si este no es el caso, tal matriz de confusión puede llevar a una gran confusión.

Es útil tener tanto el número de instancias en general (para ver los sesgos) como los porcentajes para los datos muestreados desde una distribución plana.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by: