Solicitud de agrupación de diálogos

Para preparar el conjunto de datos de entrenamiento de los robots de texto NLU, podemos agrupar los diálogos históricos existentes con usuarios y clientes (minería de intenciones). El historial de diálogos se divide en temas, cada uno de los cuales contiene ejemplos de expresiones de los usuarios y respuestas preparadas del operador. Los ejemplos de las declaraciones de los usuarios se incluyen posteriormente en el conjunto de frases de entrenamiento para las intenciones, y las respuestas del Operador se utilizan al escribir las respuestas del Bot en el Escenario de Diálogo.El formato de los datos para el clustering es el siguiente:

La tabla debe estar en formato CSV.
Cada mensaje (MESSAGE) debe colocarse en una fila separada de la tabla.
A cada diálogo se le asigna un número de identificación único (DIALOG_ID) - el ID del diálogo debe ser un número.
Todos los mensajes dentro de cada diálogo individual se etiquetan como pertenecientes al cliente o al Operador: MESSAGE_TYPE es igual a 0 si es un mensaje del cliente, e igual a 1 si es un mensaje del Operador.
Los mensajes del diálogo deben ir acompañados de la fecha y hora de envío: DIALOG_DT.
Deben eliminarse todas las comillas de las cadenas de mensajes.

Aquí encontrará un archivo de ejemplo con los datos en el formato correcto.

PreviousRecursos NextIntegración de canales

Last updated 11 months ago