Optimasi Support Vector Machine untuk Memprediksi Adanya ...
SUPPORT VECTOR MACHINE-BorjaNunez.pdf
-
Upload
diego-nunez-ccallo -
Category
Documents
-
view
66 -
download
1
Transcript of SUPPORT VECTOR MACHINE-BorjaNunez.pdf
SUPPORT VECTOR MACHINE
En grupos de 2 personas desarrolla los siguientes ejercicios:
INTRODUCCIÓN
1. Usar Support Vector Machines para construir un clasificador de spams. Se necesitará bajar el
código inicial (starter code) y desempaquetar su contenido al directorio donde se desee completar
el ejercicio. Si es necesario, usar el comando cd en Octave para cambiar al directorio antes de
empezar los ejercicios. Además se puede encontrar instrucciones de instalación de Octave en la
página Octave Installation.
Archivos incluidos en este ejercicio:
Ex6.m – script en Octave para la primera mitad del ejercicio.
Ex6data1.mat – Conjunto de datos ejemplo 1.
Ex6data2.mat – Conjunto de datos ejemplo 2.
Ex6data3.mat – Conjunto de datos ejemplo 3.
svmTrain.m – Función de entrenamiento de SVM
svmPredict.m – Función de predicciónn SVM
plotData.m – Datos ploteados en 2D
visualizeBoundaryLinear.m – Límites lineales ploteados
visualizeBoundary.m – Límites no lineales ploteados
linearKernel.m – kernel lineal para SVM
gaussianKernel.m – Kernel gausiano para SVM.
dataser3Params.m – Parámetros para usar con el conjunto de datos 3.
Ex6_spam.m – Script en Octave para la segunda mitad del ejercicio.
spamTrain.mat – Conjunto de entrenamiento Spam
spamTest.mat – Conjunto de test Spam
emailSample1.txt – email de ejemplo 1
emailSample2.txt – email de ejemplo 2
spamSample1.txt – ejemplo de Spam 1
spamSample2.txt – ejemplo de Spam 2
vocab.txt – lista de vocabulario
getVocabList.m – cargar la lista de vocabulario
porterStemmer.m – Función stemming
readFile.m – lee un archivo en un string de caracteres.
processEmail.m – preprocesamiento de emails.
emailFeatures.m – Extracción de características desde emails.
indica archivos que necesitas completar
A través de este ejercicio, usarás los scripts ex6.m.
Este script configura el conjunto de datos para los problemas y hacen llamadas a funciones que tu
escribirás. No necesitas modificar ninguno de ellos. Solo requieres modificar las funciones en los
otros archivos, siguiendo estas instrucciones.
Los ejercicios usan Octave, un lenguaje de programación de alto nivel para computaciones
numéricas. Puedes referirte a la página de ayuda para la instalación del mismo.
(https://class.coursera.org/ml/wiki/view?page=OctaveInstallation)
SUPPORT VECTOR MACHINES
En la primera mitad de este ejercicio, se usará support vector machines (SVMs) con varios
ejemplos de conjuntos 2D. Al ir probando estos conjuntos nos ganaremos una intuición de cómo
SVM trabaja y cómo se usa el kernel gausiano con SVMs. En la siguiente mitad del ejercicio se
usará support vector machines para construir un clasificador de spam.
El archivo ex6.m ayudará paso a paso a desarrollar la primera mitad de esta práctica.