Post on 11-Oct-2015
Olga Madrigal Arias
Jenny Gonzlez
Luis Serrano Rojas
Milton Ruiz Cid
Rigoberto Carvajal
Integrantes:
HISTORIA
Cdigo Abierto
Fusin
Que es?
Facebook Apache
Donde Verticalidad
B.D.R. Ajustar Costos
Por qu?
Clave- Valor
Tipo?
TIPOS DE ALMACENAMIENTOASCII
BIGINT
BOOLEAN
BLOB
COUNTER
DECIMAL
FLOAT
MapReduce
Fraccionar operacin
compleja para recoger los resultados y unificarlos
NoSQL Cassandra -Hadoop
Visin general de Cassandra
BigTable + Dynamo Modelos de datos semiestructurados Descentralizado no hay roles especiales, no
hay SPOF Es horizontalmente escalable Las escrituras son rpidas, lee rpido Consistencia tunable
Configuracin analtica separada
Un solo grupo Cassandra con diferentes centros de datos virtuales
Nodos de acceso aleatorio en tiempo real
Nodos para la analtica
CassandraHadoop
Hadoop
HadoopCassandra
Cassandra
Costos
Entrenamiento
Soporte
Consultora
Ofrece la posibilidad de utilizar hardware de los productos bsicos baratos y maximizar el rendimiento.
Los requisitos de almacenamiento slo van a incrementar con forme los datos crecen.
Escenarios y ejemplos en los que se utilizaWEB
Juegos
Gobierno
Marketing y Publicidad
Entretenimiento DigitalSoftware
Viajes
Seguridad
Aplicaciones Mviles
Lenguajes de programacin soportados Lenguaje de consulta: CQL
Clientes:
Python
Java (Incluido Driver)
Scala
Node.js (Incluido Driver)
Clojure
.NET
Ruby (Incluido Driver)
PHP (Incluido PDODriver)
Perl
C++
Haskel
Arquitectura local
1) El cliente escribe a cualquiera de los nodos.
2)El nodo coordinador replica a los nodos y zonas
3)Los nodos devuelven al coordinado un ACK
4)El Coordinador devuelve un ACK al cliente.
5)Los datos se escriben al disco interno de commit log.
Multi zonas y rack
Arquitectura global
Cassandra segn CAP
AP
CP
CA
Componentes Principales
Clster
Nodo
Keyspace
Tabla
Columnas {clave, valor, timestamp}
Seguridad
SSL Cliente-nodo
Nodo-nodo
Cqlsh
Autenticacin interna Basada en cuentas de login y contraseas
Autorizacin interna GRANT/REVOKE
Software de seguridad externa: Kerberos
LDAP (Lightweight Directory Access Protocol)
Alta disponibilidad
Teorema CAP? Cassandra es AP (Availability, Partition
tolerance)
Replicacin SimpleStrategy
OldNetworkTopologyStrategy
NetworkTopologyStrategy
Optimizaciones (modo asincrnico) Hinted Handoff
Read Repair
Alta escalabilidad
Replicacin en muchos servidores
Escalabilidad lineal: solo agregue mas nodos
Sin un nico punto de fallo
No se compromete el rendimiento
Recuperacin ante desastres
Cassandra tolerante a fallos por diseo Sistema distribuido, peer-to-peer
Nodos en cluster equivalentes No existe PUF Protocolo Gossip Commit log
Copias geodistribuidas Rack Data Center Multi Data Center
Respaldo y restauracin de copias de seguridad Snapshot
Un nodo nodetool snapshot Todo el cluster nodetool snapshot + pssh
Diferencias y Similitudes con los Sistemas
Tradicionales
ComplejidadVolumenVariedadVelocidad
Datos entrada y salida
Datos estructurados, semi y no estructurados
Datos de terabyte o petabytes de tamao
Datos que se almacenan en diferentes lugares
Diferencias y Similitudes con los Sistemas
Tradicionales
Cassandra
81.58
SQL Server
1246.60
Oracle
1485.12
Diferencias y Similitudes con los Sistemas
Tradicionales
Caracterstica
Versin Licencia Lenguaje SQL
Cassandra
2008 Open Source Java NoSQL
SQL Server
1989 Comercial C++ Si
Oracle
1980 Comercial C y C++ Si
Diferencias y Similitudes con los Sistemas
Tradicionales
OracleAIX
LinuxSolaris
Windows
SQL ServerWindows
CassandraLinux OS X
Windows
Sistemas Operativos
Diferencias y Similitudes con los Sistemas
TradicionalesCaracteristica
ndices Script Servidor Paricionamiento
Cassandra
Si No S
SQL Server
Si Transac Si
Oracle
Si Pl/SQL Si
S
Cassandra
Segn la Versin
SQL Server S
Oracle
Replicacin
KEY AO
ESTADONOMBRE
COLUMNFAMILY: USUARIOS
KEYSPACE: MYKEYSPACE
Parte 1: Laboratorio
GNERO
MUCHAS GRACIAS!