it-swarm-es.com

hadoop

¿Cuál es el uso del comparador de agrupación en hadoop map reduce

mapa hadoop reducir la clasificación secundaria

package org.Apache.hadoop.conf no existe después de configurar classpath

Hadoop Java Error: Excepción en el hilo "main" Java.lang.NoClassDefFoundError: WordCount (nombre incorrecto: org / myorg / WordCount)

DataNode no se inicia en el nodo único hadoop 2.6.0

Hive FAILED: ParseException line 2: 0 no puede reconocer la entrada cerca de '' macaddress '' 'CHAR' '(' en la especificación de la columna

¿Hay un equivalente .NET a Apache Hadoop?

¿Cómo funciona el algoritmo de clasificación de MapReduce?

Java vs Python en Hadoop

Escribir datos en Hadoop

Almacenamiento de imágenes escalable

Hadoop one Map y multiple Reduce

¿Qué debe ser hadoop.tmp.dir?

¿Dónde HDFS almacena archivos localmente de forma predeterminada?

Encadenamiento de varios trabajos de MapReduce en Hadoop

Cambiar el tamaño de bloque del archivo dfs

Grandes conjuntos de datos gratis para experimentar con Hadoop

¿Cómo realiza Hadoop divisiones de entrada?

¿A dónde enviará hadoop mapreduce framework mis declaraciones System.out.print ()? (stdout)

¿Diferencia entre cerdo y colmena? ¿Por qué tienen ambos?

Pig Latin: carga varios archivos de un rango de fechas (parte de la estructura de directorios)

Fusionar múltiples archivos en uno dentro de Hadoop

Ordenar datos grandes usando MapReduce / Hadoop

¿Hive tiene una función de división de cadena?

¿Cómo puedo usar el tipo de datos del mapa en Apache Pig?

Hadoop Pig: pasar argumentos de línea de comando

Cómo comenzar con el análisis de Big Data

¿Qué es exactamente la configuración del quórum zookeeper en hbase-site.xml?

Error de trabajo de transmisión de Hadoop fallido en python

¿Por qué no se implementa Hadoop usando MPI?

¿Hadoop copia un directorio?

Recuperación de modo seguro de Hadoop: ¡demora demasiado!

¿Dónde almacena Hive los archivos en HDFS?

Error HDFS: solo se puede replicar en nodos, en lugar de 1

Cómo convertir un archivo .txt al formato de archivo de secuencia de Hadoop

¿Crear una tabla temporal en Hive?

Mover archivos en Hadoop usando Java API?

Hadoop, cómo comprimir la salida del mapeador pero no la salida del reductor

fusionar archivos de salida después de reducir la fase

Solo suficiente Java para Hadoop

Cómo solucionar "El intento de tarea_201104251139_0295_r_000006_0 no pudo informar el estado durante 600 segundos".

¿Cómo obtener los nombres de los trabajos de hadoop actualmente en ejecución?

Iterar dos veces en valores (MapReduce)

Cliente de Hbase ConnectionLoss por error / hbase

Buscar / encontrar un archivo y contenido de archivo en Hadoop

¿Cómo rastrear qué bloque de datos está en qué nodo de datos en hadoop?

COLLECT_SET () en Hive, ¿mantener duplicados?

¿La forma de comprobar un tamaño de directorio HDFS?

¿Qué se entiende por datos escasos / almacén de datos / base de datos?

¿Qué es el Dremel de Google? ¿Cómo es diferente de Mapreduce?

Establecer el número de tareas de mapa y reducir tareas

Cómo iniciar el desarrollo de mahout

Hadoop en OSX "No se puede cargar la información del reino desde SCDynamicStore"

Hadoop: ¿comprimir archivo en HDFS?

Procesamiento de datos a gran escala Hbase vs Cassandra

¿Cómo copio archivos de S3 a Amazon EMR HDFS?

LeaseExpiredException: sin error de arrendamiento en HDFS

¿Cómo cargar datos a Hive desde HDFS sin eliminar el archivo fuente?

¿Es mejor usar el paquete mapreduce o mapreduce para crear un trabajo de Hadoop?

Cómo escribir la subconsulta y usar la cláusula "En" en Hive

Cómo sobrescribir / reutilizar la ruta de salida existente para trabajos de Hadoop nuevamente y nuevamente

El cliente Hbase no puede conectarse al servidor remoto Hbase

Diferencia entre hadoop fs -put y hadoop fs -copyFromLocal

Cómo hacer una unión externa en dos columnas en Pig Latin

Namenode no está empezando

¿Cómo elegir entre Cassandra, Membase, Hadoop, MongoDB, RDBMS, etc.?

Pasar argumentos a los mapeadores de Hadoop

Diferencia entre `hadoop dfs` y` hadoop fs`

Pasar parámetros a la función de mapa en Hadoop

error de memoria en Hadoop

¿Cuál es la forma más rápida de cargar datos de forma masiva en HBase mediante programación?

Hadoop: «ERROR: Java_HOME no está configurado»

Hadoop Datanodes no puede encontrar NameNode

Colmena: creación de tablas con múltiples archivos con múltiples directorios

anular log4j.properties en hadoop

¿Cómo usar Sqoop en Java Program?

seleccione recuento distinto usando latín cerdo

Acerca de la división de archivos Hadoop / HDFS

$ HADOOP_HOME está en desuso

¿Cómo escribir trabajos de hadoop 'solo mapa'?

Forma más limpia en Gradle para obtener la ruta a un archivo jar en el caché de dependencia de Gradle

Cambiar el tamaño de división de archivos en Hadoop

¿Hive tiene algo equivalente a DUAL?

Llamar a un trabajo mapreduce desde un simple programa Java

CERDO cómo contar un número de filas en alias

¿Cómo depurar trabajos hadoop mapreduce de eclipse?

Formato de salida JSON para resultados de Hive Query

No se inician nodos de datos

conexión hbase rechazada

MPI vs GPU vs Hadoop, ¿cuál es la principal diferencia entre estos tres paralelismos?

¿Cuál es la diferencia entre Apache Pig y Apache Hive?

Error de replicación de datos en Hadoop

Hadoop Java.io.IOException: Mkdirs no pudo crear / some / path

Diferencias entre Amazon S3 y S3n en Hadoop

hbase no puede encontrar una tabla existente

hadoop: diferencia entre 0 reductor y reductor de identidad?

¿Qué son los archivos SUCCESS y part-r-00000 en hadoop?

¿Por qué necesitamos ZooKeeper en la pila de Hadoop?

java.sql.SQLException: org.Apache.thrift.transport.TTransportException en la colmena?

Descargar datos de gran tamaño para Hadoop