El término big data se usa generalmente para referirse a grandes cantidades de datos no estructurados o semi-estructurados. Y que, por su tamaño, el esfuerzo de incorporarlos a una base de datos relacional supondría demasiado coste. Otra definición más clara aún: hablamos de “big data cuando el tamaño de los datos se convierte en parte del problema”. O, como dice Edd Dumbill, “cuando los datos son lo suficientemente grandes como para poder ser procesados con métodos tradicionales”. Cuando en este contexto se habla de “grandes volúmenes de datos” no existe una cantidad específica sobre la cual se pueda empezar a hablar de big data, aunque el término se utiliza normalmente cuando estamos ante petabytes o exabytes.
Hay que tener en cuenta que esto del big data es un tema que la tecnología aún no tiene resuelto del todo, y que aún se encuentra en investigación.
Si quieres seguir con el tema, te dejo y recomiendo este artículo que Adam Jacobs publicó en Comunications of ACM: The Pathologies of Big Data.