El análisis de datos y reportes en redes sociales, es un tema que ha cobrado vida últimamente que estas herramientas se han utilizado de una forma masiva. No obstante, es interesante saber cómo es que se genera un reporte de comportamientos y tendencias de alguna red social.
Los temas de redes sociales no son temas de ciberseguridad. Forman parte de dos temas esenciales, el Big Data, que es el recopilar grandes cantidades de datos para poder analizarlos, entre ellos los de las redes sociales, y el data analysis, que es la ciencia que se encarga de extraer esta información para poder sacar estadísticas y gráficas.
Cualquier análisis de datos en redes sociales que se desee realizar sobre tendencias es laborioso, ya que se debe verificar el comportamiento de las cuentas. Se debe recopilar toda la información para posteriormente realizar el proceso de ETL, que es la depuración de la información para posteriormente ser presentada en gráficas y reportes (Business Intelligence).
Hagamos un pequeño ejercicio. Si usamos la herramienta TweetBinder y extraemos un reporte de un solo hashtag, tomará aproximadamente 5 minutos el reporte básico; y puede tomar hasta media o una hora en realizar filtros y demás adecuaciones.
Podemos extraer twitts, retwitts, links y otra información relevante del tema que se esta analizando.
Posterior a esto se genera una gráfica detallando esa información que se obtiene de un sistema de Big Data y por último, podemos ver las cuentas que han tenido que ver con esta tendencia que hemos usado en el ejemplo.
¿Cómo podemos saber cuáles cuentas son bots (programas que tienen la función de ser cuentas automatizadas) o usuarios reales? No podemos de momento, debemos utilizar otras herramientas para saber el comportamiento de cada una de las cuentas. Para esto podríamos agarrar la herramienta botometer, y esta nos va a decir que usuarios son bots. Sin embargo para solicitar eso tenemos que introducir cuenta por cuenta, ya que las cuentas se manejan por determinados scores.
Podemos utilizar otras herramientas como Microsoft® Flow o Microsoft® BI para crear ciertos flujos de trabajo donde extraer esa información y acomodarla, sin embargo, eso requerirá de conocer la metodología y el cómo funcionan estas herramientas, para de forma adecuada, poder extraer información que nos pueda servir para conocer más detalles de las cuentas que publican esta información, así como sacar estadísticas de horarios, días, etc.
Con ambas herramientas podemos hacer un análisis completo y real del como se van manejando ciertas tendencias, aunque no del todo solo pueden utilizarse estas, existen otras en el mercado con las cuales podemos sacar relaciones entre cuentas, por ejemplo.
Sin embargo, todo esto no sería posible sin hacer primero un verdadero trabajo de inteligencia que nos ayude a desglosar los datos que necesitamos, para poder extraer información útil. Ahora la pregunta que surge es: ¿Qué utilidad tiene el saber este tipo de información? Bueno, en la siguiente publicación de nuestro blog responderemos a eso.