undefined
Blog > Conocimiento > Post

Sentimiento Análisis para Comentarios de Hoteles

Wednesday, March 11, 2020

travel aggregate sites

 

Te guste o no, las reseñas de los huéspedes se están convirtiendo en un factor importante que afecta las reservas/compras de las personas.
 

Piensa en tu propia experiencia. Cuando buscas un lugar para quedarte de vacaciones en Expedia / Booking/TripAdvisor, ¿qué haces? Estoy dispuesto a apostar que estarás desplazándote por la pantalla para ver las reseñas antes de que te des cuenta.
 

Si todavía tiene dudas sobre la importancia de las reseñas de los huéspedes para su negocio, puede valer la pena consultar las estadísticas:

 guest reviews are important

 

En otras palabras, las opiniones de los huéspedes influyen claramente en la decisión de reserva de las personas, lo que significa que es mejor que prestes atención a lo que la gente dice sobre tu hotel.

No solo desea leer las reseñas, sino analizarlas de una manera que pueda ayudarlo a aprender más sobre sus clientes. Las revisiones pueden decirle si cumple con las expectativas de sus clientes, lo cual es crucial para desarrollar estrategias de marketing basadas en las personas de sus clientes.
 
Las revisiones son importantes y usted, como propietarios de hoteles, debe comenzar a aprovecharlas.

 

¿Pero cómo?

 

 

 

 

¿Qué es el análisis de sentimientos?

El análisis de sentimientos, también llamado minería de opinión, es una técnica de minería de texto que podría extraer emociones de un texto dado, ya sea positivo, negativo o neutral, y devolver un puntaje de sentimiento. Esta técnica se usa generalmente en reseñas o textos de redes sociales.

 

En este artículo, le mostraré cómo recolectar opiniones de hoteles de manera efectiva utilizando web scraping tool y realizar análisis de sentimientos utilizando Python.

 

 

Raspe las revisiones con Octoparse

La herramienta de raspado web que utilicé se llama Octoparse. Es un raspador web de bricolaje creado para personas sin codificar fondos, como yo. Le mostraré cómo usar Octoparse para raspar las críticas del hotel número 1 en la ciudad de Nueva York: Hotel Giraffe de Library Hotel Collection.

 

 

Aquí está el enlace a la página web:

https://www.tripadvisor.com/Hotel_Review-g60763-d99762-Reviews-Hotel_Giraffe_by_Library_Hotel_Collection-New_York_City_New_York.html#REVIEWS

 

Primero, importaremos nuestra URL web objetivo en Octoparse.

 

 

go to web page

 

Tenga en cuenta que solo hay 5 comentarios en cada página, por lo que si necesitamos recorrer todas los comentarios, debes paginar en todas las Octoparse páginas de comentarios

 

pagination

 

Cuando miramos cuidadosamente las revisiones, podemos ver que hay un botón "Leer más" en algunas de las revisiones. En este caso, nuestro rastreador deberá hacer clic en el botón para cargar toda la revisión antes de extraerla.

 

 read more button

 

 

 

A continuación, revisaremos todos los elementos de revisión y extraeremos cada revisión.

Por último, arrastre el "elemento de bucle" recién creado y colóquelo debajo del primer "elemento de bucle". Esto se debe a que primero queremos hacer clic en "Leer más" antes de proceder a extraer las revisiones reales.

 

loop item

 

Una vez que hayamos extraído con éxito todas las reseñas de este hotel, estamos listos para obtener el puntaje de opinión para cada reseña utilizando Python.

 

reviews

 

Consejos:

Para obtener un tutorial paso a paso más detallado sobre el raspado de las reseñas de los huéspedes, consulte esta publicación.

 

 

 

Análisis de sentimientos con Python

Primero, importaríamos las bibliotecas. Aquí usaremos dos bibliotecas para este análisis.


El primero se llama pandas, que es una biblioteca de código abierto que proporciona estructuras de datos y funciones de análisis fáciles de usar para Python.


El segundo que usaremos es una biblioteca poderosa en Python llamada NLTK. NLTK significa Natural Language Toolkit, que es una biblioteca NLP de uso común con muchos corpus, modelos y algoritmos.

 

import library 

 

Avancemos e importemos las reseñas raspadas.

 

import review

 

Aquí hemos aplicado una función llamada SentimentIntensityAnalyzer() in nltk.sentiment.vader. SentimentAnalyzer puede implementar y facilitar tareas de análisis de sentimientos con algoritmos y características NLTK, por lo que las puntuaciones de los sentimientos pueden generarse sin una codificación compleja. Antes de usarlo, debemos llamarlo.

 

call function

 

Ahora hemos llamado a la función, aplíquela para generar los puntajes de polaridad. Hay cuatro tipos de puntajes: negativo, neutral, positivo y compuesto. Mediante el uso de apply() y lambda, podríamos transformar el resultado y ponerlos en el marco de datos de "revisiones".

 

 

apply and lambda

 

Luego tenemos el puntaje de opinión para cada revisión.

 

sample result 

 

Cada revisión tiene una puntuación negativa, una puntuación neutral, una puntuación positiva y una puntuación compuesta. El puntaje compuesto es una evaluación integral de los primeros tres puntajes. Este puntaje varía de -1 a 1. Normalmente estableceremos un umbral del puntaje compuesto para identificar el sentimiento. Aquí podríamos establecer el umbral como ±0.2. Si el puntaje compuesto de una revisión es mayor que 0.2, entonces la revisión es positiva. Si el puntaje compuesto de una revisión es menor a 0.2, entonces la revisión es negativa. Si el puntaje compuesto está entre -0.2 y 0.2, entonces la revisión es neural.

 

percentage of reviews

 

 

Como podemos ver, el 97.2% de las revisiones son positivas y solo el 1.22% de las revisiones son negativas. Según el resultado, es seguro decir que el Hotel Giraffe by Library Hotel Collection es un hotel muy querido.

Por supuesto, hay mucho más que podríamos hacer para analizar más a fondo las revisiones:

  • Cree una nube de palabrasun modelo de modelado de temas para identificar cuáles son las razones clave por las que la gente ama este hotel.
  • Compare los puntajes de opinión con otros hoteles extrayendo las reseñas de otros hoteles y analizando con los pasos anteriores.
  • Extraer más información como la fecha de revisión, la contribución del revisor, el voto útil del revisor, revisar el voto útil, el número de acciones, etc., visualizarlos y aplicar enfoques de análisis de negocios.

 

Ahora sabe lo importantes que son las revisiones para el éxito de su negocio. ¿Por qué no visitar Octoparse y probarlo usted mismo? Octoparse es un raspador web fácil de usar que podría ayudarlo a convertir sitios web en datos estructurados con clics. Mejor aún, hay ready-to-use templates(plantillas listas) para usar y versiones gratuitas de por vida. ¡No dude en contactarnos si necesita ayuda con su proyecto relacionado con el raspado web!

 

¡Descarga Octoparse para comenzar con el web scraping o contáctanos para cualquier
pregunta sobre el web scraping!

Contactarnos Descargar
Usamos cookies para mejorar tu experiencia de navegación. Lee sobre cómo usamos las cookies y cómo puedes controlarlas haciendo clic en la configuración de cookies. Si continúas utilizando este sitio, acepta nuestro uso de cookies.
Aceptar Rechazar