Sebastian Esquerra Lopez

hace 1 año · 7 min. de lectura · ~10 ·

Blogging
>
Blog de Sebastian
>
¿Cómo lograr el éxito rápido de un negocio de bicicletas compartidas

¿Cómo lograr el éxito rápido de un negocio de bicicletas compartidas

Caso practico que forma parte del curso de Google correspondiente al análisis de datos.

En este caso practico soy un analista de datos júnior que trabaja en el equipo de analistas de marketing de Cyclistic, una empresa de bicicletas compartidas de Chicago. Nuestra directora de marketing cree que el éxito futuro de la empresa depende de maximizar la cantidad de membresías anuales. Por lo tanto, mi equipo quiere entender qué diferencias existen en el uso de las bicicletas Cyclistic entre los ciclistas ocasionales y los miembros anuales. A través de estos conocimientos, diseñaremos una nueva estrategia de marketing para convertir a los ciclistas ocasionales en miembros anuales. Sin embargo, antes de eso, los ejecutivos de Cyclistic deben aprobar mis recomendaciones; por eso, debo respaldar mi propuesta con una visión convincente de los datos y visualizaciones profesionales de los mismos.

1.- Preguntar

¿Cuál es el problema que intentas resolver?:

Identificar las diferencias entre los ciclistas ocasionales y los miembros anuales.

¿Cómo tus conocimientos pueden impulsar las decisiones empresariales?:

Utilizar técnicas avanzadas de análisis de datos para extraer información significativa de conjuntos de datos complejos.

2.-Preparar

Los datos se ubican en la web oficial de la empresa y constan de 12 tablas que representan los datos obtenidos de los últimos 12 meses respectivamente, Mayo del 2023 hasta Abril del 2024, cada una de las tablas contiene mas de 100,000 filas, las cuales representa un ID de viaje respectivamente.

Decidimos extraer una muestra de 385 registros a cada una de las tablas, esto utilizando el principio de que número 385 se obtiene al considerar, para un nivel confianza de 95%, la desviación media de 1.96, y un margen de error de 5%.

Como resultado obtuvimos una tabla con 4613 registros que como mencionamos anteriormente abarcan desde Mayo del 2023 hasta Abril del 2024.

Esta registro sera la base para el análisis que posteriormente haremos para responder la pregunta anteriormente planteada la cual recordamos que es: ¿En qué se diferencian los socios anuales y los ciclistas ocasionales con respecto al uso de las bicicletas de Cyclistic?.

Describiendo la tabla, contamos con 13 columnas cuyo nombres son: ride_id, rideable_type (tipo de bicileta), started_at(fecha y hora de inicio), ended_at (Fecha y hora de cierre), start_station_name (Nombre de la estacion de inicio), start_station_id, end_station_name(Nombre de la estacion de cierre), end_station_id, start_lat(latitud de inicio), start_lng(Longitud de inicio), end_lat(Latitud de cierre), end_lng (Longitud de cierre) y member_casual(SI el cliente es miembro o casual).

 

 - OME IHI can
5 70

AVOW707300. 58

TE GRVFTTION 0 OPROWIIZA 0 Curve A Dereon TALS)

ANG
111748

or vr § etc § TALI

41 G75 G7 6A

"HP BIA mtx Sen PVOWIOTINE0 PVOWIOTINEAL banc al PA Ka BW S010 Rac hor A 150 52 1304 A1ES061 E76EIES 41861767 87 6Wah [
CONN a ar NUON) IVOWAZS 158) Cat Dr mrort  TALI O07 rhe & fro A TALS As 6M 41K 67 pes i

BAZCEA NCH lana bin AVOWIOTIS 56 AVROWZ073 16:05 Maint S24 Weigh twos TAL 309000061 Fac rho AB Srton § TA S0G00007 ALGINATE ANT ALG BT 6h [
[6 MO ere ur VOWS AYOVI023 7030 St ort er Wr oT 5 aan arms 419 aren :
677A OFC wha tr Sen 77 ZIRT TOS Kets Ar A Mba or. 13065 AGA E720 aa [
NDA irc bir 1 OWA7IN07 1 7OWZO73 113 eter Brat A Slat KALSOG000016 A] Nabi 575A 4177 .
) AOU § EC cana ben VIOWATIN SE VI AOWFOZEN 706 Kets or Aor A Miwa con 13068 Cal bora Avr & Miwa, 13064 AV GUAT 87 207857 AVIRA BTHRAINE [
) BRAZEN HM clanae ben 120W073 1601 N2/0WF073 1617 § mare a PA kia B Wail S010 Acar Plavatar 1 13431 A1E074 876M AL B00 87607767 [
AC cee ter PAGVAGZSIS) PADWIZINES Core SA emer Aor AVAGO Ss Cowon har Torr 5 004 rn 876I07 401737 87S i
F OBRDSATOAL rim toc ben FEOWIOTINEDN FEROWIOTINE NY Malate! SA Worgh twoos TALS0G000061 alate! 52 A Roncon 52 TAL 309000075 A GNE ETNA ALM 7 tA [
| SASCRIAZY clam Sir TIRWITTING HD TIOWPTTINT AZ Walnteet SA Worgh woos TA S0R000061 wate 2A Rowcon 52 TA1309 7h ALGINATE A077 ALM 7 eA )
, "God 77CANN cham Siew OIOWATING TE O/0WAZIN63] Care SA Drummond PB TAIS0 000147 Clare SA Weil gion A TA130 70001386. ALIAE ETM ALKA BTN [
 ACMEI0Y clam ber OW IT73 16 53 OWIT73 16 Ss Clare 2 A Demmonet A TALS0, 0147 ae 52 A World ~ogton A TA130. JE ALKA ET GAT AL KAD] E764 TNE )
"AVA CODA cham Siem AVOWF0731037 AVOWF073 1040 Clare A Demmondt B TALI0/000147 Clare 52 A Worl wir A TA130 20001736 ALIAE ETM ALKA BTN [
DB GOAL siete ber WONT 77 AT WONT 77 AY Waiatet 52 A We gh tween TAL 309000061 cok Aww A Act aoe § TAY S09 5 41979167 ET GANT 41 M610 87673306 .

"MAR 2008 7 clamax ber VOW HVOWAT 1408 Wabans Aur A Granct Aut TATI0N00011 7 Wabont Aw A Greet A TATI0N00011 7 A159108 67676701 ALSNME 5767001

 

Ejemplo de datos sin procesar

 

3.- Procesar.

Para hacer una limpieza de los datos utilizaremos Excel, una herramienta de hoja de calculo que nos permite manipular la tabla de una forma simple.

Pasos del proceso

1.- Primero eliminamos las columnas de start_station_name, start_station_id, end_station_name, y end_station_id ya que no consideramos que sean de importancia a la hora del análisis correspondiente.

2.- Creamos una columna llamada ride_lenght(min), donde tendremos la duración en minutos de cada uno de los viajes realizados esto lo obtuvimos calculando la extensión de cada viaje restando la columna “started_at” de la columna “ended_at”.

3.- Creamos una tabla donde tendremos el día de la semana en el que se realizo el viaje, esto con la función “WEEKDAY", donde 1=lunes, 2=martes, 3=miércoles y así respectivamente para los 7 días de la semana.

4.-Utilizamos un proceso similar para obtener el mes en el que se realizo el viaje.

5.-Agregamos los filtros a cada una de las columnas de la tabla y verificamos que no hubiera valores nulos o atípicos e igualmente con la función de formato condicional, corroboramos que no hubiera datos duplicados.

A continuación publico un enlace para visualizar la tabla resultante.

Datos generales

4.- Analizar

A continuación haremos el análisis de los de los datos utilizando SQL.

SQL es el lenguaje universal de las bases de datos. Si quieres meter, sacar, actualizar o borrar datos en una base de datos, SQL es la herramienta que usas. Es como hablar con la base de datos para decirle qué hacer con la información que tiene guardada. Es algo así como el idioma que todos los programas usan para comunicarse con la base de datos y hacer que haga lo que necesitas.

Específicamente para este proyecto utilizaremos SQLite el cual es un sistema de gestión de bases de datos relacional y su ventaja es que no requiere de un servidor separado para funcionar, ya que la base de datos se almacena en un solo archivo. Esto lo hace perfecto para aplicaciones más pequeñas o para situaciones donde no necesitas una base de datos enorme.

Utilizaremos igualmente DB browser (SQLite) la es una es una herramienta de código abierto que permite visualizar, editar y administrar bases de datos SQLite de manera fácil y conveniente. Es como una especie de caja de herramientas para interactuar con bases de datos SQLite de forma gráfica, sin necesidad de escribir comandos SQL manualmente.

Ri ostzto Bopon ontobae | @ e

Databans WHI] Bower Data £58 Pragman Eeute 50

LJ] A) LJ] LJ] LJ o 8 >

(ry i. ore,

pen moet @ . x

(ry i. “chemo

Qt 10g [D8 hema) emote

Interfaz de DB browser.

 

Primero creamos el proyecto en DB browser, en este caso lo llamaremos "proyecto bicicletas".

Luego importaremos la base de datos que se encuentra en Excel al DB browser, esto se logra convirtiendo el libro de Excel con extensión ".xlsx" a ".csv", esto se hace ya que en DB browser solo se puede importa archivos delimitados por coma.

V

LY BE EN]

8 indices (0)
av
FF triggers (0)

©

«

REATE TABLE “dat.

*ormovews ov

Una vez importada la base de datos en el Browser verificamos que estén todas la columnas originales de la base de datos.

- @ lables (1)

~ 8 database CREATE TABLE “database” (71
® ride id INTEGER “ride id” INTEGER
B rideable type Text “tideable type” TEXT
B started at TEXT “started at” TEXT
B® ended at Text “ended at” TEXT
B® ride lenght Text “ride lenght” TEXT
B day of week INTEGER “day of week” INTEGER
® month NUMERIC “month” NUMERIC
B tart lat REAL “start lat” REAL
B tart Ing REAL “start Ing” REAL
Bend lat Text “end lat” TEXT
Bend Ing REAL “end Ing” REAL
B member casud Text “member casual” TEXT

Como podemos observan se encuentran las 12 columnas de datos.

Procedemos a verificar si se cuentan con los 4613 registros que obtuvimos en la base de datos final en Excel, utilizan la función COUNT() DE SQL.

SELECT count ( ) from database

4613

Como observamos si contamos con los 4613 registros de la tabla.

Conoceremos el promedio del tiempo de viaje por tipo de cliente, así como el recorrido mas largo igualmente por tipo de cliente, utilizando las funciones como AVG() y MAX(), así como la función AS, para darle un nombre provisional a la columna y la función GROUP BY, para agrupar los datos según el tipo de cliente.

SELECT as

round (avg ( ).,2)as
x ( ) as

from Database

GROUP by

 ——
190 Se chente promeda Se ve trot maemo
casual 2n4 279
7 member 1.7% 1472

En este análisis podemos observas que los clientes casuales tienen en promedio un mayor tiempo de uso de las bicicletas, igualmente observamos que el recorrido mas largo de los clientes casuales es de 279, mientras que el recorrido mas largo de los clientes miembros es de 1472, mas 5 veces mas grande que el de los clientes casuales.

Veremos el tiempo promedio de viaje según el tipo de cliente por cada día de la semana.

+ 5 round (avg (

190 <hrnte
members
casual
members
casual
members
casual
members
casual
members
casual
members
casual
members
casual

doy of weet promed

12.07
2.76
187
18.9)

139
1396
11.46
20.04
2.0
18.81
12.14

26.0
15.26
23.68

Lo que podemos observar es igualmente como cada día de la semana el promedio de tiempo es mayor para los clientes casuales que para lo clientes miembros.

Veremos ahora que dice el numero de viajes realizados.

mala x B
count. ) an 110m database
up by

to Se chente nme dene
© tasual 608
7 member 4005

Como vemos, los clientes miembros utilizaron mas 6 veces mas el servicio de bicicletas en el año.

Analizaremos el numero de viajes por día de la semana según el tipo de clientes.

as '

-
@
o
]

» database
as ' .
) as from database

 

to Se hente
members
casual
members
casual
members
casual
members
casual
members
casual
members
casual
members
casual

Say of week fumed Se vps

S67
67
“60
83
6/7
67
640
89
571
89
SA
1m
4
110

Observamos que a lo largo del año y tomando como referencia los días de la semana, absolutamente en cada día se presentaron mas viajes hechos por clientes miembro que hechos por clientes casuales.

5.- Compartir

Primero aclarando que es un dashboard tenemos que es una herramienta visual que muestra datos importantes de forma clara y concisa en una sola pantalla. Puede contener gráficos, tablas y otros elementos visuales para resumir información compleja y facilitar la toma de decisiones informadas. Puede ser estático o interactivo, y se usa en diversos campos para monitorear y analizar datos clave.

A continuación mostraremos los elementos visuales con los cuales podremos representar de una forma efectiva los hallazgo que obtuvimos, dichos gráficos serán hechos en la herramienta de visualización, Power Bi, donde generaremos el siguiente dashboard:

 

Este dashboard nos demuestra distintas métricas que nos servirán para mostrar los resultados que obtuvimos a la pregunta que originalmente queríamos contestar.

Mostraremos las distintas partes del dashboard:

tenemos de forma visual el promedio de duración de viaje en minutos por día de la semana y el tipo de usuario, donde se deja claro que los clientes casuales utilizan en promedio mas tiempo el servicio de bicicletas. analizando mas vemos como la diferencia mas grande se la lleva el día lunes y el día sábado, y es el día miércoles donde vemos que el promedio esta prácticamente a la par.

Ahora tenemos una visualización donde mostramos el numero de viajes realizados por día de semana y tipo de usuario, donde logramos observar como los clientes miembro hacen mas viajes a lo largo de semana que lo clientes casuales, siendo el día miércoles el día con mas viajes a lo largo del año por parte de dichos clientes miembros.

 

En la siguiente visualización tenemos como métrica el numero de viajes hechos por mes y tipo cliente, vemos que a lo largo de los 12 meses, los clientes miembro realizan muchos mas viajes en bicicletas que los clientes casuales.

igualmente podemos observar en conjunto los clientes utilizan mas la bicicleta eléctrica con 62.91% de los registros, con un 36.57% la bicicleta clásica es la segunda mas utilizada y con un 0.52% la bicicleta docked es la menos utilizada de las tres.

Utilizando una segmentación de datos podemos observar particularmente ciertos datos específicos según el tipo de cliente. observamos que en cuanto a clientes casuales:

Notamos como de los registros totales los clientes casuales abarcan el 13.18% del total, con una duración de viaje promedio de 21.42 minutos y el viaje mas largo fue de 279 minutos.

Podemos igualmente observar que por parte de los clientes miembros, tiene un 86.82% del porcentaje total de viajes realizados y tiene un duración promedio de viaje de 12.75 minutos, así como que el viaje mas largo registrado es de 1472 minutos.

Compartir

Aprovecharemos este apartado para compartir nuestras conclusiones sobre el caso practico anteriormente realizado.

Como observamos anteriormente, se utilizaron distintas métricas, métricas que posteriormente se analizaron, todo esto con el fin de contestar la pregunta principal con respecto a este proyecto la cual recuerdo que era, ¿En qué se diferencian los socios anuales y los ciclistas ocasionales con respecto al uso de las bicicletas de Cyclistic?. Basándonos en esta pregunta y en los análisis hechos utilizando herramientas como Excel, SQlite y Power Bi, llegamos a las siguientes conclusiones:

1.- En promedio, los clientes casuales hacen viajes mas largo que los clientes miembros, con un promedio de 21.42 min (clientes casuales), contra un promedio de 12.75 min (clientes miembros).

2.-Los clientes miembros hacen mas viajes que los clientes casuales, siendo un 86.82 % de los registros del análisis, contra un 13.18% de los clientes casuales.

3.- El día de la semana en el que los clientes casuales utilizan mas tiempo el servicio de bicicletas es el día sábado mientras que el día en los clientes miembros utilizan mas tiempo el servicio de bicicletas es el día domingo, concluyendo igualmente que el fin de semana es cuando se utiliza mas tiempo el servicio de bicicletas en promedio.

4.- El día de la semana en el que los clientes casuales mas veces el servicio de bicicletas es el día sábado mientras que el día en los clientes miembros utilizan mas veces el servicio de bicicletas es el día miércoles.

5.-El mes en el que mas viajes se realizan por parte de los clientes miembros es el mes de diciembre, mientras que el mes en el mas viajes se realizaron por parte de los clientes casuales es julio.

7.- Igualmente se puede concluir por el análisis que el día de la semana donde los clientes miembros utilizan en promedio por menos tiempo el servicio de bicicletas es el día jueves y a su vez el día en que los miembros casuales utilizaron en promedio menos el tiempo el servicio fue el miércoles, concluyendo que es a mitad de semana cuando menos se utiliza el servicio.

8.-En el análisis que el mes donde los clientes miembros utilizan menos veces el servicio de bicicletas es el mes de Julio y a su vez el mes en que los miembros casuales utilizaron menos veces el servicio fue en diciembre con 0 registros ese mes.

9.- También en el aspecto de los tipo de bicicletas obtuvimos que los clientes miembros utilizan mas la bicicleta eléctrica, con un 65.89% de los registros, mientras que los clientes casuales utilizan mas la bicicleta docked con 52.8% de los registros.

A continuación presento la siguiente tabla con la información anterior resumida:

Ciencia y tecnología
Comentarios

Te pueden interesar estos trabajos