INTRODUCCIÓN
La búsqueda de instrumentos capaces de predecir el comportamiento financiero de los activos listados en las bolsas de valores es un problema en permanente discusión en la literatura científica y empresarial cuya solución ha intentado ser aproximada con el uso de sofisticadas herramientas matemáticas a lo largo del tiempo, procurando identificar los patrones que configuran las causas de los mejores desempeños bursátiles a partir de la experiencia de la data obtenida por estos activos. Una solución a este problema por más aproximada que sea permitiría a los inversionistas y al mercado tener un mejor control del riesgo de las inversiones y conocer la ruta de las actividades clave que puedan ser gestionadas para agregar o mantener el valor de los activos listados en una clara protección a los inversionistas proporcionando al mercado mayor equidad y transparencia informada. La inversión bursátil constituye una alternativa para los excedentes de capital de todo inversionista independiente de su perfil de inversión y representan una alternativa democrática de acceso al mercado para los ciudadanos comunes lo cual ha sido especificado en la literatura en el análisis de los denominados “mercados eficientes”. En ese contexto entendemos por mercado eficiente a aquel ambiente en el cual cada actor cuenta con equidad de información en calidad, oportunidad de acceso y veracidad para tomar decisiones informadas en la manera como desarrolla sus transacciones para operar el dicho contexto.
Desde un punto de vista analítico el problema es complejo porque tradicionalmente ha sido abordado a partir de la regresión matemática con parámetros estructurados más o menos lineales en el supuesto que los hechos del pasado se repetirán en el futuro, sin embargo, las investigaciones demuestran que el comportamiento bursátil es claramente no lineal y es en simultáneo fuertemente sensible a la influencia de parámetros considerados aún como no estructurados que son a su vez altamente dependientes de la naturaleza del inversionista y su entorno. Existe abundante literatura que respalda el comportamiento no lineal de las actividades humanas, aunque el alcance psicológico de este accionar escapa claramente al alcance de la presente investigación. Sin embargo, es importante rescatar la diferencia entre información estructurada y no estructurada que abunda en relación al mercado de valores.
Para ello es necesario entender que existe un conjunto de variables que pueden ser cuantificadas y directamente extraídas de las memorias y reportes de las empresas que sustentan los activos como la rentabilidad sobre el capital (ROE), la rentabilidad sobre los activos (ROA), la capacidad de generar efectivo (EBITDA), el ratio precio-beneficio, la inversión en bienes de capital (CAPEX), el coeficiente de riesgo (BETA) y similares que surgen del análisis de la información contable, operacional, comercial y financiera con la que operan siendo esta información de carácter cuantificable, medible y reportable que configura una condición para ser considerada como variable estructurada en contraste con información más bien cualitativa, de características y atributos influenciados por el carácter y las emociones de los actores empresas y personas que se vinculan al contexto y son consideradas variables no estructuradas como el perfil del inversionista, el contexto político, la experiencia de los directivos, el grado de concentración familiar, la vulnerabilidad reputacional y similares que normalmente son excluidas del análisis tradicional.
Para lograr desarrollar mercados eficientes existe la necesidad de encontrar herramientas predictivas para identificar las mejores combinaciones rentabilidad-riesgo como las que pueden ofrecer actualmente las técnicas de Inteligencia Artificial basadas en algoritmos sobre BigData que permitirían a los inversionistas alinear con mayor precisión y seguridad sus portafolios a las diferentes alternativas de inversión en función al perfil del inversionista, con lo cual, el mercado sería más objetivo reduciendo los niveles de especulación y dejando un mayor espacio relativo para la entrada de inversionistas sofisticados con claros horizontes de inversión en este mercado.
En el caso del Perú, contamos con una bolsa de valores centrada en activos negociables excluyendo las bolsas de productos cuya existencia en el Perú no ha prosperado. La bolsa de valores peruana opera formalmente desde 1860 y fue formada sobre la base de la antigua Cámara de Comercio de Lima fundada a finales del siglo XIX (Giesecke & Contreras, 2007) evolucionando desde sus primeras necesidades para las transacciones de operaciones guaneras con las principales plazas europeas hasta nuestros días con la transacción de sofisticados activos financieros con operadores globales e inversionistas naturales e institucionales. El mercado de Valores peruano es un mercado $116 K MM y actualmente pertenece al MILA que globalmente se configura como el primer mercado bursátil más importante de América Latina. (Bloomberg, 2017; World Economic Forum, 2017).
Los activos tranzados en la Bolsa de Valores de Lima están constituidos principalmente de acciones, bonos y fondos cotizados.
La Tabla 1 muestra los activos financieros de mayor liquidez en el mercado de valores peruano en el período 2010-2016 registrados en la Bolsa de Valores de Lima por la Superintendencia de Mercado de Valores (SMV, 2017) representados por la cartera de activos 50% más liquida que operan en el mercado bursátil donde el criterio de liquidez utilizado en la segmentación está referido a la frecuencia de días de negociación del activo financiero en el mercado bursátil respecto a los días totales de operación de la rueda bolsa sobre la base de un mes de operaciones negociadas entre lunes y viernes de manera convencional.
METODOLOGÍA
La investigación plantea como hipótesis que solo algunos factores de la industria son determinantes en la conformación de las mejores combinaciones rentabilidad-riesgo, estableciendo como objetivo la búsqueda e identificación de estos factores a partir del uso de técnicas de inteligencia artificial aplicadas a la data del comportamiento de los activos bursátiles entre el 2010 y el 2016.
Para el análisis, utilizando el criterio de liquidez como criterio de segmentación, se ha segmentado la cartera de acciones 50% más líquida del mercado peruano correspondiente al período 2010-2016 a partir de datos de la Superintendencia del Mercado de Valores (SMV, 2017), incluyendo activos financieros cuya composición está basada en combinaciones de acciones de manera que pueda reflejar con mayor precisión el comportamiento del mercado peruano para identificar su correspondiente rendimiento y riesgo de mercado. A partir de esta selección se identifica un perceptrón multicapa con la configuración de 3 capas (21,85,2) con una función de activación logística optimizada con el algoritmo LBFGS (Shanno, 1970) con una taza de aprendizaje de 0.01 que permita establecer los patrones financieros, operacionales, comerciales o de gobierno corporativo que puedan explicar y predecir el comportamiento del mismo en el mercado.
El algoritmo LBFGS (Limited-BFGS) es un método de optimización de funciones complejas propuesto por Broyden, Fletcher, Goldfarb y Shanno a mediados de los años 70s (Shanno, 1970) que funciona como un método de activación logística que permite trabajar eficientemente con un alto número de variables haciendo un uso limitado de memoria que procesa entradas y las reconfigura en salidas predeterminadas (función logística) entrenándose a una tasa de aprendizaje determinada para obtener los mínimos de una función utilizando únicamente su estructura y el gradiente generando la optimización de manera más rápida y efectiva a un costo computacional razonable que se ajusta perfectamente a la naturaleza del problema planteado en la investigación presentada.
Para el entrenamiento de la red neuronal artificial se utilizó un 80% de casos aleatorios y para las pruebas el 20% restante, ajustándose los parámetros sobre la base de los mejores resultados obtenidos con un promedio de ajuste usando el algoritmo de Garson (Garson, 1991) para determinar la importancia de las características de entrada.
Las variables tradicionales utilizadas para la caracterización de cada activo financiero que se han seleccionado para el desarrollo de la presente investigación son el precio del activo, el EBITDA generado, las utilidades por acción, la rentabilidad (ROE y ROA), el CAPEX por acción, el grado de liquidez, el coeficiente beta de riesgo, la rotación del patrimonio, la rotación del activo, el ciclo de caja, el ratio precio/beneficio (PER), el ratio precio/valor contable, la capitalización bursátil, la rentabilidad del dividendo y el grado de endeudamiento. En el caso de la rentabilidad porcentual se ha considerado una rentabilidad real ajustada por la inflación acumulada entre el periodo 2010-2016 correspondiente al corte del 25.5944%. Las variables seleccionadas han sido extraídas de las bases de datos de Economática, Bloomberg, la Superintendencia del Mercado de Valores peruana (SMV) y la Bolsa de Valores de Lima (BVL).
Las variables no tradicionales utilizadas para la caracterización de cada activo financiero que se han seleccionado para el desarrollo de la presente investigación son la experiencia del Chief Executive Officer (CEO), el número de directores independientes, el porcentaje de concentración de la familia en el directorio, el grado de vulnerabilidad política, el grado de vulnerabilidad ambiental y el grado de vulnerabilidad reputacional. Estas variables han sido normalizadas para su integración en la metadata de la investigación.
Las especificaciones de la red neuronal utilizada son las siguientes:
Capas: 3 capas, una de entrada con 21 nodos, una oculta con 85 nodos (el mejor de la prueba utilizando de 1 a 100 nodos) y 2 en la capa de salida (rentabilidad y riesgo).
Taza de aprendizaje: 0.01 constante (valor estándar).
Optimizador: LBFGS, minimiza el error cuadrático (para obtener una regresión) entre el valor real y el predicho.
Función de activación en la capa oculta: Logística, regresa f(x)=1/(1+exp(-x)).
La combinación rentabilidad-riesgo de los activos de mayor liquidez durante el período 2010 al 2016 se presenta en la Tabla 2.
Revisión de Literatura
La predicción del comportamiento de activos financieros del mercado bursátil es un tema en permanente investigación por los especialistas. El análisis de portafolios de acciones cotizadas en bolsa de valores y del comportamiento de los fondos cotizados (ETFs) y fondos de inversión listados en bolsa han sido tratados en los trabajos de Karceski (2002), Rompotis (2011) y Arugaslan & Samant (2014) mediante el análisis de riesgo diferenciado a partir del coeficiente BETA y su impacto en el valor de los activos financieros. De igual forma las investigaciones de Sánchez & Wei (2010), Ivanov (2011) y Borkovec & Serbin (2013) proponen estrategias específicas de segmentación por liquidez aplicables a la cartera de fondos cotizados mientras que la investigación de DiLellio & Jakob (2011) y Meric et al. (2011) se enfocan en las estrategias de gestión para obtener la mayor rentabilidad de los fondos cotizados y activos financieros listados en el mercado de valores. El volumen de activos y su influencia como tamaño de cartera en los resultados de inversión ha sido tratado por Riepe & Iachini (2011); Bello (2012) y Li, Klein & Zhao (2012) mientras que en relación comparada a instrumentos similares se encuentra el trabajo de Sharifzadeh & Hojat (2012) quienes comparan la inversión y su riesgo en relación adicional a la exposición a nuevos mercados y nuevos instrumentos como los fondos mutuos. De igual forma el tratamiento de los fondos cotizados (ETFs), su naturaleza de gestión y el impacto de la inversión de los mismos ha sido tratado por Yamori (2011) quien explica esta realidad para el caso de la bolsa japonesa al permitir exponer a los inversionistas a nuevos mercados mundiales como oportunidad particular para acceder hacia el mercado americano y europeo.
La naturaleza de los fondos cotizados (ETFs) ha sido tratadas en las investigaciones de Madhavan, 2014; Schizas, 2014, Williams, 2014; Chang et al., 2015 y Jacobsen (2015) como una nueva oportunidad de acceso a mercados a los cuales el inversionista podría eventualmente no tener acceso haciendo énfasis en la naturaleza global de acceso a la inversión para el capitalista. La investigación de Lu, Wang & Zhang (2012) se concentra en el comportamiento de largo plazo de los instrumentos de inversión en la bolsa de valores en particular de los fondos cotizados que permiten acceder a múltiples mercados especializados con mayores oportunidades para los inversionistas. De igual forma, los trabajos de Papadelis, Flamos & Androulaki (2012), Dunham & Simpson (2015) y Kanuri (2016) se concentran en las estrategias de configuración de modelos de negocio vinculados a la conformación de carteras en los fondos de inversión mientras que la investigación de Chung & Hrazdil (2013) aborda el problema desde el punto de vista de la eficiencia de los mercados y en línea con ese análisis la investigación de Narend & Thenmozhi (2016) desarrolla la identificación de factores clave que activan la rentabilidad de los activos y en particular de los fondos cotizados listados en la bolsa de valores.
De igual forma los trabajos Koti (2013), Lin (2013) y Dunham, Jorgensen & Washer (2016) desarrollan análisis particulares del comportamiento de los activos financieros desde el punto de vista del volumen de transacciones y su correlación con la conformación de cartera y su estrategia de gestión, mientras que la investigación de Milonas & Rompotis (2013) establece una evaluación particular del comportamiento de los fondos cotizados en el mercado alemán frente a períodos de crisis, mercado analizado también en la investigación de Osterhoff & Kaserer (2016). Este aspecto de riesgo también ha sido tratado en la investigación de Shum & Kang (2013) para establecer patrones de gestión que permiten un mejor desarrollo del mercado frente a condiciones adversas. De igual forma el efecto estacional los fondos cotizados ha sido teorizado Chen, Shin & Sun (2015) como estrategia de gestión diferenciada para la obtención de mejores combinaciones de rentabilidad y riesgo para carteras específicas.
Las investigaciones de Scozzari et al. (2013) y Huang et al. (2015) desarrollan enfoques heurísticos para la internalización de restricciones en la segmentación de carteras para la evaluación de fondos cotizados. De igual forma las investigaciones de Tseng & Lee (2016) y Jung-Chu (2017) abordan el análisis de los fondos de inversión, fondos cotizados y activos financieros listados por medio de distintas técnicas estadísticas incluyendo el análisis de variables tradicionales y no tradicionales que afectan el rendimiento y el riesgo de los activos financieros.
La combinación esperada del desempeño de indicadores de rendimiento y riesgo de los activos financieros está condicionada al comportamiento de un conjunto complejo de variables sobre las cuales es necesario reflexionar para abordar del problema de estudio. De acuerdo con Hansen (2002) y Shiller (2003) el precio de los activos financieros que cotizan en la bolsa es equivalente la cantidad monetaria que refleja la oferta y demanda de los mismos en un contexto de negociación bursátil determinado, sin embargo, el precio solo no refleja el verdadero valor de dichos activos. Para estimar el valor de los activos, los analistas suelen usar diferentes métodos de evaluación normalmente basados en información financiera y bursátil que es reportada regularmente al mercado. En ese contexto aparecen indicadores como la capacidad de genera efectivo (EBITDA) que claramente reflejan la capacidad de la gerencia para generar flujos de efectivo, en las cuales se mide su capacidad sobre la base de variables que están bajo su control de gestión. El EBITDA se forma por las utilidades antes de intereses e impuestos a las cuales se le agrega la depreciación y/o amortización que son costos contables que no representan salidas de caja, con lo cual se representa en forma agregada la capacidad de gerencia de generar efectivo como aporte al valor del activo. Esto constituye una razón poderosa para incluir al EBITDA como uno de los componentes para ser evaluados en el modelo. De igual forma, las utilidades por acción (UPA) se convierten en una variable de extrema importancia dado que en el largo plazo dicha utilidades constituyen el sustento de valor del activo en el mercado siendo además claro que la generación de UPA´s positivas genera incentivos interesantes a los inversionistas para agregar rentabilidades ya obtenidas por el diferencial de precios lo cual claramente se refleja en las políticas de inversión que profundizan en carteras vinculadas a acciones que pagan dividendos.
La rentabilidad es una variable compleja y su naturaleza es multidimensional excediendo al campo puramente económico donde existen contextos de rentabilidad social, ética, ambiental y similares que participan directamente en casi todos los procesos vinculados a la toma de decisiones gerenciales y empresariales, sin embargo, tradicionalmente para la mayoría de los analistas de inversión el análisis se reduce a una particularidad en el estudio del ROE y el ROA (ROI) como indicadores para medir la capacidad del negocio y de sus activos para generar renta para los inversionistas. Esta limitación no restringe la necesidad de al ser variables estructuradas, medidas y reportadas obligatoriamente de manera pública en el mercado materia de estudio se vuelvan relevantes para su inclusión en el análisis de la presente investigación. En esa línea de análisis se ha considerado también el concepto de CAPEX en clara diferenciación del OPEX tradicional y del Cash Cost como conceptos de distinta interpretación conceptual. El CAPEX involucra todo el conjunto de inversiones que permiten construir el activo para ponerlo a operar a partir de lo cual el activo subsiste por los desembolsos de OPEX que sustentan su operación en el día a día. Un análisis particular requiere el Cash Cost como subconjunto del OPEX que excluye el costo del corporativo que para los inversionistas será una de las primeras variables a ser racionalizadas o cambiadas en la gerencia una vez adquirido el activo.
En esa misma línea de análisis, la liquidez constituye un factor central de alta sensibilidad para la decisión de entrada o salida de actores en el mercado reflejando una cantidad inherente de riesgo asignable al mercado siendo más atractivos los mercados con mayor liquidez que aquellos en los cuales la liquides es escasa y el riesgo de no conversión monetaria realizable es alto desde el perfil del inversionista. Esta es una variable que el inversionista no controla pues se configura por la estructura propia del mercado que se forma en la transacción de los valores que actúan en el sistema. Esta complejidad y el hecho de ser variables medibles y calculables a partir de los reportes ha hecho que sean incluidas como variables centrales en la investigación. De igual forma el coeficiente Beta de riesgo es una medida de sensibilidad que es parte de la ecuación de inversión de todo inversionista sofisticado pues refleja la comparación entre el riesgo del activo y el riesgo de mercado. De igual forma la rotación del activo y el ciclo de caja actúan como un referente del reflejo de velocidad con la cual el activo puede generar caja mostrando la capacidad gerencial para lograr este efecto en el valor de los activos que operan en el mercado que es subyacente al valor de la compañía o del titular del activo. A esto se suman aspectos que también deben ser analizados como las ratios precio/valor contable, la capitalización bursátil, la rentabilidad del dividendo y el grado de endeudamiento, experiencia del CEO, el número de directores independientes, el porcentaje de concentración de la familia en el directorio, el grado de vulnerabilidad política, el grado de vulnerabilidad ambiental y el grado de vulnerabilidad reputacional.
Los métodos de búsqueda basados en técnicas de inteligencia artificial aplicados al análisis de activos financieros en distintos períodos de tiempo han sido revisados por diversos autores en las investigaciones de Abdou & Nasereddin (2011), Chien-Feng et al. (2015); Hegazy, Soliman & Salam (2015) y Ebadati & Mortazavi (2018) en particular con el uso herramientas de inteligencia artificial basadas en máquinas de soporte de vectores (SVM) como refieren los trabajos de Vaishy & Lavanya (2016) y Myšková, Hájek & Olej (2018) o bien por medio de la técnica de redes neuronales artificiales (RNA) como se aprecia en los trabajos de Vejendla & Enke (2013); Akhter (2014); Charumathi & Suraj (2014); Hamid & Habib (2014); Sharma & Rababaah (2014); Qiu & Song (2016) y Rajihy, Nermend & Alsakaa (2017) encontrándose mayor precisión en la predicción del comportamiento financiero en comparación con los métodos tradicionales.
Las redes neuronales son una técnica de la inteligencia artificial que permite establecer regresiones complejas sobre grandes volúmenes de datos sobre la base de identificar entradas y salidas deseadas para adaptar una configuración final de red que permita un aprendizaje supervisado a partir del cual se pueda lograr una gran precisión en la predicción de datos. Para ello es necesario recurrir al uso de algoritmos complementarios de optimización que operen sobre la red neuronal y permitan reducir el error en la predicción de la función objetivo como los planteados por Broyden (1970); Goldfarb (1970);Shanno (1970); Shanno & Kettler (1970);Fletcher(1987); Bonnans et al.(2006); Nocedal & Wright (2006) y Luenberger & Ye (2008) quienes configuran experiencia en la utilización del algoritmo LBFGS para lograr mejores resultados en el análisis predictivo. Los algoritmos LBFGS son comúnmente utilizados para minimizar el error en la predicción y su uso se inicializa con una distribución aleatoria de pesos de entrada que son sucesivamente actualizados con una tasa de aprendizaje predefinida hasta lograr configurar diferencias mínimas entre los valores obtenidos y los reales alcanzados en la data de prueba.
En general la literatura de las técnicas de análisis se concentra en la predicción del comportamiento de las variables casi exclusivamente en las características de la herramienta o su uso principal siempre a partir de patrones tradicionales y datos estructurados como los indicadores económicos y los resultados de los reportes financieros de las empresas que sustentan los activos cotizados dejando de lado el análisis de variables no estructuradas y complejas de contexto que pueden ser encontradas en las memorias de las compañías y en las notas informativas de la información que divulgan al mercado y a las partes interesadas así como en los factores de contexto que configuran el entorno social, político y ambiental de las empresas que cotizan en el mercado.
DISCUSIÓN DE RESULTADOS
Los resultados muestran que la combinación rentabilidad-riesgo puede ser estimada a partir de las variables de entrada con un 76.93% de precisión evidenciando una fuerte dependencia sensitiva de la capacidad de generación de caja, la velocidad con que rotan los activos y la velocidad con la que se invierte el Capex como los principales generadores de las mejores combinaciones rentabilidad-riesgo sobre la base del aprendizaje en los datos de estudio. Los resultados muestran que las ganancias logradas y el tamaño de la inversión tienen una contribución menor relativa frente a las variables antes mencionadas, dejando claro que el resto de variables no presenta una contribución significativa en la determinación de las mejores combinaciones rentabilidad-riesgo.
El Gráfico 2 permite apreciar para la variable rentabilidad (expresada como porcentaje) el ajuste logrado mediante redes neuronales para la curva de los resultados rentabilidad-riesgo para los casos de entrenamiento en comparación con los estimados en la predicción de red.
De igual forma el Gráfico 3 permite apreciar para la variable riesgo (expresado en porcentaje) el ajuste logrado mediante redes neuronales para la curva de los resultados rentabilidad-riesgo para los casos de entrenamiento en comparación con los estimados en la predicción de red.
El Gráfico 4 permite mostrar el análisis de sensibilidad combinado para ambas variables de salida (Rentabilidad y Riesgo) ambas expresadas porcentualmente respecto a las variables de entrada de conjunto de datos de prueba donde el 100% de los datos de entrada corresponden a la extracción de datos públicos de Economática 2017 y Bloomberg, 2017 sobre la base de datos de la Superintendencia de Mercado de Valores (SMV, 2017) que han sido procesados por medio de la simulación y análisis de sensibilidad del trabajo de la red neuronal.
CONCLUSIÓNES
La investigación demuestra que las redes neuronales pueden representar una herramienta que permita hacer una estimación aceptable para predecir las mejores combinaciones rentabilidad-riesgo para los principales activos del mercado sobre la base de los parámetros tradicionales que los activos reportan al mercado y sobre los parámetros no tradicionales que se especifican en los reportes de las memorias institucionales de las compañías titulares de dichos activos. La investigación demuestra que puede alcanzarse precisiones en la predicción de hasta el 76.93% en promedio para el estudio del periodo 2010-2016 en la información reportada en el mercado de valores peruanos (Bolsa de Valores de Lima).
Lo resultados alcanzados en el análisis muestran que las mejores combinaciones rentabilidad-riesgo dependen en gran medida de la capacidad de generación de caja, la velocidad de rotación de activos y la velocidad con la que desembolsa el Capex como las principales variables de influencia dejando de lado el resto de variables estudiadas, lo cual representa un hallazgo significativo para la data materia de estudio puesto que demuestra el reflejo de un reconocimiento real a la capacidad de gestión expresada en la velocidad con la que la gerencia puede rotar el activo y generar caja como las principales palancas de valor en el logro de mayores rentabilidades con riesgos bajo control siendo su importancia significativamente mayor en comparación a la estructura del activo e independiente del mercado en el cual opera.
La investigación demuestra que existe cierta invariancia en relación al tipo de mercado en el que opera el activo así como una débil dependencia en relación a la naturaleza misma del activo, privilegiando la capacidad de gestión que permite generar caja y movilizar la inversión como el principal atributo de valor que impacta en las mejores combinaciones rentabilidad-riesgo que pueden lograrse en el mercado peruano que pueden explicar con mayor precisión el comportamiento bursátil si se definen a partir de las variables clave que resultan como hallazgo para la data de estudio en el mercado peruano entre el 2010 y el 2016.
Los hallazgos presentados reflejan una interesante complejidad en el estudio de la manera como se gestiona la gerencia de los activos representados en la muestra puesto que las principales variables de sensibilidad están fuertemente influenciadas por la capacidad de la gerencia para imprimir velocidad en dichos activos. El papel de la gerencia en sí mismo, constituye un aspecto que escapa al análisis realizado y que requiere ser materia de futuras investigaciones.