Las dinámicas de generación de la desigualdad

De acuerdo a Piketty la dinámica esencial a partir de la cual se genera desigualdad que produce el capital es la desigualdad  r>g (el retorno al capital es mayor al crecimiento). Si esta desigualdad se mantiene, entonces quienes tienen capital tienen mayores oportunidades de hacer crecer su patrimonio y sus ingresos de quienes no lo tienen:

Por ejemplo, si g=1% y r=5%, basta con ahorrar una quinta parte de los ingresos del capital  -y consumir las otras cuatro quinta partes- para que un capital heredado de la generación anterior crezca al mismo ritmo que el conjunto de la economía. Si se ahorra más, por ejemplo, porque el capital es lo bastante considerable para generar un tren de vida aceptable consumiendo un fracción menor de las rentas anuales, el patrimonio se incrementará más rápido que el promedio de la economía, y las desigualdades patrimoniales tenderán a ampliarse, todo ello sin que sea necesario añadir el más mínimo ingreso del trabajo (El Capital en el Siglo XXI, p 386 )

La diferencia entre r y g para Piketty es un hecho histórico, no una necesidad. Pero representa una regularidad histórica bastante importante, y nos muestra la anomalía de la situación de mediados del siglo XX -que sería la única ocasión en que la tasa de crecimiento habría superado el retorno al capital (p 388-393). Es un hecho que permite, entonces, una concentración incesante de la riqueza.

Aquí aparece un tema no menor: ¿cómo puede ser posible una mecánica que implica una concentración incesante? ¿No debiera detenerse en algún momento? De hecho, históricamente uno puede observar sociedades con una alta concentración de la riqueza pero no con una mecánica de concentración permanente e incesante, y ello no es lo que cabría observar si r>g fuera toda la historia.

¿No debiera ocurrir un equilibrio antes de ello? Piketty de hecho señala que eso puede esperarse en general. Más aún, puede recordarse que las sociedades agrarias, donde la tierra es el patrimonio central, usualmente usaban una forma de primogenitura para mantener la propiedad -la división entre todos los hijos atentaba contra esa concentración. Y en la actualidad efectivamente ello no existe, lo que en principio también debiera evitar un proceso infinito de concentración. Piketty muestra que, de hecho, la eliminación de la primogenitura y mecanismos similares no produjo la igualdad que buscaban los reformistas (p 400-403). Sin embargo, el hecho que no se produzca igualdad no quiere decir que no se produzca una distribución de equilibrio -y por lo tanto que aunque exista una alta concentración ella no necesariamente debe aumentar infinitamente (p 403). También se puede recordar que la idea que las clases patrimoniales tienen altas posibilidades de ahorro no siempre corresponde -es fácil pensar en situaciones de alta competencia al interior de los estratos altos que los lleva a gastos insostenibles: las clases altas de fines de la República Romana estaban altamente endeudadas, incluso con los altísimos ingresos de que disponía una familia senatorial, pero los gastos que implicaba la competencia política del período también lo eran (y es posible mencionar que aunque la sociedad romana siempre tuvo una alta concentración de riqueza, es raro encontrar a las mismas familias). En general, y como también lo señala Piketty en algún momento no todo el capital puede invertirse y luego, no puede obtener la tasa de retorno. Luego, la existencia de r>g no produce una situación de concentración incesante, pero sí produce altas tasas de concentración, que es lo que de hecho corresponde a la situación histórica.

Un tema que Piketty tiende a no destacar, pero que es relevante en torno a los efectos de estas dinámicas, es la diferencia entre concentración de riqueza y estabilidad de quienes la detentan. Buena parte de los efectos y prácticas discutidas en el párrafo anterior no sólo ponen un límite a la concentración (uno que, por cierto, puede ser extremadamente alto) pero son prácticas específicamente diseñadas para evitar la circulación de élites: La primogenitura lo que evita es la dispersión de la propiedad existente de la familia, sin primogenitura la estructura general puede no cambiar pero esa familia es probable que pierda prominencia (reemplazada por otros). Lo mismo en relación a los altos gastos de senadores en la República Romana -son los linajes específicos de familias senatoriales los que no se reproducen, no el hecho de una minoría pequeña que concentra la mayor parte de la riqueza. Esa diferencia puede que no le interese particularmente a Piketty, pero bien podemos suponer que es una dinámica de alto interés para los sujetos.

Las dinámicas de la concentración de la riqueza son mucho más amplias que situaciones puramente estructurales, y por cierto van más allá de algunas pocas relaciones entre variables. Por otra, lo que muestra Piketty es que con unas pocas relaciones simples sí se puede comprender y explicar características centrales de dichas dinámicas. Lo que no es poco para nuestras disciplinas.

Piketty y la Herencia

El muy reciente El Capital en el siglo XXI de Piketty empieza a discutir en profundidad sobre desigualdad en la página 261, la a estas alturas célebre relación r>g se discute en profundidad a partir de la página 385 (ambos números de la edición del FCE 2014). Y no estará de más recordar que el libro se llama Capital. Estas observaciones tienen algo de relevancia porque en la discusión sobre el libro se habla sólo de desigualdad (y ese es el tema sobre el cual el mismo Piketty pontifica habitualmente), pero de hecho varias de las afirmaciones centrales del libro no dependen de las estadísticas y tendencias de desigualdad presentadas.

El texto se inicia dando cifras de evolución del capital y son esas tendencias y las reflexiones a las que dan origen las centrales del libro -a mi bien humilde parecer.  En particular, nos interesa la evolución de la relación capital / PGB. Los gráficos de Piketty son claros en mostrar una curva en U tanto para Francia y el Reino Unido en el largo plazo: relaciones cercanas al 700% (el acervo de capital equivalente a 7 años de producción nacional) hasta el fin de la Belle Époque, una brusca caída posterior, y una recuperación a partir de los 70 (p 131-135). Los datos alemanes son similares en lo que dice relación a la evolución hasta los ’70, porque la recuperación del capital es menos pronunciada pero ello se debe principalmente a la ‘menor capitalización bursátil de las empresas¿ (p 162). Estados Unidos no tiene una evolución similar, porque su punto de partida es menos ‘capitalizado’ (cerca de los 1800 la relación es de 300%), y alcanza cifras de 500% sólo hacia principios del siglo XX. La caída posterior es menos acusada que en Europa, y lo mismo puede decirse de su recuperación posterior.

La otra reflexión relevante que nos interesa destacar es lo que Piketty menciona cómo la ‘segunda ley fundamental del capitalismo’ (la primera es una identidad contable así que no la destacaremos). La fórmula en cuestión es ? = s/g, siendo ? la relación capital/PGB, s la tasa de ahorro y g la tasa de crecimiento. Lo que Piketty enfatiza es que, si damos la tasa de ahorro como dada, entonces si el crecimiento baja la relación aumenta. En otras palabras, el acervo de capital acumulado es más importante cuando la tasa de crecimiento es más baja. Lo cual tiene sentido si pensamos que la acumulación de capital, como Piketty recuerda constantemente, es riqueza basada en el pasado.

¿A que vienen estas consideraciones? Ambas nos muestran la magnitud de las dimensiones que afectan la relevancia del capital (el número ?). En el primer caso, Piketty pierde pocas ocasiones en recordarnos que ello es efecto de las dos guerras mundiales y todo lo que ellas traen consigo (no sólo destrucción física de capital, sino los procesos de inflación y, por cierto, los cambios sociales que permitieron una mayor relevancia del Estado, y del capital público). Por ejemplo:

La guerra redujo a cero -o casi- la acumulación patrimonial llevando mecánicamente a un gran rejuvenecimiento de las fortunas. En este sentido, son las guerras las que hicieron tabla rasa del pasado hasta el siglo XX, creando la ilusión de una transformación estructural del capitalismo (p 436)

En relación a lo segundo, la tasa de crecimiento que Piketty está mencionando es la tasa de crecimiento global, o sea incluyendo el aumento del per cápita y el crecimiento demográfico. Ahora bien, resulta claro que en general la tasa de crecimiento demográfico está disminuyendo, y en particular para los países desarrollados es cercana a 0 (en algunos países incluso en disminución), y este es para Piketty -al final- el mecanismo dominante. No se puede esperar que el crecimiento del per cápita pueda eliminar esa diferencia, Piketty nos muestra que para los países desarrollados en los últimos 40 años sus tasas de crecimiento son de alrededor del 1,7%-1,9% (y muy similares), y que ‘no existe ningún ejemplo de un país que se encuentre en la frontera tecnológica mundial y cuyo incremento de la producción por habitante sea constantemente superior a 1,5%’ (p 111). En otras palabras, la disminución del crecimiento global en los países desarrollados no se puede revertir y es producto de la disminución del crecimiento demográfico. Y esto produce, ‘mecánicamente’ como nos recuerda Piketty, el retorno del capital.

En otras palabras, el mundo de mediados del siglo XX -que a los franceses les gusta denominar ‘los 30 gloriosos’-, un mundo donde el peso del capital era menor, es producto de una serie de factores irrepetibles.

 

Dado ese hecho, el retorno de relaciones altas entre capital e PGB, es que se puede examinar lo que sucede con la desigualdad. Un tema importante a este respecto es la relación entre desigualdad de ingresos y desigualdad de capital. Resulta interesante en torno a este tema que muchas de las críticas a Piketty se refieren a cosas que él trata, y reconoce, en el texto: Por ejemplo, y es uno de los más comunes, que el aumento de la desigualdad en Estados Unidos tiene mucho que ver con el aumento de la desigualdad salarial, y en particular con el aumento de los ingresos de los ejecutivos es algo que Piketty menciona y discute. De hecho, Piketty destaca que una de las innovaciones del siglo XX es la generación de una clase media en torno al capital (debido a la distribución de la propiedad inmobiliaria) que es una innovación clara: Porque en torno al capital una clase media previamente era inexistente y en ese sentido la desigualdad del capital es en la actualidad claramente menor que a principios del siglo XX (p 373-383). Y de hecho, la desigualdad de ingresos ha aumentado.

Pero a pesar de ello, es un hecho estructural que la desigualdad del capital ha sido siempre más alta que la desigualdad de ingresos, y luego el aumento de la importancia del capital que mencionamos anteriormente tiene como consecuencia de largo plazo un aumento de la desigualdad en la sociedad -porque el peso del capital en la sociedad es mayor. Y ese predominio del capital proviene, como vimos anteriormente, de tendencias estructurales bastante fuertes.

 

Llegados a este punto podemos recordar que el título de esta entrada dice Piketty y la herencia, y no hemos mencionado nada sobre herencia hasta ahora. Ahora, ¿por qué estas dinámicas de las desigualdades son relevantes?

Piketty menciona, varias veces, que sociedades tan desiguales no serían estables, y que necesitarían altos niveles de coerción para mantenerse -o lograr convencer que esas desigualdades son naturales. Sin embargo, al parecer es posible lograr ese convencimiento. Los altos niveles de desigualdad han sido estables por largo tiempo en muchas sociedades; y en particular las sociedades de la Belle Époque parecen haber logrado un alto grado de compromiso por parte de sus integrantes, como los ingentes sacrificios que realizaron en 1914 lo muestran. Que esos sacrificios luego fueran parte de los procesos que requirieron la invención del Estado de Bienestar es otra cosa, pero lo que muestra esa situación es que Francia o el Reino Unido (o Alemania para el caso) no tenían problemas de cohesión social -como algunos hablan hoy en día- siendo sociedades altamente desiguales.

Sin embargo, Piketty, de hecho, no se centra en lo anterior. Para él, el punto central es, al final, la importancia de la herencia (en contraposición con el talento). Dicho en corto, una sociedad con una alta pre-eminencia del capital, o sea del acervo acumulado del pasado, es una sociedad en la cual las herencias adquieren mayor importancia: La riqueza del pasado es más importante que la riqueza del presente. Las estadísticas francesas por ejemplo sobre sucesiones, que al respecto son más completas y de más largo alcance que en otros países, así lo muestran; y Piketty muestra como dentro de las grandes fortunas hay una fuerte presencia de las heredades -y no sólo de las empresariales.

En cierto sentido, la desigualdad como tal no es ni siquiera el problema en Piketty. Un autor que tiene una sección donde se pregunta, para las sociedades del pasado, si la alta desigualdad era un requisito para la civilización (p 456-458) ciertamente no es un simple abogado de la igualdad. De hecho, el tema de la desigualdad lo inicia Piketty discutiendo a Balzac (el discurso de Vautrin en el Pobre Goriot), al cual vuelve varias veces durante su texto, y la discusión es sobre los caminos para el ascenso social: ¿Tiene más sentido el camino del mérito y el esfuerzo o el camino de la herencia? (en la novela esto es la elección entre estudiar y casarse con una heredera). El mundo del predominio del capital es el mundo del predominio de la herencia, y del peso del pasado en el presente. Es para evitar esa fuerza de la herencia y del pasado, y luego para darle realce a la elección del esfuerzo y el mérito individual en el presente, que la desigualdad que produce el capital se transforma en un problema.

Esto también es parte del peso que le da Piketty a la discusión de los niveles más altos de la distribución (no sólo de los percentiles, sino de los milésimos e incluso más pequeño). El mundo del predominio del capital no es sólo el mundo en el cual unos pocos concentran una gran parte de la riqueza, es un mundo en el cual esos pocos son además herederos (y Piketty muestra como a medida que se sube en los ingresos aumenta la importancia de la renta, del capital, como fuente de ingresos). Y, dado como son los patrimonios, la riqueza empresarial presente es riqueza heredada futura (eso requiere sólo el paso a la siguiente generación).

Disminuir el peso del capital, y de la desigualdad que ella produce, es también -y eso es en lo que Piketty finalmente más se concentra- disminuir la importancia de la herencia. Es la lucha contra la riqueza heredada lo que concentra las iras de Piketty, más que solamente la desigualdad como tal.

Contrafactuales. A propósito de la colonización de América.

Durante los últimos años es posible observar una cierta proliferación de estudios de historia alterna (¿que habría pasado si…?). En cierta manera, las explicaciones históricas implícitamente operan de manera contrafáctica (si digo que X fue condición necesaria de Y estoy diciendo que sin X no habría sucedido Y). Una parte no menor de esa literatura plantea contrafactuales para mostrar que efectivamente la historia podría haber sido distinta (que si Y dependió de X, pero X no era necesario luego Y no era necesario), y para mostrar  -así- el papel de los momentos o de los actores individuales en la historia. Si Churchill no hubiera hecho esto, si el Reino Unido no hubiera declarado la guerra al Imperio Alemán, si hubiera pasado tal cosa durante 1917 en Rusia, si la batalla de Maratón hubiera pasado esto (el último ejemplo conocido de todos los que han leído los textos metodológicos de Weber por cierto).

Pero creo que en realidad el mejor uso de los contrafactuales es para, precisamente, entender mejor por que suceden las cosas de la forma en que sucedieron. Para ilustrar este punto usaremos un contrafactual que es particularmente relevante para nosotros: ¿Hubiera podido ser distinta la forma en que operó la conquista de América por parte de los europeos?

Lo primero es observar que efectivamente el contacto de América es claramente más probable desde Europa o África que desde Asia (simplemente porque el Atlántico es más pequeño). Luego incluso si es posible pensar en contacto desde China es poco probable un contacto permanente que produce conquista. Al mismo tiempo. el otro actor posible desde el Atlántico es el mundo árabe, y en particular Marruecos. Pero nuevamente, no habiendo una fuerte tradición naval en esa zona (como sí lo había en el Índico). Luego, podemos plantear que toda historia alternativa relativamente realista debiera plantearse invasión desde Europa.

Lo segundo es observar que sabemos que hay un contacto previo: las colonias vikingas en Groenlandia sí estuvieron en América (L’Anse aux Meadows). Pero ellas fueron de corta duración. Para que esa colonia perdurase -y eso implicaría una historia muy distinta- se necesitaría una período cálido medieval algo más cálido (de forma de permitir una colonia vikinga en Groenlandia más numerosa que pudiera a su vez sostener un asentamiento en América). Cuando decimos una historia muy distinta es que si eso hubiera sido así, entonces América hubiera recibido todas las enfermedades del Viejo Mundo (y en una de esas hasta el caballo y quizás la forja del hierro) por parte de un grupo europeo que incluso si hubiera podido mantener contacto permanente no estaba en condiciones de invadir esas tierras. Pero eso requiere un cambio en la historia climática del planeta.

Si no asumimos cambios climáticos ni sucesos muy poco probables, entonces tenemos variaciones sobre un grupo de europeos del Renacimiento (con superioridad en armamento y con shock de enfermedades al mismo tiempo) en América. ¿Hubiera sido posible otro comportamiento por parte de los Europeos?

Si comparamos con lo que realizaron en otras partes del mundo (y más o menos por la misma época) podemos preguntarnos: ¿por qué no un modelo como el acaecido en África? (i.e factorías de comercio en la costa pero sin dominación directa), ¿por qué no un modelo como lo sucedido en India o en el Asia sudoriental? (i.e conquista de estados pequeños pero no de los mayores). Parte de la respuesta es por las condiciones. Si se lee acerca de algunos aventureros españoles (y de algunos planes de hecho) en el área, se puede observar que no es una actitud distinta, sólo que no resultaba posible, digamos, conquistar los estados mayores en el área. Y nuevamente, esto dice relación con que en ninguna de esas áreas los europeos tenían las ventajas que si tuvieron en América (i.e no hay shock de enfermedades, la comparten, y en general la diferencia tecnológica es menor -son todas civilizaciones que usan hierro por ejemplo). Eso es lo que vuelve, por ejemplo, menos viable una situación en que el Caribe se llena de asentamientos europeos que comercian o intentan dominar ‘tierra firme’ pero sin conquista directa.

Dado lo anterior, y dadas las conductas efectivas de los europeos, entonces las posibilidades son la colonia de poblamiento y la colonia de conquista (dado que la colonia comercial, incluso cuando fue usada en América al final siempre fue desplazada). Esto nos lleva, a su vez, a observar que en los centros precolombinos más importantes la colonia de poblamiento resultaba imposible -simplemente, incluso tras la debacle demográfica, la población india era demasiado numerosa).

Luego, las alternativas contrafactuales más realistas son modificaciones al interior de los modelos básicos acaecidos efectivamente (por ejemplo, un tratamiento distinto de los indígenas en la conquista española), pero al parecer los lineamientos generales no resultan muy posibles de cambiar. Para producir alternativas contrafactuales más importantes se requieren transformaciones más básicas (por ejemplo, lo ya mencionado de un cambio en la historia climática). Con lo cual volvemos al punto inicial: buena parte del posible uso del razonamiento contrafactual es para entender con más claridad los procesos y dinámicas que produjeron lo que efectivamente sucedió.

Modos de Colonización. Algunas Notas Preliminares.

La entrada no es sobre todas las formas posibles de colonización, sino simplemente comparar en líneas muy generales los modos usados por los Europeos en la modernidad temprana (en particular en América, pero no en exclusiva)

Una forma (modo 1) es el de ‘expulsemos a los habitantes y nos hacemos con el terreno’, la así llamada colonia de poblamiento. En última instancia, usada por los Ingleses en territorios de clima templado (o sea, relativamente cercanos a Inglaterra), con habitantes originales relativamente débiles y definitivamente sin Estados organizados. En América, los franceses ocuparon ello en Quebec.

Otra alternativa (modo 2) es el de ‘subyuguemos a los habitantes y nos convertimos en señores del territorio’, que es el caso normal de los españoles. Aunque esa era su modo estándar, en particular fue más intenso en aquellas regiones en que existían poblaciones organizadas en Estados y con niveles altos de población. Lo último tiene su importancia porque el modo español exige que las poblaciones indígenas sigan existiendo: la idea es explotarlos, no eliminarlos. Luego, tomando en cuenta la debacle poblacional de los pueblos indígenas tras 1492, sólo podía funcionar en poblaciones que incluso después de una fuerte disminución eran relativamente numerosas para sostener a una clase dominante de españoles.

Finalmente tenemos la modalidad (modo 3) de ‘explotemos a los habitantes a través de comercio’ que aunque no fue el único método usado por ellos, era relativamente común entre portugueses y holandeses. Ya sea porque los territorios resultaban imposibles de conquistar por la relativa fuerza de los habitantes (la situación típica en la India en el siglo XVI-XVII para todos) o por la orientación comercial en general de la economía colonizadora (por ejemplo los holandeses en América del Norte) o por las características del territorio (Bahía del Hudson o como los franceses operaron en el Mississippi si no me equivoco), se estimaba que la forma más lucrativa de relacionarse con esos territorios era a través del comercio.

Uno de los temas relevantes es que sólo los dos primeros resultaron, al menos en América, duraderos. Y eso se debe, en parte, a las dinámicas poblacionales. La colonia de poblamiento genera mayor población que la colonia de subyugación, y ambas claramente mayores poblaciones que la comercial. Lo cual implica, por ejemplo, que las colonias comerciales fueron más fácilmente tomadas por otros poderes (Nueva Holanda a manos de los ingleses en 1665 por ejemplo) mientras que eso no sucede en los dos primeros casos. Pensemos que, de hecho, la única colonia de poblamiento conquistada subsecuentemente fue Quebec, y todavía ella cuenta con una cultura francófona a más de 2 siglos de su conquista por el Reino Unido.

Veamos algunos datos y estimaciones de población. En la década de 1660-1670 la población en Nueva Inglaterra paso de 32.600 a 52.200 (Heines y Steckel 2000: 150), mientras que la población de Nueva Holanda para 1665, su conquista, se calcula en alrededor de 7.000-8.000 (Jacobs 2005: 95, y esa estimación es relativamente alta, existiendo varias que la calculan en alrededor de la mitad). En el caso de las colonias españolas, podemos usar el ejemplo chileno que es una de las menos pobladas. A su vez, los datos para el territorio de Santiago (que podemos usar como equivalente a Nueva Inglaterra o Nueva Holanda) nos indican que para 1644 entre Choapa y el Maule alrededor de 3.000 vecinos, o sea, españoles (De Ramón 2007: 79), pero a eso hay que sumar la población indígena y población negra. Al parecer, todo Chile tendría cerca 22.500 indios encomendados  y 2.000 esclavos negros (Zapater 1997: 492 usando estimaciones contemporáneas de la Real Audiencia), pero si consideramos la mitad de esa población para el territorio de Santiago alcanzaríamos alrededor de 15.000 personas para ese territorio. La población de la potencia colonizadora es menor que en el caso de Nueva Holanda (aunque recordemos, estamos hablando de una colonia pobre dentro del Imperio Español y usando una estimación alta para Nueva Holanda), pero la población total de la colonia resulta claramente mayor.

¿Cuál es la importancia de todo esto? Que las potencias europeas disponían de un abanico de posibilidades cuando decidían dominar un territorio. Un abanico que dependía de factores asociados al territorio dominado (las características de su población) y de la sociedad dominadora (Nueva Holanda pasó del modo 3 al 2 al cambiar de potencia colonial). Y que esos modos tienen consecuencias relevantes para la historia posterior. Aquí nos hemos dedicado a mencionar sólo las demográficas -porque ellas claramente influencian historias posteriores.

De hecho, es posible mostrar que esas evoluciones demográficas afectan el comportamiento de los salarios y las economías (Arroyo Abad et al 2012 y Allen et al 2012) Aunque ambos tienen más bien conclusiones distintas en torno a la situación de las economías de las colonias españolas, sigue el tema general: Que esas estrategias de colonización fueron relevantes en producir situaciones históricas diferentes.

Referencias Bibliográficas.

Allen, Robert, Murphy, Tommy y Schneider, Eric (2012) The Colonial Origins of the Divergence in the Americas. The Journal of Economic History 72: 863-894
Arroyo Abad, Leticia, Davies, Elwyin y van Zanden, Jan Luiten (2012) Between Conquest and Independence: Real wages and demographic change in Spanish America, 1530-1820. Explorations in Economic History 49: 149-166
Haines, Michael y Steckel, Richard (2000) A Population History of North America. Cambridge: Cambridge University Press.
Jacops, Jaap (2005) New Netherland: A Dutch Colony in Seventeenth Century America. Leiden: Brill.
de Ramón, Armando (2007) Santiago de Chile, Historia de una Sociedad Urbana. Santiago: Catalonia
Zapater, Horacio (1997) Huincas y Mapuches. Historia 30: 441-504

Los Defensores de la Ética Protestante

weber_gil_villegas

Una investigación sobre el debate de la Ética.

El año 2013 el Fondo de Cultura Económica publicó un texto al cual no queda más que otorgarle la cualidad de monumental: Max Weber y la guerra académica de los cien años de Francisco Gil Villegas. 1,424 páginas en las cuales se comenta e identifican una multitud de textos en torno a la polémica que generaron el texto sobre la ética protestante (EP). El hecho que una tesis de carácter empírico, aunque ya veremos que eso es parte de la discusión, sea capaz de generar una discusión de un siglo no deja de ser muy llamativo. Son los textos teóricos, en general, los que tienden a esa longevidad crítica más que las investigaciones. El hecho que la EP lo haya logrado es ya una gran fortaleza.

Al mismo tiempo el carácter inabarcable del debate no deja de sorprender. Gil Villegas insiste, en sus conclusiones, en que esta investigación muestra que no es cierto que no se pueda cubrir toda la discusión. Pero, y con toda la gigantesca revisión que el texto implica, el hecho es que no queda cubierto todo el espacio. Quedan fuera, entre los que yo conozco, textos como la crítica de James Coleman a la EP en términos de lógica de explicación, y los usos de la tesis como modelo -del cual se recogen algunos en el libro de Gil Villegas- como el de Hirschman sobre Las Pasiones y los Intereses o el de Campbell sobre The Romantic Ethic and the Spirit of Modern Consumerism. Pero además Gil Villegas menciona que, por ejemplo, existe un largo campo de estudios usando a Weber en Japón, pero de ello no aparece mucho en el estudio. Dentro del español, es México, España y algo menos Argentina donde aparecen textos reseñados, lo que muestra su mayor relevancia, pero uno asume que la discusión ha operado en otros lugares. Si bien es posible aceptar que todos los tipos de argumento en contra y a favor están en la investigación, el caso es que la exhaustividad resulta imposible.

La investigación realizada por Gil Villegas nos permite a su vez observar algunas características de la polémica. El elemento central que nos interesa aquí desarrollar son las reacciones de los defensores de la tesis frente a las críticas a esta.

La primera defensa: De la tesis fuerte a la tesis debilitada

Una de las tendencias permanentes en la discusión es la facilidad con la que tanto críticos como defensores leen la tesis como una directa en la cual la reforma protestante causa el capitalismo moderno. Gil Villegas usualmente le achaca esta interpretación simple a los críticos, pero su propio texto tiene múltiples defensores que hacen la misma lectura. Esto no deja de ser notable porque, de hecho, las frases finales de la EP son un llamado a evitar toda lectura unilateral sobre el desarrollo de los fenómenos del mundo social. En todo caso, es un hecho que existe una lectura fuerte, dura de la tesis que es muy común.

Ahora bien, presentados frente a lecturas críticas que siguen esa línea, una de las variantes más importantes es la de presentar diversas matizaciones, que lo que hacen es debilitar esa tesis:

  • Primero, que no es una tesis sobre la relación entre la ética protestante y el capitalismo, sino sobre la ética protestante y el espíritu del capitalismo moderno, que es algo más específico.
  • Segundo, que no es una tesis que plantee que existe solo una causa del capitalismo, sino que éste tiene múltiples causas, una de las cuales es el espíritu del capitalismo
  • Tercero, que no es una tesis que plantee una causalidad fuerte, sino que se basa en la noción de afinidades electivas -que es algo mucho más flexible
  • Cuarto, que no es una tesis universal del surgimiento del capitalismo, sino una históricamente situada, válida para la Europa de los siglos XVII-XVIII pero no en otros contextos.
  • Quinto, que metodológicamente se basa en los recursos de la sociología comprensiva y de los tipos ideales, que se resisten a una visión empirista.

En conjunto, todas estas afirmaciones transforman la tesis de una dura (la EP produce el capitalismo) en una bastante más limitada (es una tesis de cómo se relaciona la EP, en un contexto histórico específico, y a través de un tipo ideal, con un aspecto que fue una de múltiples causas del capitalismo moderno). Esta operación puede ser correcta como lectura de Weber y como interpretación de la realidad histórica, pero esta doble lectura nos explica en parte la popularidad de la tesis: Una tesis fuerte, de gran interés, provocativa pero que en la discusión se transforma en una tesis mucho más matizada y débil (otras discusiones, como sobre acción racional también muestran este movimiento entre grandes declaraciones simplistas -pero que son las que generan interés en la teoría- y defensas que limitan a la tesis).

En el límite estos movimientos lo que hacen es inmunizar a la tesis de toda evaluación empírica:

Al introducir el modelo heurístico del dogma calvinista, Weber no tiene que defender que todos los individuos creían, de hecho, en él, o actuaban de acuerdo a él. Por el contrario, Weber introduce inmediatamente un segundo tipo ideal para captar una reacción probable a los dilemas planteados por la predestinación, una reacción que es “comprensible” en los términos psicológicos del sentido común. Nótese que este segundo tipo ideal puede ser “adecuado en el nivel de significado”, incluso al margen de cualquier evidencia empírica sobre las acciones y creencias de los agentes históricos reales (Fritz Ringer, Max Weber’s Methodology p 166-167, citado en Gil Villegas p 1029-1030).

La metodología de Weber evita que sea necesario revisar la empiria. No importa lo que pasara o lo que pensaran los calvinistas y puritanos del siglo XVII, en tanto parezca razonable todo esta bien. No hay necesidad de preguntarse si Weber interpretó bien los sermones puritanos (Baxter que es el que más cita) o a Franklin en relación al espíritu capitalista. Una cosa es que Weber mismo no haya sentido esa necesidad (y por ello procede a seguir investigando analizando la ética económica de otras religiones más que profundizar en lo que dijo de los puritanos), y otra cosa que los sucesores en el debate lo hagan. Aunque este límite es alcanzado por pocos, la tendencia a eliminar evidencias del debate (‘estos datos no corresponden ni sirven para evaluar la tesis’) es muy clara, y no siempre quienes plantean ello proceden a postular a su vez que datos serían de interés.

No todos los defensores caen en esta tendencia, y hay varios casos (Gordon Marshall buscando evidencia en Escocia de las actitudes económicas de los empresarios calvinistas, la discusión en los ’50 y ’60 de historiadores ingleses -Tawney, Hill etc.-) que muestran como es posible usar estas puntualizaciones y al mismo tiempo defender empíricamente la tesis buscando nuevos datos.

Una segunda defensa: De la empiria a la exégesis.

Otra forma que ha tomado la defensa de la tesis de Weber,  y esto en particular es muy fuerte en el debate alemán a partir de los ’70 en los textos que reseña Gil Villegas, es la tendencia a declarar que la tesis de la EP no se entiende sino en el contexto general de la obra de Weber. La siguiente cita es ilustrativa de este parecer:

En otras palabras, una obra particular, como por ejemplo, la “Ética protestante”, no puede ser entendida adecuada e integralmente si:

  1. Las obras de Weber sobre las condiciones y efectos jurídicos, históricos, sociales, económicos y políticos del capitalismo moderno, escritas antes y después de 1904, no son incluidas;

  2. Los conceptos metodológicos de Verstehen, Erklären y “aplicación de los tipos ideales” no son conocidos

  3. Las obras posteriores sobre “La ética económica de las religiones mundiales” tampoco son conocidas

  4. La (auto) comprensión que como científico tenía Weber de las tareas y posibilidades del trabajo científico, según se encuentran en sus postulados de la “neutralidad valorativa” y la “relación a valores”, no se toman en cuenta como base de la interpretación (Dirk Käsler, Einführung in das Studium Max Webers, 1995, p 227-228, citado en Gil Villegas, p 992).

Estas exigencias resultan muy razonables cuando se refieren a que entendamos bien que fue lo que quiso decir Weber, dado que sus conceptos no son siempre los actuales (en particular, en relación a su metodología); pero como recomendación general no deja de ser algo extraña. Porque, en principio, una tesis empírica específica debiera comprenderse en el propio texto que la presenta. Imaginemos que usamos esa exigencia para evaluar cualquier tesis empírica, y nos daríamos cuenta de su imposibilidad. Una cosa es comprender que es lo que dice Weber cuando dice tipo ideal, otra cosa que para poder evaluar una tesis sea necesario usar textos distintos de donde ella se plantea. Al fin y al cabo, todas las matizaciones que -por ejemplo, se plantean en la primera forma de defensa- aparecen en el mismo texto de la EP.

Pero más allá de lo anterior, en última instancia es una insistencia en leer con cuidado. Sin embargo, al igual que en la anterior, de esta forma también se deriva una forma extrema -que lo que hace es eliminar la importancia de cualquier evaluación empírica.

En este sentido, se confirmó de cierto modo [en el Seminario de Heidelberg del 2003] la orgullosa afirmación de Hennis, en 1987, con respecto a que ya nadie discute en Alemania la tesis weberiana sobre el protestantismo de manera aislada y fuera de contexto, o centrando la atención en la cuestión de la validez empírica de su nexo de causalidad’ (Gil Villegas, p 1157)

Por otro lado, el texto tampoco se reduce a una tesis histórica particular susceptible de confirmarse o refutarse mediante la verificación empírica tal y como se ha querido ver, especialmente en la sociología estadounidense, a lo largo de tantos años (Gil Villegas p 1201, reseñando Martin Riesebrodt, Dimensions of the Protestant Ethic, en Swatos y Kaelber Protestant Ethic turns 100, 2005)

‘Orgullosa’ para hablar de declaraciones que plantean el desinterés en el aspecto empírico, el desdén hacia los intentos de contrastación empírica: La defensa del contexto pasa a ser, finalmente, un movimiento desde la discusión de la realidad a la exégesis de la lectura: Lo que interesa más que comprender cuál es la relación entre la ética protestante y el mundo capitalista moderno, es comprender lo que dice Weber -y entonces debatir sobre cuáles son los principales intereses de la obra general de Weber. Esto en parte resulta necesario -simplemente para no adjudicar tesis a quienes no las han planteado- pero no deja de ser curioso, y en el límite improcedente: Una mala lectura puede ser más correcta empíricamente, y establecer que fue lo que dijo Weber no avanza nada en la comprensión de la propia realidad. Por cierto que, al igual que en la versión anterior, hay defensores que critican esa visión, por ejemplo David Chalcraft critica el 2001 a Hennis precisamente por olvidar el carácter empírico de la tesis, ver Gil Villegas, p 1113)

Los defectos de una defensa, y la importancia del debate.

En ambas formas de la defensa existe un movimiento relevante (aunque no necesario) es el de disminuir el carácter empírico de la tesis, y usar esas defensas como formas de inmunización. Pero, la tesis es -finalmente- una tesis empíricamente concreta e históricamente situada. Plantear frente a una tesis de ese tipo, una defensa que (y Gil Villegas, lamentablemente, también cae en ello en sus conclusiones) como si fueran las tablas de la ley y los críticos unos impertinentes que deben ser tratados con arrogancia, es un error.

De hecho, los críticos -y esto pasa incluso en las respuestas de Weber a los iniciales, que son por cierto claramente despreciativas- han sido lo que han obligado a mejorar y clarificar la tesis, y a lograr una mejor fundamentación de nuestra comprensión del nacimiento del mundo moderno. De hecho, los mejores defensores han sido, al fin, los que han asumido la empiria de la tesis como un tema a desarrollar y que se han tomado en serio los problemas y posibles críticas a ella. En ese sentido, si la tesis ha resultado ser relevante ha sido también por el conocimiento que se ha generado a partir de ella; y en ese proceso la crítica ha sido también parte fundamental.

Salazar como teórico crítico

La pretensión de esta entrada es defender la idea que Gabriel Salazar puede ser considerado un teórico crítico. Ahora bien, para que esta pretensión tenga algo de sentido es necesario establecer que se considera teoría crítica en el aserto anterior. El paso del crítico al teórico crítico es, obviamente, al menos el paso de una consideración crítica a fundamentar conceptualmente esa crítica. Pero más aún, el teórico crítico no es tan sólo el que fundamenta su crítica, sino específicamente quien la fundamenta en la idea que la crítica emerge de las características del proceso social. No es un canon externo que se aplica a la realidad (digamos, como un límite hacia el cual la realidad se puede acercar), pero que no proviene de él: Un canon que puede estar muy fundamentado pero que es ajeno al desarrollo del proceso social. En la medida en que la crítica se basa en lo que se plantea es el propio proceso social, y que se hace en nombre de las necesidades de ese movimiento es que uno se acerca al tipo ideal de teoría crítica.

La pretensión entonces de la entrada es, entonces, más clara: La visión de Gabriel Salazar se acerca efectivamente a esa posición.

Habiendo planteado la tesis resulta razonable exponer la evidencia.

Lo primero es defender la idea que Salazar es un teórico. Lo que tomando en cuenta sus planteamientos sobre epistemologías a-históricas de la nación, la constelación G en Violencia Política Popular en las Grandes Alamedas (1990) alguien pudiera pensar equivocado. Pero de hecho todo ese capítulo es una disquisición teórica sobre el carácter del conocimiento del mundo social y una defensa de la historicidad (pero además de la perspectiva específica del bajo pueblo). Y ellas son posturas eminentemente teóricas, y de hecho son posturas relativamente normales en el paradigma de la teoría crítica.

De hecho, si usamos el reciente Movimientos Sociales en Chile (2012) como botón de muestra, Salazar tiene múltiples afirmaciones que implican compromisos teóricos fuertes. Por ejemplo:

Los sistemas institucionales no son ni vírgenes ni mártires, ni esencias perfectas ni contingencias miserables: son, tan sólo, construcciones sociales, temporales, históricas y, por eso, normalmente, imperfectas. Que, por lo mismo, decaen con el tiempo. Y estando febriles, generan patógenos anticívicos, algunos de ellos mortales, asesinos. Y por todo eso agonizan, casi siempre, largamente. Porque en general, agonizan, pero no saben ni quieren morir de muerte natural (p 59)

En consecuencia, un Estado social e históricamente ajustado debe cumplir para ser tal, al menos tres condiciones estructurantes: legitimidad (producto de una libre y deliberada decisión ciudadana), eficiencia (capacidad para resolver efectivamente los problemas que presenta el contexto histórico para la ciudadanía general y particular) y representatividad (que sus agentes o representantes apliquen de hecho ‘la’ voluntad ciudadana a ‘los’ problemas contextuales que la afectan (p 69)

Las anteriores son declaraciones claramente teóricas: Hay un modelo de cómo funciona de sociedad, de cómo funciona el Estado. Las discusiones sobre constelaciones G y P en Violencia Política Popular, o toda el desarrollo de la idea de anomia anti-cívica también son planteamientos teóricos relativamente extensos. Planteamientos teóricos basados en una concepción claramente historizante, pero con ello pasamos al segundo punto, porque claramente una concepción de ese tipo es plenamente coherente con una visión de teoría crítica.

Como ya dijimos, la idea de la teoría crítica no es simplemente que se plantea un punto de vista desde el cual se critica normativamente la sociedad. Es una crítica que proviene internamente de esos procesos sociales. La continuación que hace Salazar de las citas anteriores nos muestra de inmediato su talante de teoría crítica:

He ahí el problema. Razón por la que es necesario ‘matarlos’ y darles piadosa muerte cívica.

Y nunca, que se sepa, se suicidan. Para bien-morir, requieren de la ‘acción directa’ y la sapiencia eutanásica de su madre legítima: la soberanía ciudadana’ (p 59-60)

Un Estado ilegítimo, ineficiente y no representativo (por tanto, enfermo de una letal anomia anticívica) merece, por tanto del Tribunal de la Historia constituido por la ciudadanía general y particular, como única respuesta posible, la pena de muerte (p 70)

En ambos casos se extrae una conclusión crítica, y en ambas se extrae del análisis de la sociedad. Es porque la sociedad tiene determinadas características, porque tiene un telos interno -un deber ser que proviene de las características básicas que la constituyen- que se puede criticar la situación actual: Porque en ella no se puede desplegar lo que corresponde a la sociedad. Como lo plantea más adelante en el libro que citamos:

Podría decirse que un movimiento social culmina (teóricamente) su acción histórica cuando llega a ejercer de modo pleno el poder necesario, no sólo para ajustar aquí o allá el sistema dominante, sino para construir otro nuevo: el orden social que realmente necesita (p 347)

O en una declaración de Violencia Política Popular, que sigue la misma lógica:

¿Existe actualmente alguna ciencia que, de modo aproximativo, esté en condiciones de responder a ese movimiento en que una realidad busca su pensamiento? (p 52 Edición LOM)

Luego, dado que la sociedad tiene un movimiento, la crítica proviene del examen de ese movimiento -de esa realidad. Y sólo puede provenir de un estudio que intente dar cuenta y asociarse a ese movimiento de la sociedad. Ello es, finalmente, en su esencia teoría crítica.

En esta entrada no se ha intentado describir la teoría de Salazar como tal, sólo mostrar que efectivamente hay una imaginación teórica relevante en su obra. Lo cual, al final, no es más que un llamado a las disciplinas que estudian lo social en nuestro país a tomarse en serio: No sólo hay elaboración empírica, hay también elaboración y discusión conceptual, y bueno sería que trabajáramos sobre ello. Tampoco es extraño que una parte importante de dicha elaboración ocurra en la historia, pero como ya lo dijimos en otra ocasión ella es una de las disciplinas más potentes e interesantes en nuestro país.

La rebelión de 1598. Un olvido en la memoria de Chile

Guerra_de_Arauco_-_Ger+¦nimo_de_BibarEl evento más trascendental de la historia de los territorios que ahora son Chile que es menos conocido en la memoria común es la rebelión de 1598. La Batalla de Curalaba, donde muere el gobernador García Oñez de Loyola el 21 de diciembre de ese año, es el momento inicial de una rebelión que, cuando finaliza, termina entre 1599 y 1604 con la destrucción de todos los asentamientos españoles al sur del Bío-Bío (con la excepción de Chiloé): Santa Cruz, Valdivia, La Imperial, Villarrica, Osorno, Angol y Cañete. Y entre medio tanto Chillán como Concepción sufrieron ataques importantes. No sólo eso sino que además los españoles no vuelven después al sur del Bío-Bío. En particular, no vuelven a asentarse en esa zona. Si bien los gobernadores durante el siglo XVII hacen múltiples campañas al sur del río, y de hecho hay algunos intentos (Fuerte de Boroa por ejemplo) y el Fuerte de Arauco sí se instala como presencia al sur, en general la frontera queda instalada en dicho río.

Esto es crucial porque eso sólo emerge como resultado de esa rebelión. Las rebeliones anteriores no tuvieron ese efecto. Después de la rebelión de Lautaro, que además es geográficamente más extensa, recordemos que Lautaro muerte en el río Mataquito, los españoles vuelven a la zona en cuestión. Las campañas y batallas de García Hurtado de Mendoza representa, finalmente, una reconquista de la zona. Y todos los alzamientos posteriores no hacen que los españoles abandonen la zona.

Luego, es la rebelión de 1598 la que establece una de las características esenciales de la historia posterior: La existencia de una frontera, de un ejército permanente, y con el real situado incluso del impulso a la economía monetaria y el cambio de eje geográfico del dominio español a la zona del norte del Bío-Bío. Eso desde el punto de vista ‘español’.

curalabaDesde el punto de vista mapuche es más sencillo: representa la constitución de un espacio mapuche libre e independiente. Para decirlo de otra forma y exagerando algo, desde el punto de vista mapuche la rebelión de 1598 y Curalaba son el equivalente, para la sociedad chilena, del Cruce de los Andes, de Chacabuco y de Maipú: el momento en que ganan su independencia (i.e no hay autoridades españoles en la zona luego de la rebelión, no hay encomenderos ni pago de tributos). Por cierto esto no implica olvidar que los españoles siguieron realizando juegos de dominación en la zona (esclavizando mapuches y llevándolos a la zona donde ejercían la colonización), recordemos que campañas militares seguían operando, pero el caso es que no era un espacio de dominio español directo: Al operar al sur del Bío-Bío operaban fuera de su espacio, estaban en expedición.

Ahora, ¿quien se acuerda -entre los chilenos, no entraré a discutir cómo se recuerda entre mapuches, que es otra pregunta- de esa rebelión? ¿Por qué Pelantaro, el líder de la rebelión y vencedor de Curalaba no es conocido, mientras que Lautaro sí es reconocido?

Mi impresión es que Lautaro es ‘apropriable’ por el discurso chileno que tiende a incorporar al mapuche como parte de lo chileno. Recordemos la idea de la raza chilena de Palacios donde el chileno es hijo del español y del mapuche. Lautaro, líder de una rebelión que no separa los espacios de la colonización y del mapuche, puede ser usado en ese discurso. El chileno puede sentirse descendiente de Lautaro (y recordemos los usos de su nombre en la independencia, como parte de la misma lucha contra el español).

Pero con Pelantaro no. El éxito de Pelantaro, finalmente, consiste en separar los espacios, en dejar una zona de dominación española separada de la zona mapuche. Y lo que nos dice eso es que, entonces, Chile se forma al norte del Bío-Bío, no al sur. Producto de la rebelión de 1598 es que se crea el espacio donde se generará el Chile tradicional, la zona donde se genera y crea la sociedad chilena, digamos el territorio entre Copiapó y Concepción (zona donde, por cierto, hay presencia indígena; pero allí lo que no hay es mapuches independientes). Por lo tanto, nos recuerda que cuando el ejército chileno, en ocasiones, hace nacer su linaje en el ejército permanente creado tras la rebelión está siendo exacto: Porque es heredero de esas tradiciones y de esos tercios, no de los que se oponían a esos tercios. Al fin y al cabo, Santiago o en Concepción son ciudades que los mapuches intentaron destruir y quemar. Llamar zona de dominación española a la zona del norte del Bío-Bío es engañoso al final: es la zona chilena.

En otras palabras, la rebelión de 1598 y Pelantaro lo que muestran es la diferencia entre chilenos y mapuches, que en otras palabras Pelantaro no es parte del ‘pueblo chileno’, y que Chile es heredero de quienes lucharon contra Pelantaro.  Santiago fue fundado en 1541 mientras que Temuco lo fue en 1881, y esos siglos de diferencia son producto de esa rebelión. Siglos que implican sociedades y grupos distintos.  Luego, para el relato unificador no es una figura muy grata.

La Herencia de Hobbes. Soberanía y Contrato en el Pensamiento Europeo de los siglos XVII-XVIII (II)

Como ya se planteó en la anterior entrada, se puede entender buena parte de la tradición contractualista como una forma de intentar salir de las consecuencias absolutistas de Hobbes pero usando las mismas premisas básicas.

 

Spinoza: Usando a Hobbes para fundamentar la república

spinozaUna primera versión, la más cercana a Hobbes, y que muestra con mucha claridad como obtener otras conclusiones a partir de esos argumentos, la representa Baruch Spinoza. Es posible encontrar en sus textos varias formas muy hobbesianas. Así en el Tratado Político, publicado en 1677 como parte de la edición póstuma de las obras completas, que en general sigue muy de cerca a Hobbes en su concepción de la soberanía. Pero estos argumentos se usan para defender más bien a la democracia: ‘El estado absoluto, sin duda es aquel que es detentado por toda la multitud’ (Spinoza, TP, Cap 8, §4). Y esto basado en razones ‘hobbesianas’ en que el estado de toda la multitud tiene más fuerza, y por ende más derecho. Más aún, Spinoza para sostener las limitaciones del poder soberano, usa una argumentación de clara raigambre hobbesiana, aunque no en sus conclusiones. Así en  el Tratado Teológico-Político, publicado en 1670:

Por consiguiente tendrá el supremo derecho sobre todos, quien posea el poder suprema, con el que puede obligarlos a todos por la fuerza o contenerlos por el miedo al supremo suplicio, que todos temen sin excepción. Y sólo mantendrá ese derecho en tanto en cuanto conserve ese poder de hacer cuanto quiera; de lo contrario, mandará en precario, y ninguno que sea más fuerte estará obligado a obedecerle si no quiere’ (Spinoza, TTP, Cap. 16, p. 193 de Ed. Gebhardt)

El inicio de la argumentación es muy similar a Hobbes, pero nos dice Spinoza que sí de verdad el derecho de mando se basa en el poder efectivo, entonces cuando éste se pierde, el derecho deja de existir. Y luego, Spinoza concluye que todo poder soberano deberá limitarse a lo que efectivamente puede obtener, y ahí radican sus límites. Si los sujetos se rebelan, y son exitosos en ello, entonces ahí quedó demostrado que los poderes supremos no tenían el derecho que decían tener. La experiencia de Spinoza, que vive en un cuerpo político nacido de una rebelión exitosa, y en un régimen ‘republicano’, es distinto del de Hobbes, que nace en una guerra civil y que se basa en el temor.

 

Locke: Los fundamentos tradicionalistas del liberalismo moderno

two-treatise-2Históricamente ha sido más importante la alternativa de John Locke, en particular porque ella funda toda la tradición liberal de pensamiento político. Y esto porque la concepción de Locke sobre el estado de naturaleza es tan distinta de la hobbesiana que le permite obtener conclusiones del estado civil también distintas. Y con ello la idea de poner límites al poder soberano aparece de forma más clara, porque la cesión de derechos resulta, finalmente, parcial y no absoluta.

El Segundo Tratado del Gobierno Civil (el primero es una refutación del derecho divino de los reyes), que fue publicado en 1689, es la obra política más célebre de John Locke. Y una de las obras más influyentes en el mundo moderno, si se piensa en su importancia en la creación de los Estados Unidos de América. El problema sigue siendo el mismo de Hobbes: la constitución de una autoridad. Pero Locke suma otra preocupación: como evitar que esa autoridad degenere en tiranía. Si constituimos el estado civil para nuestra ventaja, entonces preocuparnos que esta creación no termine constituyendo una desventaja se transforma en una pregunta central.

La definición de estado de naturaleza es similar a Hobbes:

Y éste es un estado de perfecta libertad para que cada uno ordene sus acciones y disponga de posesiones y personas como juzgue oportuno, dentro de los límites de la ley de naturaleza, sin pedir permiso ni depender de la voluntad de ningún otro hombre (Locke, Cap. 2)

Pero la concepción es distinta porque a renglón seguido nos dice que la libertad no es licencia y tiene límites. El primero es uno que el mismo Hobbes usa: la libertad de destruirse a sí mismo (de hecho, Hobbes plantea que cuando el soberano decide atacar la vida del individuo, éste ya no tiene que obedecer). Luego sigue y nos plantea que el estado de naturaleza es un estado en el cual el hombre sigue a su razón, lo cual sigue siendo todavía plenamente hobbesiano. Es en la siguiente idea que aparece un elemento no-Hobbesiano: Que ninguno debe dañar a otro (una libertad que precisamente constituía el eje del estado de naturaleza en Hobbes). ¿A que se debe ello? A la luz de la razón que proviene del creador.

En otras palabras, la estrategia de Locke para limitar las conclusiones absolutistas de Hobbes es volver a la tradición: Al derecho natural basado en el orden divino. Frente a Hobbes -que realiza toda su argumentación sin referencia alguna a Dios (y en eso también ocurre lo mismo con Spinoza)- nos aparece que el fundador de la tradición liberal moderna, secular e individualizante, sólo puede hacerlo por referencia a una tradición comunitaria y religiosa. De hecho, también hace referencia a la tradición clásica: Al igual que Aristóteles, discute la sociedad familiar antes de entrar a la sociedad política. El estado de naturaleza en Locke, al revés que en Hobbes, es un estado ya social.

Decimos que Locke es el fundador de la tradición liberal por las consecuencias que obtiene de esas limitaciones. Siendo el estado natural menos brutal, la cesión de derechos del estado civil es, por ende, parcial. De hecho, es tan menos brutal que todo el régimen de propiedad (capítulo 5) lo discute Locke antes de establecer la sociedad civil (capítulo 7): en el estado de naturaleza hay propiedad. El estado civil, luego, es para Locke algo bien específico, el poder de dirimir las cuestiones de derecho (de castigar las transgresiones) y de establecer la ley. En el estado de naturaleza cada quien es juez, y eso es lo que se traspasa a la sociedad. Más aún, como el fin de dicha sociedad civil es castigar las transgresiones a través de alguien que no sea juez de sí mismo, entonces la monarquía es estado de naturaleza: Porque en la relación entre el rey absoluto y los ciudadanos no hay autoridad distinta a la cual apelar, y por lo tanto en esa relación siguen en estado de naturaleza. Luego, sólo un poder limitado y donde exista una subordinación del poder a instituciones representativas, puede ser una sociedad civil: una en que siempre exista recurso a juez imparcial.

Las ideas de Locke fundan la tradición liberal en dos frentes: Primero al defender gobiernos representativos en vez de absolutos como forma de sociedad civil. Pero de hecho, como vimos, eso ya está en Spinoza. La ruptura central con Hobbes está en el segundo frente: En el hecho de tener una sociedad civil limitada. En la tradición contractualista anterior, el poder soberano recibe todos los derechos -por ello es indivisible-, en Locke sólo recibe algunos -los de juzgar y establecer leyes, en orden de proteger la propiedad instituida naturalmente.

Lo anterior es central porque permite entender una de las nociones básicas de la tradición liberal: la idea de libertad negativa: La libertad negativa es la libertad para hacer lo que el sujeto quiere sin interferencia externa. Esa idea está plenamente en Hobbes pero esta en el  estado de naturaleza. En Locke esa libertad ya es parte de la sociedad civil y el objeto de ella es precisamente proteger dicha libertad negativa, particularmente en su dimensión de propiedad.

 

Rousseau: Un soberano común para sustentar la ciudadanía

250px-Social_contract_rousseau_pageSi Locke sale de las conclusiones de Hobbes liberalmente, modificando el estado de naturaleza, la otra alternativa es cambiar las conclusiones cambiando el carácter del poder soberano: Enfatizando que es un gobierno republicano el que mejor representa la constitución del contrato social. En otras palabras, Rousseau con la idea de la voluntad general, aunque algo de ello ya estaba en Spinoza. El Contrato Social se publica en 1762, y la pregunta de Rousseau es sobre como encontrar un buen contrato social, uno que supere el despotismo y no haga equivalente el derecho a la fuerza. En sus propias palabras el problema del Contrato Social es:

Encontrar una forma de asociación que defienda y proteja con la fuerza común la persona y los bienes de cada asociado, y por la cual cada uno, uniéndose a todos, no obedezca sino a sí mismo y permanezca tan libre como antes (Rousseau, Libro I, Cap. 6)

Esto puede parecer distinto a Hobbes, pero la conclusión que obtiene de ello es equivalente a Hobbes:

Estas clausulas, bien estudiadas, se reducen a una sola, a saber: la enajenación total de cada asociado con todos sus derechos a la comunidad entera, porque, primeramente, dándose por completo cada uno de los asociados, la condición es igual para todos; y siendo igual, ninguno tiene interés en hacerla onerosa para los demás (Rousseau, Libro I, Cap. 6)

La misma incondicionalidad de Hobbes, Pero como ya dijimos la forma en que Rousseau escapa de las conclusiones de Hobbes no es la liberal de Locke, a través de la limitación, es en torno a la concepción de ese poder soberano constituido. En otras palabras, a través de la constitución de la voluntad general. Porque nos dice entonces Rousseau: “Cada uno pone en común su persona y todo su poder bajo la suprema dirección de la voluntad general y cada miembro considerado como parte indivisible del todo” (Rousseau, Libro I, Cap. 6). El poder soberano es absoluto e indivisible, pero no es despótico porque los individuos son parte de él: Son ciudadanos ‘como partícipes de la autoridad soberana y súbditos por estar sometidos a las leyes del Estado’ (Rousseau,Libro I, Cap. 6).

Esta doble concepción (ciudadano y súbdito) representa una doble relación de las personas con el Estado: Se es ciudadano en la relación pública -en la cual somos libres para tomar las decisiones en conjunto-, y somos súbditos en la relación privada -en la cual obedecemos la decisión que se ha tomado. Es lo que posteriormente se traducirá en la distinción ciudadano-burgués. Pero en esa posterior distinción la concepción de lo privado cambia: De un lugar ausente de libertad (súbdito) a un lugar de libertad negativa (burgués). En Rousseau, y en esto se muestra su diferencia de la tradición liberal, la libertad es la libertad pública y el mundo privado no es lugar de libertad. La libertad para la tradición liberal en cambio es también, y luego preponderantemente será centralmente, la libertad negativa del mundo privado: Es el límite a lo público lo que permite la libertad.

A través entonces de la ciudadanía es posible que la misma concepción de soberanía que se observa en Hobbes pueda ponerse bajo otros usos.

 

En Conclusión

La tradición contractual perdió fuerza y centralidad a partir del siglo XIX, pero sus ideas y las consecuencias de ellas siguen estando con nosotros. En algún sentido, los modernos regímenes democrático-liberales unen, no siempre de manera consistente y no necesariamente con claridad sobre el tema de fundamentar la obligación a seguir la ley, la concepción limitada de Locke con la concepción ciudadana de la vertiente de Rousseau. Podemos quizás no basarnos, y a veces hasta ridiculizar, la idea de un contrato social original, pero las ideas de esa tradición siguen siendo parte de nosotros. En algún sentido, seguimos siendo herederos de la tradición de Hobbes.

La Herencia de Hobbes. Soberanía y Contrato en el Pensamiento Europeo de los siglos XVII-XVIII (I)

leviathan_whaleAunque en su época fue fuertemente criticado, de hecho toda su obra fue parte del Index librorum prohibitorum de la Iglesia Católica, el Leviatán –publicado originalmente en 1651- de Hobbes es una obra fundacional del moderno pensamiento sobre la política y el Estado. En ella aparece una de las exposiciones más radicales de algunas de las ideas constituyentes del pensamiento de la modernidad temprana: La idea de pacto o contrato y la idea de soberanía.

Ninguna de estas ideas es original de Hobbes como tal. La idea de soberanía ya se encuentra en Jean Bodin en los Seis Libros de la República (1576), y allí también se encuentra la idea de un pacto como fundador del cuerpo político -pero en ese caso con un pacto que es entre familias. Pero como ya dijimos es la radicalidad y pureza de la presentación de estas ideas lo que le da su particular potencia.

La obra de Hobbes es una de las defensas más claras de la idea que existe un poder soberano, y que éste debe ser único -o sea, rechazo a toda autoridad dual o de límites a dicho soberano: es una autoridad suprema e incondicional. Contra la tradición anterior, y esto incluye tanto la clásica como la medieval, el soberano está por sobre la ley, dado que el soberano instituye la ley. Todos tenemos que obedecer la ley, menos el soberano. El poder soberano no puede ser dividido ni enajenado, ni el súbdito puede rebelarse frente a él. Como plantea el inicio del capítulo XVIII:

Dícese que un Estado ha sido instituido cuando una multitud de hombres convienen y pactan, cada uno con cada uno, que a un cierto hombre o asamblea de hombres se le otorgará, por mayoría, el derecho de representar a la persona de todos (es decir, de ser su representante) (Hobbes, Leviatán, Cap. 18)

Hobbes plantea a la monarquía, en ese sentido, absoluta como el régimen que mejor encarna estas ideas, pero de hecho dice explícitamente que se aplican a repúblicas (‘asamblea de hombres’ en la cita anterior). Y de hecho la idea que el poder no puede ser enajenado la ilustra Hobbes poniendo como ejemplo un caso republicano, en el mismo capítulo:

En efecto, ningún hombre es tan necio que afirme, por ejemplo, que el pueblo de Roma hizo un pacto con los romanos para sustentar la soberanía a base de tales o cuales condiciones, que al incumplirse permitieran a los romanos deponer legalmente al pueblo romano (Hobbes, Leviatán, Cap. 18)

Ahora bien ¿desde dónde surge este poder soberano? Es a través del contrato que él se genera. Para entender como ese contrato es posible se requiere entrar en la idea de estado de naturaleza y de ley natural y de constitución del cuerpo político que hay en Hobbes.

En cierto sentido, Hobbes no rechaza la idea de ley natural (los capítulos XIV y XV del Leviatán se dedican a las leyes naturales) o de cuerpo político (el contrato genera un cuerpo político, y la idea de la sociedad como un cuerpo está ilustrada en la portada de la primera edición) pero las cambia tan profundamente que quedan irreconocibles.  En primer lugar, al revés que toda la tradición, nuevamente tanto clásica como medieval, el estado de naturaleza, donde ocurren las leyes naturales, es un estado pre-social, en el sentido que se define porque no se ha constituido el cuerpo político. Es sólo a través del contrato que se crea el cuerpo político. En el pensamiento tradicional, precisamente la analogía orgánica es para mostrar que un estado a-social no es pensable, el cuerpo político siempre existe. Aquí el punto de inicio son individuos que crean la sociedad y el cuerpo político es una creación deliberada de las personas, no algo que está ya dado en la naturaleza. Hobbes es una de las primeras manifestaciones de un pensamiento radicalmente individualista de la vida social -el origen de una tradición que todavía está con nosotros.

En segundo lugar, las leyes naturales no son, como lo eran en el Medioevo, las leyes justas que emanan de Dios, y por cierto el derecho natural y las leyes naturales no son lo mismo; lex e ius, al revés que en el pensamiento medieval, son cosas distintas:

DERECHO DE NATURALEZA, lo que los escritores llaman comúnmente jus naturale, es la libertad que cada hombre tiene de usar su propio poder como quiera, para la conservación de su propia naturaleza, es decir, de su propia vida; y por consiguiente, para hacer todo aquello que su propio juicio y razón considere como los medios más aptos para lograr ese fin (Hobbes, Leviatán, Cap. 14)

La imagen tradicional de lo que Hobbes plantea como estado de naturaleza es la idea de la lucha de todos contra todos, en la cual, en una de las frases más inolvidables de la obra, “la vida del hombre es solitaria, pobre, tosca, embrutecida y breve” (Hobbes, Leviatán, Cap. 13). Pero no sólo hay eso en el estado de naturaleza. Ello porque Hobbes ha de establecer en el estado de naturaleza la posibilidad de un contrato vinculante que obligue a quienes son contratados. Porque si ello no sucediera, ¿entonces como sería posible crear el Leviatán?

La vida en el estado de naturaleza hace necesario crear el estado civil, la vida social, pero las condiciones de su creación han de estar en ese mismo estado de naturaleza. La posibilidad de ceder derechos es la segunda ley de naturaleza en Hobbes, y la idea que los contratos obligan -y la fundamentación de ello- el hilo conductor del capítulo XIII de la obra; y diferenciar las condiciones bajo los cuales los pactos son válidos o inválidos en el estado de naturaleza uno de los elementos que ahí son discutidos. Así inicia el capítulo XIV indicando, como consecuencia de toda la discusión anterior, que:

De esta ley de naturaleza, según la cual estamos obligados a transferir a otros aquellos derechos que, retenidos, perturban la paz de la humanidad, se deduce una tercera ley, a saber: Que los hombres cumplan los pactos que han celebrado. Sin ello, los pactos son vanos, y no contienen sino palabras vacías, y subsistiendo el derecho de todos los hombres a todas las cosas, seguimos hallándonos en situación de guerra (Hobbes, Leviatán, Cap. 14)

Luego, los pactos son posibles en el estado de naturaleza, en dicho estado las ventajas de realizar un pacto de cesión de derechos al soberano (y de cesión completa de derechos de forma indisoluble e incondicional) son plenas y manifiestas, y por ende necesarias, porque la primera ley de naturaleza es actuar de acuerdo a mi conveniencia. El Estado que Hobbes defiende, el estado de soberanía absoluta, entonces aparece como resultado de lo que los seres humanos crean en el estado de naturaleza.

La presentación de la argumentación del Leviatán que hace Hobbes parece de una lógica de hierro. No sería posible escapar de esas conclusiones. Pero de hecho sí resulta posible extraer otras conclusiones a partir del esquema general de estado de naturaleza / estado civil y de constitución de la soberanía. En otras palabras, la tradición contractualista posterior se puede pensar como un esfuerzo de usando el esquema hobbesiano (y por lo tanto las ideas de contrato, de soberanía como ideas de base) sin pasar a las conclusiones de Hobbes. Ello será examinado en la siguiente entrada.

Algunas Notas sobre la Concepción del Poder Político en el Medioevo

El pensamiento medieval, como el de cualquier época, si se lo examina con alguna atención se nos muestra como un pensamiento complejo. En relación al tema del poder político hay tres elementos que son importantes para entender dicha complejidad: La concepción dual de la autoridad, la concepción organicista de la comunidad, y la concepción unitaria de la relación entre ley y justicia. Examinaremos cada una de ellas a continuación.

La Concepción Dual de la Autoridad

Entre los innumerables aspectos que caracterizan a la Edad Media Europea está la concepción dual de la autoridad: la división del poder espiritual del temporal. Ella es básica en la configuración social de la época, y es relevante recordar que no era conocida en la Antigüedad. La autoridad dual termina haciendo la pregunta por la obediencia al poder político en una pregunta práctica, dada la posibilidad de conflicto entre ambas esferas.

 Aquellos enfrentamientos entre titanes pusieron a prueba los cimientos sobre los que cada uno de ellos se asentaba. Los papas recurrían a los concilios para juzgar a los reyes, y los reyes a consejos y parlamentos para censurar y juzgar a los papas’ (Black, 1996: 68)

Dad al César lo que es del César y a Dios lo que es de Dios estableció dos autoridades, pero durante todo el período se discutió que era del César y que era de Dios. Más aún, dado que el cristianismo temprano fue, en parte, un movimiento de rechazo a la ley (i.e el cristiano no podía obedecer las órdenes de un magistrado legítimo en torno a adorar al Emperador o a los dioses) las preguntas a la obediencia y de validez de la ley adquirieron un cariz muy distinto en esta época.

La Concepción Orgánica de la Comunidad Política

Para entender algunas de las ramificaciones de esta autoridad dual resulta también importante recordar que un elemento central del  pensamiento medieval, que será influyente durante mucho tiempo, es la idea de cuerpo político. La analogía de la comunidad con un organismo biológico es una característica fundamental del Medioevo. Y si bien hay antecedentes anteriores (en la República de Platón por ejemplo) de hecho no era tan central en el pensamiento clásico: La polis es una comunidad de ciudadanos más que un todo orgánico, y si bien la idea de concordia entre las clases en Roma hizo en diversas ocasiones alusión a la idea de sociedad como cuerpo, la frase SPQR (Senatus Populus Que Romanus, el Senado y el Pueblo de Roma) no es de esa  índole. En otras palabras, si bien la idea es pre-existente, adquiere una centralidad sólo en el Medioevo.

El clásico estudio de Kantorowicz (2012, original de 1957) sobre los dos cuerpos del rey ilustra las complejidades a que lleva esa concepción: El problema central es que el rey como ser humano físico muere, pero al mismo tiempo el rey es la cabeza del cuerpo político, y éste no muere con el rey. Dentro del pensamiento organicista la forma de resolver eso es la de crear la noción de un segundo cuerpo del rey, uno más simbólico, que es permanente -al igual que el cuerpo político de toda la comunidad. Este es un desarrollo que ocurre en el medioevo sólo porque en él -y no antes- la idea de comunidad política entendida como cuerpo resulta central.

La Ley y la Justicia

Sin embargo, el pensamiento medieval tiene también otros elementos que complejizan esa situación anterior tan clara. Lo primero es la idea que la ley es equivalente a justicia: lex e ius se observan como surgiendo del mismo tronco. Ahora bien eso implica en el Medioevo la idea de derecho y de ley natural. Porque la justicia es algo que deriva, finalmente, del orden divino, y por lo tanto de la naturaleza. La ley no es algo que es creado por los seres humanos: las leyes específicas pueden concretizar, y adaptar a situaciones locales -y el derecho medieval en buena parte es un conjunto de fueros específicos (Black 1996: 53), pero todo ello se basa en el derecho natural. Luego, la ley escrita es inferior a la ley natural, e incluso bien puede serlo a la costumbre -que se puede pensar precisamente como la adaptación a condiciones específicas de los principios de la ley natural (y que la costumbre puede desautorizar la ley escrita es algo defendido por Tomás de Aquino en la Suma Teológica (Black, 1996: 55). Más aún, en general, la ley es superior al Rey: la ley hace al Rey (porque es sólo de acuerdo a la ley que se establece la sucesión real por ejemplo). De hecho, la diferencia específica de la monarquía, que la diferencia de la tiranía, es finalmente el hecho que la monarquía es un régimen legal, en el cual el rey está sujeto a sus propias leyes.

Luego, la ley es el elemento superior. Es necesario que la ley sea el elemento vinculante, porque ella se fundamenta finalmente en el orden divino (y no por nada posteriormente en ambientes seculares la Ciencia hable de leyes naturales, pensando la Naturaleza como regida por leyes, del mismo modo que la Sociedad lo es).

Combinando los Elementos.

Los tres elementos anteriores pueden sintetizar, y distinguir, el pensamiento medieval sobre el poder político. Al mismo tiempo su combinación nos presenta las complejidades de ese pensamiento.

Pensemos en la relación del organicismo con la autoridad dual: Ahora bien, si la comunidad es un cuerpo entonces la autoridad está en su ‘cabeza’. Las personas han de obedecer a su cabeza, del mismo modo que el cuerpo obedece y sigue a la voluntad de sus funciones superiores. El modelo orgánico, entonces, da razones claras para fundamentar el tema de la obediencia a la autoridad.

El problema es que el cuerpo político tiene dos pretendientes a ser la ‘cabeza’: el rey o la Iglesia. Pero el modelo sólo hace sentido si hay una sola cabeza. Y por lo tanto, la reacción del pensamiento medieval frente al hecho de la autoridad dual fue intentar eliminar el dualismo e intentar reintroducir una cierta unidad (i.e dejar una clara cabeza al respecto).

Al mismo tiempo, la obediencia a la ley (que se fundamenta en el orden divino) y la obediencia a la autoridad (a la cabeza del cuerpo político) bien pueden quedar como asuntos distintos. ¿Qué se hace cuando la autoridad establece órdenes injustas? ¿Qué pasa cuando las distintas autoridades dan órdenes distintas?

Una de las formas, es la solución de Marsilio de Padua en el Defensor Pacis es el recurso a la comunidad, un recurso bastante natural en un pensamiento muy centrado en la comunidad, pero al mismo tiempo -como casi siempre lo son las elaboraciones que llevan al límite los razonamientos comunes- bastante radical y en su caso particular herética: Es el conjunto de la comunidad la que puede decidir estos asuntos. Así discutiendo sobre la excomunicación Marsilio nos dice:

To institute such a judge (viz. one whose task it would be to summon the accused and to examine, judge, absolve or condemn him to be defamed or cut off from the fellowship of the faithful in this way) belongs rather to the body of the faithful in the community in which a person must be judged with a judgement of this kind; or to its superior; or to a general council (Marsilio de Padua, Defensor Pacis, Discurso 2, capítulo 6, número 12)

Pero sin llegar a ese extremo la idea que el Concilio, o más común, en particular para asuntos seculares, la reunión de los distintos Estados es el lugar en que estos temas se pueden resolver era algo más extendida. En todo caso, no es algo que se resuelva individualmente.

En algún sentido, se puede plantear que la novedad del pensamiento político de la Era Moderna es precisamente el reemplazo de la autoridad dual por una única -y eso es el concepto de soberanía- y el abandono de un pensamiento orgánico -y el contrato social es una muestra de ello. Y con estos movimientos la unidad de lex e ius pasa a disolverse, o al menos, a entrar en discusión. Si todo ello es cierto, entonces el pensamiento político moderno nace con Hobbes -que es donde finalmente todas esas características aparecen en conjunto. Que, no es sino otra forma de decir que la siguiente entrada debiera empezar con el pensador inglés.

Referencias Bibliográficas.
Black, Antony (1996) El Pensamiento Político en Europa 1250-1450. Cambridge: Cambridge University Press
Kantorowicz, Ernst (2012) Los Dos Cuerpos del Rey. Madrid: Akal.
Marsilio de Padua. Defensor Pacis. Cito desde la Edición de Cambridge University Press, en Cambridge Texts in the History of Political Thought, traducción y edición de Annabel Brett, 2005, escrito originalmente en 1324.