Linguagem: força vital do ser humano 1

Estou lendo o livro de MITHEN, S. The Language Puzzle: How We Talked Our Way Out of the Stone Age. London: Profile Books, 2024, 544 p. – ISBN 9781800811584.

Estas são notas de leitura do capítulo 16: Conclusion: the evolution of language [Conclusão: a evolução da linguagem].MITHEN, S. The Language Puzzle: How We Talked Our Way Out of the Stone Age. London: Profile Books, 2024, 544 p.

Diz Steven Mithen na conclusão:

Este livro tenta desvendar o quebra-cabeça da linguagem: por que, quando e como a linguagem evoluiu? Reuni evidências da linguística e da arqueologia, da antropologia e da genética, da neurociência, da psicologia e da etologia. Usei-as para montar quatorze fragmentos do quebra-cabeça que agora se encontram dispersos sobre a mesa (…) Chegou a hora de encaixar esses fragmentos para completar o quebra-cabeça da linguagem. Apresento, a seguir, a minha melhor tentativa.

Para facilitar a leitura, reestruturei o texto em formato de perguntas e respostas. Este capítulo não tem notas de rodapé. As notas assinaladas com * são minhas.

O capítulo foi publicado em 4 posts:

Linguagem: força vital do ser humano 1

Linguagem: força vital do ser humano 2

Linguagem: força vital do ser humano 3

Linguagem: força vital do ser humano 4

 

1. O ponto de partida

O Último Ancestral Comum (UAC) e seus descendentes possuíam capacidades mentais e vocalizações semelhantes às dos chimpanzés atuais?
. O Último Ancestral Comum (UAC) de chimpanzés e humanos, que viveu na África entre 8 e 6 milhões de anos atrás, possuía capacidades mentais e vocalizações não muito diferentes das dos chimpanzés atuais, sejam eles Pan paniscus (o bonobo) ou Pan troglodytes (o chimpanzé). Isso se manteve com os parentes e descendentes do UAC, incluindo Sahelanthropus tchadensis e Ardipithecus ramidus.

Para que e como esses primatas terão usado seus chamados?
. Esses primatas que habitavam florestas usavam seus chamados para influenciar o comportamento de outros membros de seus grupos. A maioria dos chamados expressava estados emocionais: chamados altos e rápidos e gritos estridentes com os dentes à mostra indicavam raiva e agressão; uivos e arrulhos mais suaves e lentos expressavam afeto e fortaleciam laços sociais. Todos os chamados eram holísticos – os elementos sonoros que continham não tinham significado em si mesmos. Os chamados variavam entre as espécies, refletindo seu estilo de vida e anatomia, e entre as comunidades, refletindo o contexto ecológico e as tradições culturais. Embora esses primatas tivessem algum controle sobre a emissão de vocalizações, eles tinham pouca influência sobre o som em si, além de torná-lo um pouco mais baixo ou mais alto, mais longo ou mais curto. Em comparação com os hominídeos posteriores, seus cérebros possuíam um número relativamente pequeno de neurônios e redes neurais localizadas. Eles tinham controle muscular limitado sobre a expiração, o acionamento das pregas vocais e as articulações da língua, dos dentes e dos lábios. As membranas vocais, os sacos aéreos, os dentes grandes e as faces protuberantes restringiam a amplitude e a consistência dos sons que emitiam. Apesar dessas limitações, as vocalizações dos primatas possuíam algumas qualidades semelhantes a palavras e sintaxe: os significados das vocalizações às vezes dependiam do contexto; os mesmos elementos sonoros eram combinados de maneiras diferentes em vocalizações diferentes. Os mais jovens precisavam complementar seus instintos geneticamente determinados para aprender quais vocalizações emitir em cada circunstância.

 

2. O surgimento das palavras

Mudanças climáticas ocorridas há cerca de 4 milhões de anos moldaram novos comportamentos dos hominídeos?
. Há cerca de 4 milhões de anos, houve uma mudança no clima global em direção à aridez, fazendo com que as florestas recuassem e os hominídeos migrassem para campos abertos com árvores esparsas. O número de espécies de hominídeos proliferou com uma multiplicidade de adaptações – os australopitecos. Alguns se tornaram herbívoros especializados em alimentos vegetais secos, enquanto outros começaram a coletar restos de carne, gordura e tutano das carcaças de presas abandonadas por carnívoros. Todos enfrentaram o desafio de viver em um ambiente aberto e abundante em predadores. Precisavam viver em grupos maiores para segurança e interpretar sinais naturais para entender o que estava acontecendo, ou prestes a acontecer, em seu mundo: as pegadas e trilhas de predadores e presas, o voo de pássaros, o cheiro de fumaça de um incêndio distante na savana.

Indivíduos melhores em aprendizado estatístico podem ter usado seus chamados vocais para obter vantagens?
Principais espécies de hominídeos - seis milhões de anos de evolução humana. Fonte: Steven Mithen, The Language Puzzle, 2024. . Como em qualquer população, mutações genéticas aleatórias criaram um conjunto de variabilidade nas habilidades cognitivas. Alguns indivíduos eram melhores em aprendizado estatístico*, detectando associações recorrentes e usando-as a seu favor. Ao observar os membros do seu grupo, eles aprenderam a prever quem lutaria pela comida e quem se submeteria sob ameaça, com quem colaborar e quem evitar. Esses indivíduos tornaram-se hábeis em lidar com a complexidade do mundo social. Usavam seus chamados vocais para construir alianças, garantir status e obter acesso a recursos, seja compartilhando comida ou roubando alimentos adquiridos por outros. Ao fazer isso, garantiram vantagem reprodutiva – seus genes significativos para aprendizado estatístico transmitiram suas habilidades sociais para a próxima geração por meio dos neurônios extras e/ou redes neurais que esses genes desenvolveram.

Reconhecer regularidades no mundo natural e construir categorias de sinais naturais também fazia parte deste processo?
. Os mesmos indivíduos, ou outros, obtiveram vantagem semelhante ao serem hábeis em reconhecer regularidades no mundo natural e construir categorias de sinais naturais – como a pegada fresca de um leopardo é um sinal de perigo e o caule seco e mole de uma haste murcha indica um tubérculo gordo enterrado abaixo. O valor de fazer tais associações expandiu ainda mais a capacidade de aprendizado e, com ela, o tamanho do cérebro. O mesmo se aplicava à importância de saber como segurar um nódulo de pedra em uma mão e golpeá-lo com a outra no ângulo e com a força corretos para destacar uma lasca. As ferramentas resultantes permitiam que restos de carne e gordura fossem retirados mais rapidamente das carcaças, e que ossos fossem quebrados para extrair a medula. A velocidade era essencial, pois os carnívoros também buscavam alimentos nutritivos, fossem pedaços de uma carcaça morta há muito tempo ou um hominídeo saboroso para comer. Eficiência e eficácia na savana eram as palavras-chave para a sobrevivência dos hominídeos.

Foram essas pressões seletivas que produziram um cérebro maior no Homo habilis?
. Há 2,8 milhões de anos, essas pressões seletivas convergiram e construíram um cérebro maior para pelo menos uma, e talvez várias, espécies de hominídeos, que hoje chamamos de Homo habilis. Processos de aprendizagem de propósito geral eram utilizados em todos os domínios e produziam resultados mutuamente benéficos: alianças sociais fortalecidas facilitavam a transmissão de habilidades de fabricação de ferramentas; estas forneciam lascas de pedra para coleta de alimento e nódulos para quebrar ossos em busca de tutano e para triturar plantas; a carne, a gordura e o tutano alimentavam o cérebro, alimentando os neurônios extras que permitiam o uso de sinais naturais para encontrar carcaças e garantir o sucesso no mundo social.

O cérebro maior do Homo habilis terá sido causa ou consequência desse processo?
. O cérebro maior do Homo habilis, que por vezes atingia 800 cm³, era tanto causa quanto consequência desse ciclo de retroalimentação social-tecnológica-dietética. Como consequência de seu tamanho, surgiram conexões entre os córtex visual, motor, auditivo e somatossensorial, conexões essas necessárias para a aprendizagem estatística. As conexões também causavam extravasamento cortical, provavelmente decorrente de mielinização insuficiente. Essa dispersão sensorial fez da sinestesia um estado mental normal e onipresente. Impressões sensoriais sobre a aparência, os movimentos e o cheiro dos predadores infiltravam-se inconscientemente em seus chamados de alarme – sons de rastejamento para cobras, chamados de ataque para leopardos, gritos semelhantes a grasnidos para pássaros**.

Os chamados foram combinados com gestos icônicos?
. Esses gritos e chamados eram frequentemente combinados sem esforço com gestos icônicos***. Os chamados emitidos durante a fabricação de ferramentas de pedra assumiam o timbre de uma martelada e a nitidez de uma lasca; sons arredondados e mãos em concha expressavam tubérculos bulbosos; sons minúsculos e penetrantes e dedos beliscados representavam piolhos e pulgas. Alguns chamados combinavam uma profusão de sensações multimodais em um único segmento sonoro: a resposta vocal ao fogo na pastagem capturava cores brilhantes e cintilantes, calor, estalos e o aroma da fumaça da lenha em um único chamado sinestésico.

Como teriam sido os chamados para a construção de relacionamentos?
A iconicidade passou a moldar os chamados para a construção de relacionamentos. Aqueles usados ​​para o vínculo social tornaram-se mais suaves e calmos, expressando em som como alguém acariciaria fisicamente um amigo. Estados emocionais – impressões sensoriais de si mesmo – eram vocalizados com mais frequência: sons como “ai” quando machucado, “oh-oh” quando surpreso e “tsk-tsk” quando decepcionado.

Como se dava a incorporação destes segmentos icônicos na vocalização dos indivíduos?
. Tais impressões sensoriais, semelhantes às dos macacos, permaneceram incorporadas às vocalizações do Homo habilis por um milhão de anos ou mais. Eles seSítios fossilíferos de hominídeos na África. Fonte: Charles Musiba et alii, The Dawn of Humanity. Elements, 2023. expressavam como segmentos sonoros dentro de vocalizações mais longas e complexas, frequentemente combinando o que chamamos de vogais e consoantes em uma sucessão de expirações rápidas. Os indivíduos mais sensíveis aos segmentos icônicos obtinham vantagem: adquiriam conhecimento sobre o mundo a partir das vocalizações sinestésicas de outros – conhecimento sobre o perigo de predadores, a localização de alimentos e o provável comportamento de outros indivíduos. Da mesma forma, aqueles que, por acaso, tinham um controle voluntário relativamente alto sobre a incorporação de segmentos icônicos em suas próprias vocalizações, controlavam o conhecimento e o comportamento de outros – solicitando ajuda para proteger uma carcaça das hienas, mas garantindo que ninguém mais soubesse sobre um cacho de frutos silvestres até que estivessem prontos para contar. Embora adquirissem seu próprio significado independente, os segmentos icônicos permaneciam muito inconsistentes em seus sons, careciam de inícios e fins suficientemente bem definidos e eram muito dependentes da presença do estímulo para serem considerados palavras.

Que outras forças seletivas podem ter impulsionado a evolução humana?
. A capacidade de explorar a iconicidade nas vocalizações não era o único meio pelo qual se obtinha vantagem reprodutiva. Múltiplas forças seletivas impulsionavam a evolução humana de inúmeras maneiras. A importância de reduzir o custo energético da locomoção, de poder carregar ferramentas e alimentos ao caminhar e de diminuir a exposição ao sol impulsionou a evolução do bipedalismo, da marcha competente do Homo habilis à caminhada e corrida eficientes do Homo erectus. Isso possibilitou percorrer distâncias maiores e explorar áreas mais extensas em um único dia. A capacidade de arremessar pedras com precisão e a longas distâncias para afugentar hienas de uma carcaça valiosa ou afastar um leão agressivo promoveu a evolução da coordenação motora e das articulações dos ombros, semelhantes às que temos hoje.

Por que seria vantajoso viver em grupos maiores?
. Os desafios de viver em um grupo maior conferiram uma vantagem social àqueles indivíduos que conseguiam usar seu aprendizado estatístico para prever o comportamento dos outros com detalhes cada vez maiores e em mais circunstâncias. Ao saber em quem confiar, a colaboração aumentou: enquanto alguns buscavam carne, outros cavavam em busca de tubérculos; seus ganhos eram reunidos e compartilhados. A vantagem seletiva também advinha do uso de ferramentas de pedra, da utilização da mesma ferramenta para diversas tarefas e da disponibilidade de lascas afiadas como navalhas sempre que fosse necessário cortar carne ou caules de plantas. Essas ferramentas eram melhor fabricadas moldando-se um nódulo em um formato que se encaixasse facilmente na mão, removendo-se lascas de ambas as faces.

O que vem a ser o dilema obstétrico que levou ao surgimento da infância?
. A capacidade de buscar alimento em áreas mais amplas e colaborar com mais eficácia, sempre com uma ferramenta à mão, aprimorou a qualidade da dieta: mais carne, frutas mais maduras e tubérculos mais carnudos. À medida que a necessidade de mastigar sementes secas e raízes duras diminuía, a estrutura robusta da face e o tamanho dos dentes molares também diminuíam. Duas tendências evolutivas entraram em conflito: o bipedalismo eficiente exigia uma pélvis estreita, enquanto cérebros maiores (dos bebês) exigiam um canal de parto maior****. O conflito foi resolvido em favor da primeira tendência. Os bebês nasciam prematuros para um mamífero do tamanho do Homo erectus e precisavam manter um ritmo de crescimento fetal fora do útero. Uma nova etapa na história de vida humana surgiu: a infância.

E a evolução do trato vocal?
. Os desenvolvimentos não linguísticos tiveram impacto na vocalização e nos gestos. Mudanças anatômicas relacionadas ao bipedalismo, ao cérebro mais pesado, aos dentes menores e ao rosto mais achatado influenciaram o formato do trato vocal. Há 1,6 milhão de anos, uma gama diferente e mais ampla de fonemas era emitida nas savanas africanas em comparação com a época em que o Homo habilis e os australopitecos emitiam seus chamados e gritos. Os músculos faciais passaram a ser tão importantes para a produção de diversos sons na mesma expiração quanto para a mastigação. A capacidade de controle muscular que permitia manipular martelos de pedra na confecção de bifaces também se aplicava ao trato vocal, possibilitando rápidas mudanças fonéticas. A infância ampliava as oportunidades de aprendizado vocal, ao mesmo tempo que criava um gargalo de aprendizado – um curto período de tempo para complementar ou suprimir os instintos genéticos sobre quais vocalizações emitir em cada circunstância. As vocalizações com elementos icônicos eram as mais fáceis de aprender e modificar, visto que bebês e crianças possuem uma predisposição perceptiva inata para sons sinestésicos.

E então segmentos sonoros icônicos foram gradualmente transformados em palavras icônicas?
Evolução humana de Lucy até hoje . Foi após o surgimento desse conjunto de características anatômicas, cognitivas e de história de vida que os segmentos sonoros icônicos foram gradualmente transformados em palavras icônicas. O impulso instintivo para uma comunicação eficiente e eficaz foi a causa. Os indivíduos com o aprendizado estatístico mais desenvolvido identificaram associações recorrentes entre sequências de sons sinestésicos em uma vocalização e seus referentes no mundo, seja uma cobra se aproximando, uma poça d’água ou uma carcaça abandonada. O desafio de identificar tais associações foi facilitado pelo fato de o hominídeo que emitia a vocalização e o ouvinte possuírem a mesma percepção sinestésica e intermodal do mundo, o que restringia os possíveis referentes da vocalização para o ouvinte. Quando uma associação recorrente era identificada, o impulso pela eficiência eliminava os sons periféricos e sem significado, isolando sua essência em um segmento independente de som icônico. Os indivíduos mais hábeis em produzir, perceber e agir de acordo com esses sons adquiriram mais conhecimento sobre o mundo e garantiram vantagem reprodutiva: eram melhores comunicadores, mais eficazes no mundo social e obtinham mais alimentos e de melhor qualidade para comer e compartilhar. Eles tinham mais relações sexuais, assim como seus descendentes, permitindo que seus genes e hábitos culturais se espalhassem pela população.

Como terá sido o processo de transformação de sons icônicos em palavras icônicas?
. À medida que os sons icônicos passavam por sucessivos gargalos de aprendizado de geração em geração, sua acústica era moldada em uma forma consistente, auxiliada pela perda evolutiva das membranas vocais e dos sacos aéreos. Como os significados dos sons icônicos estavam embutidos nos próprios sons, eles podiam ser usados ​​e compreendidos por outros sem a presença de seus referentes. Isso era de considerável valor – um som icônico com um gesto de apontar, feito por um hominídeo em pé em uma elevação para outros abaixo, comunicava tanto “fuja” quanto “corra em direção a”, dependendo se o som icônico se referia a um leão se aproximando ou a uma árvore com frutos. A combinação do gargalo de aprendizado e das capacidades de aprendizado estatístico resultou na combinação de sons icônicos em sequências curtas, dois ou três sons encadeados, cada um contribuindo para um significado geral, sendo sua ordem outro aspecto da iconicidade, ao capturar a sequência de eventos. Com sua consistência acústica, deslocamento e uso em novas combinações, o que antes eram segmentos de sons icônicos embutidos em vocalizações semelhantes às de macacos, gradualmente se tornaram palavras icônicas semelhantes às humanas.

Palavras icônicas possibilitaram a transmissão de conhecimento técnico de uma geração para outra?
. A mesma trajetória de mudança estava ocorrendo com as ferramentas de pedra. A irregularidade de forma e o uso único dos núcleos e lascas Olduvaienses foram substituídos por ferramentas bifaciais multiuso com formato consistente*****. A fabricação dessas ferramentas era facilitada pela pronúncia de algumas palavras icônicas de instrução para si mesmo, que eram então compartilhadas com outros, permitindo a transmissão do conhecimento técnico de uma geração para a seguinte. Mas, com a restrição imposta pela iconicidade verbal, um limiar tecnológico foi rapidamente atingido, o qual não pôde ser superado por mais de um milhão de anos.

A área de Broca se desenvolveu no cérebro do Homo erectus?
. Assim como as novas palavras icônicas, os bifaces podiam ser transportados para uso conforme a necessidade. Tal foi a vantagem reprodutiva obtida que, por volta de 1,5 milhão de anos atrás, o que hoje chamamos de área de Broca havia se desenvolvido no cérebro do Homo erectus, permitindo a produção tanto de palavras quanto de ferramentas. Os bifaces passaram a ser identificados por meio de uma palavra icônica, e os usuários mais proficientes de palavras criaram rótulos icônicos distintos para o machado de mão, a picareta e o cutelo. Isso os transformou em objetos para reflexão mental, contribuindo para o aprimoramento de sua fabricação. Há 700.000 anos, os machados de mão passaram a ser fabricados para serem mais finos e elegantes, frequentemente com uma forma cuidadosamente elaborada e um grau de simetria que ia muito além das exigências de uma ferramenta de açougueiro. Ao fazer isso, os artesãos demonstravam suas habilidades técnicas, combinando planejamento, coordenação motora, força física e sensibilidade estética. Os observadores prestavam atenção a isso, especialmente aqueles do sexo oposto, homens ou mulheres, buscando sinais de bons genes para transmitir à sua descendência.

Como seria a linguagem do Homo erectus?
. Com as novas palavras icônicas, a linguagem havia surgido, embora soasse bastante diferente da que temos hoje. O Homo erectus tinha capacidade limitada de controlar a respiração e, portanto, raramente produzia mais do que algumas palavras a cada expiração, muitas vezes contidas em vocalizações que continham chamados e gritos semelhantes aos de macacos. Mas, à medida que as palavras icônicas proliferavam, suas combinações se tornavam mais longas e seu conteúdo informativo aumentava. Conforme as palavras adquiriam um status independente, os chamados e gritos restantes perderam qualquer conteúdo semântico que antes possuíam. Passaram a se dedicar à expressão de estados emocionais, intensificando o uso de timbre, tom e ritmo.

O ritmo teve papel importante na construção da comunicação humana?
. Tais chamados induziam estados emocionais em outros indivíduos e, assim, eram eficazes na construção de laços sociais do tipo que não podem ser alcançados apenasSteven Mithen (nascido em 1960) por meio de palavras. As mães agora embalavam e cantavam para seus bebês; grupos de adolescentes começaram a cantar juntos antes de embarcar em tarefas colaborativas desafiadoras. O recém-descoberto senso de ritmo não apenas permitiu que os hominídeos cantassem e dançassem, mas também os auxiliou em tarefas físicas, como correr longas distâncias pela savana seguindo animais feridos. Ao entrarem em ritmo, vocal e fisicamente, os hominídeos desenvolveram duas formas distintas de comunicação: sequências de palavras icônicas ricas em informação que evoluiriam para a linguagem; e cérebros e corpos sensíveis à melodia e ao ritmo, que forneceram a base para a música. Mas não havia uma divisão estrita: mesmo nesse estágio inicial da linguagem, os significados das palavras e frases eram matizados pela alteração da entonação e da ênfase, pela adição de pausas e pela mudança de andamento. As palavras mais expressivas, aquelas que evocavam uma experiência multissensorial, como o calor, os aromas, o crepitar e as chamas de uma fogueira na savana ou a investida estrondosa de um elefante enfurecido, faziam uso de ritmo, repetição e gestos. Os linguistas de hoje as chamariam de ideofones******.

 

* O aprendizado estatístico na pré-história é uma referência ao processo cognitivo crucial de reconhecimento de padrões e tomada de decisões baseadas em probabilidades empíricas para a sobrevivência, como padrões de migração de animais, identificação de alimentos comestíveis, previsão do tempo e mudanças sazonais, aprimoramento de ferramentas etc. Na pré-história, esses processos eram realizados mentalmente e passados adiante oralmente ou por imitação, como parte do conhecimento coletivo do grupo. O aprendizado estatístico era, essencialmente, a capacidade de reconhecer a frequência de eventos e usar essa informação para fazer inferências sobre o futuro e maximizar as chances de sobrevivência.

** Mielinização insuficiente: O extravasamento ou “dispersão sensorial” é provavelmente causado por falhas na mielinização (a cobertura isolante das fibras nervosas), permitindo que os sinais de uma modalidade sensorial (como a audição) ativem involuntariamente outra (como a visão de cores). Já a sinestesia – além de ser uma figura de linguagem (como, por exemplo, “cheiro doce”) – é um fenômeno neurológico onde os sentidos se misturam, como ver cores ao ouvir música ou sentir o gosto de palavras. A sinestesia resulta de uma conectividade cruzada incomum e aumentada entre diferentes áreas sensoriais do cérebro.

*** Gestos icônicos são movimentos das mãos que imitam visualmente o que está sendo dito. O gesto se parece com a ideia que representa, como fazer o formato de uma casa para a palavra “casa” ou juntar os dedos para “pequeno”. Falar gesticulando ajuda o cérebro a visualizar e resolver problemas.

**** Cf. Wikipedia, Dilema obstétrico.

***** Cf. Uma breve história da humanidade 1. Post publicado no Observatório Bíblico em 11.12.2025

****** Ideofones são palavras ou sons que imitam ou evocam uma experiência sensorial (som, movimento, cor, ação) de forma vívida, como “zum-zum”, “tique-taque”, “fofoca”, “borbulhar”, “chuá-chuá” (da água). Estão ligados à iconicidade, onde a forma sonora reflete o significado, criando uma imagem mental vívida de sensações, ações, cores, movimentos ou estados. Retratam as ideias que expressam.