Rodando Python no Lego Mindstorm

Quem já tentou fazer programação com blocos sabe que chega um ponto em que a produtividade deixa a desejar. Por isso é interessante fazer a programação dos kits Lego Mindstorm usando Python.

Nesse sentido a documentação oficial para fazer isso é bem ampla mas me pareceu possuir algumas lacunas para quem está começando. Foi pensando nisso que eu escrevi esse post.

Caixa de kit lego com o código 31313
Caixa do kit Lego utilizado

Hardware utilizado:

  • 1kit Lego Mindstorm EV3
  • 1 cabo USB
  • 1 notebook
  • 1 cartão microSD de 2GB

Instalando o Python no cartão SD

A documentação oficial diz que o cartão SD deveria ser de, no mínimo, 4GB mas eu utilizei – com sucesso – um cartão de 2GB.

O primeiro passo é baixar a imagem que contém o software necessário para rodar Python no Lego. Essa imagem na verdade é um Linux modificado. No momento da escrita desse texto o link para download é https://education.lego.com/en-us/support/mindstorms-ev3/python-for-ev3.

Tentei usar o software Balena Etcher para gravar a imagem porém ao final o programa mostrava um erro mas não dava mais detalhes do motivo do erro. Talvez seja pelo tamanho do cartão SD. Não fiz um teste com um cartão com maior capacidade.

Para contornar esse erro do Etcher fiz a gravação com o comando dd do Linux. Veja abaixo a linha de comando completa:

cat ev3-micropython-v2.0.0-sd-card-image.img | sudo dd bs=4M of=/dev/sda

Como esse não é um tutorial de Linux, não vou entrar em detalhes, mas resumidamente o comando acima pega o arquivo da imagem e faz a cópia no dispositivo /dev/sda. No meu caso esse era o cartão SD. Confira muito bem se esse é o seu caso pois se você usa um disco rídigo então /dev/sda pode ser um pendrive ou até mesmo o seu disco rígido dependendo dos dispositivos de armazenamento conectados e o comando dd apaga todo o conteúdo anterior do dispositivo. Mesmo se /dev/sda for o seu cartão note que você perderá arquivos que estiverem nele.

Após o comando encerrar, desmonte a unidade e retire o cartão do computador.

Agora insira o cartão no computador Lego e ligue o mesmo. Se der tudo certo após uns 10-15 segundos deverão “correr” letras pequenas na tela do computador Lego.

O vídeo abaixo mostra essa parte do processo. Note que essa inicialização pode demorar. No meu caso a inicialização em si demorou 45 segundos pois a imagem Linux que está no cartão precisa fazer a detecção do hardware entre outras verificações.

Programando com Python

Se a inicialização ocorreu conforme esperado então agora começa a parte mais divertida.

Documentei os passos com as imagens abaixo.

1º Instale a extensão “EV3 Micropython” no Visual Code.

2º Depois que a extensão tiver sido instalada aparece uma opção nova do EV3 Micropython no menu lateral do Visual Code

3º Clicando nessa opção abre um menu um pouco mais pra direita com opções de “Criar um projeto novo”, “Explorar projetos de exemplo” ou “Abrir o guia do usuário”.

4º Clicando em explorar projetos de exemplo vários subtópicos, cada um com vários exemplos aparece na coluna da direita.

5º Depois de clicar em um dos exemplos o menu lateral vai mudar mostrando alguns arquivos. O que nos interessa, por padrão, tem o nome de main.py
Esse é o arquivo do seu exemplo/programa.

6º Clicando no arquivo main.py na coluna principal o código vai ficar disponível para você editar.

7º Uma vez que você criou o seu programa (ou carregou um dos exemplos). É hora de passar o código para o Lego. Conecte o cabo USB no computador e no kit LEGO e verifique a opção “EV3DEV Device Browser” na parte inferior do menu lateral.

8º Fiz alguns testes usando o ambiente Windows e o ambiente Linux (Pop OS! 20.04) e enquanto a detecção ocorreu automaticamente no Windows, no Linux foi necessário desconectar e conectar algumas vezes o cabo USB e clicar em “Click here to connect to a device”. Como eu usei dois notebooks diferentes não sei se o problema é do notebook ou do sistema operacional.

No Linux depois de clicar na opção de conectar, foi preciso escolher o dispositivo em uma menu no centro.

9º Depois do passo anterior (que não foi preciso no Windows) o dispositivo aparece com um ícone verde no menu lateral. O botão redondo, quando está com a cor verde, representa que o dispositivo está pronto para receber o seu código.

10º (Quase lá) Agora é preciso efetivamente passar o código para o EV3. Existe um ícone na extensão que parece com um ícone de download, e que ao passar o mouse mostra o texto “Send workspace to device”. Clicando no ícone o seu código será transferido para o Lego.

11º Se tudo deu certo uma mensagem “Download to ev3dev complete” vai aparecer na parte inferior direita da tela conforme a imagem abaixo.

12º Por via das dúvidas antes de desconectar o cabo USB eu cliquei com o botão direito no dispositivo e cliquei em desconectar. Não diz no manual que isso é necessário mas achei bom garantir para prevenir que corrompimento dos dados.

13º Agora é só dar play no dispositivo e ver a “mágica” acontecer.

Desligando o robô

Se deu tudo certo talvez você fique em dúvida: “como eu desligo o Lego corretamente sem correr o risco de corromper o sistema de arquivos?”

Para fazer isso aperte o botão de “Voltar” e várias opções vão aparecer. Uma delas é desligar “Power Off” o robô. Selecione essa opção e aguarde alguns segundos até o computador desligar.

Linguagens interpretadas e linguagens compiladas

Existe um número enorme de linguagens de programação. Mesmo levando em consideração somente as principais elas podem ser contadas em centenas: https://en.wikipedia.org/wiki/List_of_programming_languages. Portanto é natural que existam diversas maneiras de classificar as linguagens de programação.

Uma das classificações possíveis e que pode gerar dúvidas para iniciantes é quanto ao modo em que as linguagens são implementadas. Existem duas principais maneiras de implementar uma linguagem de programação: através de um compilador ou através de um interpretador.

Esse texto busca esclarecer esses conceitos e as diferenças entre eles. Dependendo qual foi a primeira linguagem que você aprendeu ou pretende aprender um dos dois pode parecer ser mais “natural” para você.

Programa compilado

Uma das linguagens de programação mais antigas, o Fortran, usava o caminho da compilação e pode-se dizer que durante muitos anos esse caminho foi o dominante no projeto de linguagens. Linguagens como C e C++ que por décadas dominaram o mercado usaram esse método.

Qual é a proposta da compilação?

A idéia é ter um programa, chamado de compilador, que irá ler um arquivo escrito em uma linguagem de alto nível (C, C++, Fortran, etc) e irá transformar esse resultado em código binário executável.

Esse código geralmente é um programa independente que pode ser executado mesmo que o compilador seja, por exemplo, desinstalado.

Veja, por exemplo, a imagem abaixo, na qual um programa (escrito na linguagem C) é compilado com o gcc (gcc é a sigla para Gnu C Compiler) e depois que o programa final é gerado (essa etapa da geração se chama compilação) podemos simplesmente executar o arquivo “programa” que foi gerado.

Nesse caso mesmo que o programa “gcc” fosse desinstalado, o programa final poderia ser executado sem problemas. Da mesma maneira poderíamos copiar o programa para outro computador e o mesmo também funcionaria (desde que o ambiente disponível para EXECUÇÃO estivesse disponível). Poderíamos até mesmo deletar o arquivo fonte original exemplo.c e o programa continuaria executando.

Ou seja: na implementação via compilador temos duas etapas bem separadas e relativamente independentes: a COMPILAÇÃO, na qual o programa é gerado, e a EXECUÇÃO do programa.

Essa separação tem algumas vantagens e algumas desvantagens.

Vantagens:

Como o programa gerado é um código binário pronto a etapa de execução tem uma performance maior. Não é preciso usar o processador do computador para decidir como o programa irá se comportar. Certo ou não (dependendo se o programa tem bugs), o seu comportamento já está definido. Esse aumento de performance é significativo e em muitos sistemas nos quais o desempenho é algo MUITO importante pode ser mais interessante usar linguagens compiladas. Por isso que quase todos os sistemas operacionais são gerados a partir do processo de compilação (na verdade existem alguns detalhes adicionais mas isso pode ser tema para outro texto).

O programa, uma vez gerado, não precisa do compilador instalado. Isso permite economia de disco pois em ambientes de produção não precisamos ter o compilador instalado. Em certas circunstâncias isso pode até melhorar a segurança geral de um sistema afinal nunca é recomendável deixar compiladores em sistemas que podem ser alvos de atacantes.

Desvantagens:

O processo de desenvolvimento acaba sendo um pouco mais tedioso pois o desenvolvedor precisa, enquanto está desenvolvendo e testando o sistema, realizar duas etapas: compilar e executar ao invés de uma. Claro que certas automatizações podem ser feitas mas isso leva a outro problema do método de compilação.

A demora na compilação: dependendo da complexidade e tamanho do programa a compilação pode levar vários minutos. Então o desenvolvedor manda o programa compilar e precisa aguardar, às vezes um tempo considerável, até o programa concluir a compilação. Para não mencionar que alguns programas podem consumir algum tempo e nem terminar de compilar, por algum erro de programação por exemplo.

Programa interpretado

Algumas das linguagens mais usadas atualmente são interpretadas: Python, Javascript, Ruby, PHP, etc.

Aqui o processo de desenvolvimento é diferente. Vejamos esse exemplo de um programa em Python.

Observe que aqui, ao invés de compilar o programa o executamos chamando “python3 programa.py”. O que está acontecendo aqui? python3 é um programa que chamamos de interpretador. Ao invés de transformar o arquivo fonte programa.py em um arquivo binário o interpretador lê o arquivo citado, uma linha por vez, e na medida do possível – se não houver erros – vai executando o arquivo.

Esse processo de leitura do arquivo-fonte e interpretação do mesmo é feito a cada execução do programa. Ou seja, o nosso programa python precisa do interpretador e do arquivo fonte em cada uma das suas execuções. Se deletássemos o arquivo programa.py, ao tentar executar novamente a linha “python3 programa.py” resultaria em um erro.

As vantagens e desvantagens são praticamente o inverso de um programa compilado.

Vantagens:

O desenvolvimento é um pouco mais rápido: não é preciso realizar duas etapas para ver o resultado do programa. Além disso o interpretador começa a executar mais rapidamente e assim que um erro é detectado a interpretação para. Em geral, erros simples acabam sendo detectados em menos tempo pois não é preciso esperar o término da compilação.

Desvantagens:

Como o programa é sempre lido e interpretado existe uma perda de performance devido ao retrabalho considerando múltiplas execuções. Além disso o próprio interpretador precisa de um tempo para executar e tomar decisões. Em programas compilados pode-se dizer que a maioria dessas decisões são tomadas na compilação tornando a execução mais rápida.

O interpretador precisa estar disponível senão o programa não funciona. Isso pode levar a um aumento do uso de disco rígido.

Caminhos intermediários

Claro que a divisão acima é essencialmente teórica. Existem inclusive propostas híbridas sendo a de maior destaque a linguagem Java. Em java existe a etapa da compilação porém o resultado da mesma não é um código binário diretamente executável mas sim um código simplificado chamado de bytecode. Esse código, por ser simplificado executa muito rapidamente mas ainda precisa de um tipo de interpretador, que no caso da linguagem Java é chamado de Java Virtual Machine (JVM) ou Máquina Virtual Java.

O Java foi implementado dessa maneira para ter um interpretador mais eficiente porém com a possibilidade de compartilhar código para diversos hardwares (a proposta inicial do Java era escrever um único código e executar o mesmo – através da jvm – em diversos hardwares diferentes, como por exemplo aparelhos celulares).

Hoje muitas linguagens adotam uma solução próxima da linguagem Java. Inclusive muitas linguagens foram adaptadas para gerar bytecode e portanto utilizar a eficiente jvm mesmo que o código-fonte seja criado em outras linguagens.

Uma solução intermediária ligeiramente diferente é rodar código interpretado durante o desenvolvimento e gerar uma espécie de bytecode (usar um compilador) somente no ambiente de produção com o código já plenamente desenvolvido e teoricamente testado.

Conclusão

De maneira geral podemos resumir que devido à melhoria do hardware a implementação via interpretador ganhou força ao longo do tempo. A estratégia da compilação ainda persiste mais utilizada em ambientes nas quais a performance precisa ser extraída ao máximo como, por exemplo sistemas operacionais e jogos. Em outros ambientes nos quais a velocidade de desenvolvimento e alteração dos sistemas tem uma importância maior acaba favorecendo linguagens interpretadas.

Dito isso é importante notar que na verdade nada impede que, na teoria, uma linguagem projetada para ser compilada seja executada através de um interpretador ou que uma linguagem originalmente interpretada não possa ser compilada. Mas, na prática, isso não é muito comum já que linguagens acabam sendo mais adotadas ou em um contexto de compilação, interpretação ou em uma mistura de ambos, caso da linguagem Java.

Palestra Tchelinux Live 2021 – Detecção de objetos com imagens usando Keras e Python

Link da palestra:

Alguns links de referência para quem assistiu a palestra

Apresentação no Tchelinux 2020

Artigos do prof. Ricardo:

https://ricardomatsumura.medium.com/material-de-apoio-para-aulas-de-intelig%C3%AAncia-artificial-e-aprendizado-ce43543e886d

Site do PinguimBots:

http://www.pinguimbots.com/


Artigo no qual baseamos a versão inicial do nosso código:

Código no GitHub

https://github.com/viniciusalveshax/object-detection-2021