As expressões regulares permitem que você pesquise padrões específicos em uma string de texto e podem ser um aliado poderoso em sua jornada de análise de dados.
Algumas vezes, quando estamos analisando dados que precisamos extrair padrões específicos de uma string. Por exemplo, considere a seguinte lista de notas descritivas:
- A+ (98%)
- A (89%)
- A (87%)
- B (75%)
- C+ (68%)
- D- (51%)
Queremos criar um gráfico que conte os números das notas que foram atribuídas. Mas se tentarmos agrupar na lista de notas, obteremos duas contagens para "A" por causa das diferentes porcentagens anexadas à nota descritiva.
A solução para isso é usar uma expressão regular.
Entendendo expressões regulares
Uma expressão regular é uma sequencia de caracteres que especificam um padrão de pesquisa. Existe uma sintaxe específica para construir uma expressão regular. Albitros usa JavaScript - compatível com sintaxe de expressão regular.
Se expressões regulares é um termo novo para você, Regexr é uma ferramenta muito interessante para te ajudar a entender como construi-las.
Atenção!
Se sua expressão regular contém alguma barra invertida \,você precisará escapar delas adicionando outra barra invertida na frente.
([A-E|U](G|\+|-)?) --ficará assim--> ([A-E|U](G|\\+|-)?) |
Criando campo customizado com expressão regular
Assumindo que você tenha criado uma pergunta com os dados que você quer trabalhar, no editor de Query:
1. Clique no botão Cutomizar Coluna. A barra de fórmula deve aparecer:
2. No campo fórmula, selecione a função regexextract:
3. Na variável de texto da função, insira o campo com o qual deseja trabalhar e coloque a expressão regular na posição da variável regular_expression (entre aspas duplas e garantindo que você escape de barras invertidas como mencionado anteriormente):
4. Insira o nome para sua coluna customizada, e clique em Feito.
Sua coluna de expressão regular personalizada agora deve estar visível nos resultados da pergunta: