Чтение и обработка строки с rs232 ардуино. Одинарные или двойные кавычки? Другие строковые функции

18 ноября 2015 в 14:39

По мотивам «Обрабатываем строки на Arduino»

  • Разработка под Arduino

Что требовалось? Вывод информации и обработка введённых пользователем строк. Например:

Ethernet controller - ok
STATIC mode
>time
2015-11-16 22:35:27

Собственно, надо сравнить стоки. Нет, сначала надо разбить текст на фрагменты разделителем (например пробел), но потом всё равно сравнить строки. Поскольку команд было «раз, два - и обчёлся», то разбивку текста на фрагменты убрал. Из-за указанной выше ошибки класс String использовать не получалось, то как можно по другому? Arduino использует библиотеку AVR-libc , то резонно в первую очередь обратиться к ней.
Что имеем?
  1. stdlib.h - функции взаимного преобразования чисел и строк (в обе стороны).
  2. string.h - функции работы со строками. Основной наш интерес.
  3. stdio.h - функции стандартного ввода-вывода.
Этим не ограничивается функционал. Упомянуто то, что связано с задачей.

№2 - используем функции memset для заполнения или очистки буфера, memcmp - для сравнения. strcmp не использую, так как нужно явно ограничивать длину сравниваемого фрагмента. №3 - для форматного чтения и вывода: sprintf , sprint_P , sscanf , sscanf_P . Функции с суффиксом _P отличаются тем, что строку форматирования берут из памяти программ PROGMEM, он же макрос F() в библиотеках Arduino.

Кстати

Кстати, если полноценно реализовать функции ввода-вывода отдельного символа getc и putc , то получите стандартные потоки ввода, вывода, ошибок и для работы с файлами, если таковые у вас есть. Часто можно обойтись, переопределив макросы putchar() и getchar() , работающие со стандартным вводом и выводом.


У меня сравнение строк выглядит так:

If (memcmp(str ,"statlist" ,8)==0) { // your code here }
Пожалуй, стоит оговориться, что сравниваются начала строк. Для поиска фрагментов можно использовать memmem .

строки для Си

строки для Си str , они же char * - это ссылка на начало последовательности char , последняя из которых имеет значение 0x00 . А значит, их надо где-то разместить. Например, в массиве. Или использовать malloc , calloc , free . Что не даёт делать ошибок подразумевает переложение ответственности на программиста за их размещение и контроль длинны .


То есть поиск команды может выглядеть так:

If (memcmp(str ,"statclear", 9)==0) { memset(journal, 0, sizeof(jrn_rec_t)*JRN_REC_NUM); Serial.println(F("ok")); }else if (memcmp(str ,"statlist" ,8)==0) { funcStatlist(); }else if (memcmp(str ,"cfgshow", 7)==0) { funcCfgShow(); }else if (memcmp(str ,"timeset", 7)==0) { funcTimeSet(str); // setup date and time YYYY-MM-DD hh:mm:ss }else if (memcmp(str ,"cfgset", 6)==0) { funcCfgSet(str); //funcPingdel(str); }else if (memcmp(str ,"time", 4)==0) { funcTime(); // print date and time from RTC }else if (memcmp(str ,"help", 4)==0) { // print short help Serial.println(F(" help\r\n statlist statclear\r\n time timeset\r\n cfgshow cfgset")); }else{ Serial.print(F("unknow cmd> ")); Serial.println(str); }

Неочевидный момент

Команды, они же строки, с большей длинной должны идти первыми в приведённом фрагменте. Задумайтесь, почему?


Строки «собираю» следующим образом: читаю байты с порта, пока не превышена допустимая длинна строки или пока не встречен один из символов перевода строки \r или \n.

чтение строки

Лучше доработать бы… Пока как есть. Вызывается всё время в основном кольце. Если нет работы - максимально быстро на выход, возвращаем false . Если набрали новую строку - true .

Bool readln(HardwareSerial &uart, char *outbuf) // return true when find CR, LF or both and if size limit { static char mybuf = { 0 }; static char idx = 0; while (uart.available()) { if (uart.peek()!= "\r" && uart.peek()!= "\n") { mybuf[ idx++ ] = uart.read(); } else {// если CR uart.read(); if (uart.peek()=="\n" || uart.peek()=="\r") uart.read(); if (idx == 0) { return 0; } mybuf[ idx++ ] = "\0"; // дописать 0 memcpy(outbuf, mybuf, idx); // скопировать idx = 0; return 1; } if (idx >=(SBUF_SZ-1)) { // проверяем на длину внутреннего буфера mybuf[ SBUF_SZ-1 ] = "\0"; // дописать 0 memcpy(outbuf, mybuf, 32); // скопировать idx = 0; return 1; } } return 0; }


Ещё очень полезен форматный ввод-вывод. Например, разбор строки с ведённой датой и временем выглядит так: sscanf_P(str, (const char *)F("%*s %d-%d-%d %d:%d:%d"), &y, &m, &d, &hh, &mm, &ss)
Получение строки для вывода IP:

Sprintf_P(buff, (const char *)F("Your IP: %d.%d.%d.%d"), ip, ip, ip, ip);
Подробней о строке формата можно почитать, например,

Текстовые строки могут быть объявлены двумя способами: можно использовать тип данных String, который входит в ядро, начиная с версии 0019; либо объявить строку как массив символов char с нулевым символом в конце. На этой странице описан второй способ. Для получения более подробной информации об объекте String, предоставляющем больше возможностей ценой большего расхода памяти, см. страницу String — объект .

Примеры

Ниже представлены примеры правильного объявления строк.

Char Str1; char Str2 = {"a", "r", "d", "u", "i", "n", "o"}; char Str3 = {"a", "r", "d", "u", "i", "n", "o", "\0"}; char Str4 = "arduino"; char Str5 = "arduino"; char Str6 = "arduino";

char Str1 [ 15 ] ;

char Str2 [ 8 ] = { "a" , "r" , "d" , "u" , "i" , "n" , "o" } ;

char Str3 [ 8 ] = { "a" , "r" , "d" , "u" , "i" , "n" , "o" , "\0" } ;

char Str4 = "arduino" ;

char Str5 [ 8 ] = "arduino" ;

char Str6 [ 15 ] = "arduino" ;

Допускаемые операции при объявлении строк

  • Объявить массив символов без его инициализации (Str1)
  • Объявить массив символов с одним избыточным элементом, компилятор сам добавит требуемый нулевой символ (Str2)
  • Добавить нулевой символ явно (Str3)
  • Инициализировать массив с помощью строковой константы, заключенной в кавычки; компилятор создаст массив необходимого размера с нулевым символом в конце (Str4)
  • Инициализировать массив с помощью строковой константы, явно указав его размер (Str5)
  • Инициализировать массив избыточного размера, оставив место для более длинных строк (Str6)

Нулевой завершающий символ

Как правило, все строки завершаются нулевым символом (ASCII код 0), который позволяет функциям (подобным Serial.print()) определять длину строки. Без этого символа они продолжали ли бы последовательно считывать байты памяти, которые фактически уже не являлись бы частью строки.

По сути, это означает, что длина вашей строки должна быть на 1 символ больше, чем текст, который вы хотели бы в ней хранить. Именно поэтому Str2 и Str5 должны быть длиной 8 символов, несмотря на то, что слово «arduino» занимает всего 7 — последняя позиция автоматически заполняется нулевым символом. Размер Str4 автоматически станет равным 8 — один символ требуется для завершающего нуля. В строке Str3 мы самостоятельно указали нулевой символ (обозначается ‘\0’).

Следует иметь в виду, что в целом можно объявить строку и без завершающего нулевого символа (например, если задать длину Str2 равной 7, а не 8). Однако это приведет к неработоспособности большинства строковых функций, поэтому не следует намеренно так делать. Такая ошибка может быть причиной странного поведения или появления сторонних символов при работе со строками.

Одинарные или двойные кавычки?

Строки всегда объявляются в двойных кавычках («Abc»), а символы всегда объявляются в одинарных кавычках (‘A’).

Перенос длинных строк

Длинные строки можно переносить так:

char myString = "This is the first line" " this is the second line" " etcetera";

char myString = "This is the first line"

" this is the second line"

" etcetera" ;

Массивы строк

При работе с большими объемами текста (например, в проектах, работающих с LCD-экраном) часто удобно использовать массивы строк. Поскольку строки сами по себе являются массивами, то фактически, это — пример двумерного массива.

В нижеследующей программе звездочка после указания типа данных char «char*» показывает, что переменная является массивом «указателей». Все имена массивов фактически являются указателями, поэтому звездочка необходима для создания массива массивов. Указатели в C — одна из наиболее сложных вещей для начинающих, но в данном случае глубокого понимания указателей для их эффективного использования вовсе не требуется.

Пример

char* myStrings={"This is string 1", "This is string 2", "This is string 3", "This is string 4", "This is string 5","This is string 6"}; void setup(){ Serial.begin(9600); } void loop(){ for (int i = 0; i < 6; i++){ Serial.println(myStrings[i]); delay(500); } }

char * myStrings = { "This is string 1" , "This is string 2" , "This is string 3" ,

Я пришел к программированию в целом, и программированию Arduino в частности, полным нулем, около двух месяцев назад. Сейчас же, по ходу своей текущей деятельности я ощутил необходимость в освоении обработки строк на ардуино. Обычный поход в Google за информацией не обрадовал статьей, где все просто и понятно для чайников написано. И поэтому я здесь для того, чтобы рассказать о том, каким образом был реализован парсинг строк из последовательного порта и какие были встречены на пути подводные камни. Интересующихся прошу под кат.

Итак. Вот примерный алгоритм, которому я следовал:

  1. Идем на arduino.ru и высматриваем в колонке типов все, связанное с символами.
  2. Решаем, какую форму представления будем использовать (Я остановился на классе String, т.к. имел неприятный опыт с месивом массивом).
  3. Судорожно пытаемся написать свою функцию с преферансом и профурсетками
  4. Ищем класса.
  5. Ищем нужные операторы.
  6. Пишем!
А алгоритм работы основного тела программы прост:
  1. Циклично проверяем, есть ли в буфере com порта доступный для чтения байт, если есть, читаем.
  2. Если принятый байт - символ переноса строки ("\n"), то вызываем самописную функцию парсинга, если же нет, то добавляем принятый байт в созданную переменную типа String.
  3. Парсим, наконец, строку.

    На самом деле, т.к. практическое использование парсинга строк у меня не горит, то данная функция носит всего лишь демонстративный характер, сравнивая полученную строку с уже записанной в памяти константной строкой. Итак, используя оператор equals сравниваем принятую строку с записанной, и, если оператор возвращает true, выходим из функции обработчика, если же нет, сравниваем со следующей. Если строки эквивалентны, то опять же, выходим из функции-обработчика, возвращая результат. Ну а уж если и это условие не сработает, то все равно выйдем из функции и скажем, что что строка не верна.

  4. В зависимости от принятого результата с помощью switch case выбираем нужный.
  5. Обнуляем принятую строку, чтобы потом начать собирать ее заново.

А вот, наконец-таки, код:

#define led 13 String input_string = ""; const String Led_off = "switch led off"; const String Led_on = "switch led on"; bool led_running; void setup() { Serial.begin(9600); } void loop() { while (Serial.available() > 0) { char c = Serial.read(); if (c == "\n") { Serial.print("Input_string is: "); Serial.println(input_string); switch (parse(input_string, Led_off, Led_on)) { case 10: led_running=false; Serial.println("Switching off is done"); break; case 11: led_running=true; Serial.println("Switching on is done"); break; case 0: Serial.println("invalid String"); break; } input_string = ""; digitalWrite(led, led_running); } else { input_string += c; } } } byte parse(String input_string, const String Led_off, const String Led_on) { if (input_string.equals(Led_off) == true) { return 10; } else if (input_string.equals(Led_on) == true) { return 11; } else return 0; }


Так, я не понял, что за дела? Почему не загорается светодиод? Ах да, как же это я запамятовал, в void setup нужно добавить:

PinMode(led, OUTPUT);

P.S.: Немаловажно установить монитор com порта в Arduino IDE в режим «Новая строка», т.к. в любом другом посылаемая строка не будет сопровождаться символом ее окончания "\n".

P.P.S.: В холиваре по поводу того, что ардуино нинужна - участвовать не собираюсь, изучая основы программирования и алгоритмизации я ничего дурного не сделал.

P.P.P.S.: Если статья будет принята адекватно, напишу следующую о том, что у меня вышло с улучшением функционала функции парсинга. Ну, с богом! .

Доброе время суток! Продолжаем освоение платы ардиуно уно. В прошлой статье мы научились выводить информационные сообщения на экран компьютера/ноутбука.

Если вы помните, у нас с вами осталось незавершённое дело. А именно способ задание входных параметров функций Serial. print () и Serial. println () . Мы задавали параметры этих функций непосредственно в строках, где они вызывались, вместо того, чтобы задавать параметры, через переменные.

Для начала снова соберём схему с двумя светодиодами. После чего открываем программу, что мы написали в 5 уроке.

Как вы можете видеть, я дополнил второй необходимыми строками. Надеюсь, вы также выполнили это задание 🙂 Если же нет, тогда дополните вашу программу.

Не стоит копировать строки кода из текста статьи. Например, кавычки в вердовском документе могут не восприниматься за «кавычки» в программной среде Arduino IDE. Еще хочу сказать следующее – если с первой попытки загрузить программу в МК не удалось, стоит повторить попытку (несколько раз).

В одной из предыдущих статей я уже затрагивал вопросы касающееся использования . Повторюсь. Намного практичнее вносить изменения в необходимые параметры через изменения значений переменных, что находятся вначале программы или в отдельном файле, чем рыскать в поисках нужных значений по всему коду.

До сегодняшнего момента, мы использовали переменные, что имели тип целого числа. Такими числами удобно вести подсчёт или указывать номер вывода микроконтроллера. Кроме того, данный тип занимает гораздо меньший объём памяти микроконтроллера в сравнении с другими типами. Однако при считывании данных с датчиков (например, датчик температуры) мы будем получать значения, которые состоят из целой и дробной части. Для того, чтобы работать с такими числами нам потребуется тип float (числа с плавающей точкой). Данный тип будет описан отдельно, сейчас же поговорим о строковом типе данных String .

Переменным типа String присваиваются данные заключенные в двойные кавычки.

Объявим переменные типа String .

  • String greenLedText = “”;
  • String redLedText = “”;

В коде программы заменим текстовые сообщения на имена переменных. Как вы можете видеть, при записи переменных в качестве входных параметров функций двойные кавычки не нужны. Но что же будет, если мы запишем имя одной из переменных в двойных кавычках? А вот сейчас мы и проверим…

Загрузим программу и посмотрим на результат. Одна строка отображается корректно, а вторая вместо того, чтобы выводить на экран необходимую информацию выводит имя переменной. Всему виной двойные кавычки.

Правило следующее: хотите вывести строку непосредственно с круглых скобок ставьте двойные кавычки, нужно вывести информацию, что присвоена строковой переменной – кавычки не ставим.

Создадим локальную переменную «приветствие» в void setup . Почему именно локальную? Во-первых, она занимает значительно меньше места в памяти микроконтроллера. Во-вторых, что мы зря что-ли обсуждали вопросы локальных и глобальных переменных, нужно теорию применять на практике. А почему создаём «локалку» именно в void setup , а всё потому, что он выполняется всего один раз.

Объявляем и присваиваем значение переменной.

String first_ message = “ Hello”;

Одного «hello» будет мало, нужно еще что-то. Давайте напишем что-то вроде… 🙂 и разобьём это на два сообщения.

  • String second_message = “I am Migalka”;
  • String third_message = “I want blinky”;

Вызов функций следует выполнять после строки включения (инициализации) последовательного порта.

  • Serial.println (first_message);
  • Serial.println (second_message);


Загрузим программу и посмотрим на результат. Как и планировалось, приветствие выводится один раз. Но как-то не красиво согласны? 🙂 Для того, чтобы второе и третье сообщение были на одной строке есть несколько вариантов:

  • Заменить функцию println (second_message) на Serial.print (second_message) . Для того, чтобы третье сообщение не наплывало на второе после … «Migalka » поставьте пробел.
  • Соединить вместе второе и третье сообщение. sum_ message = second_ message + third_ message;

Выбираем второй вариант. Предварительно объявим новую строковую переменную String sum_ message;

Заменяем имя « second_ message » на « sum_ message ». Если вы заменяли функцию Serial. println (second_ message) на Serial. print ( second_message) , верните все назад, чтобы новое сообщение начиналось с новой строки, а строчку «Serial.println (third_message); » удаляем по причине ненадобности.

Загрузим программу и смотрим на результат.

Что требовалось? Вывод информации и обработка введённых пользователем строк. Например:

Ethernet controller - ok
STATIC mode
>time
2015-11-16 22:35:27

Собственно, надо сравнить стоки. Нет, сначала надо разбить текст на фрагменты разделителем (например пробел), но потом всё равно сравнить строки. Поскольку команд было «раз, два - и обчёлся», то разбивку текста на фрагменты убрал. Из-за указанной выше ошибки класс String использовать не получалось, то как можно по другому? Arduino использует библиотеку AVR-libc , то резонно в первую очередь обратиться к ней.
Что имеем?

  1. stdlib.h - функции взаимного преобразования чисел и строк (в обе стороны).
  2. string.h - функции работы со строками. Основной наш интерес.
  3. stdio.h - функции стандартного ввода-вывода.

Этим не ограничивается функционал. Упомянуто то, что связано с задачей.

№2 - используем функции memset для заполнения или очистки буфера, memcmp - для сравнения. strcmp не использую, так как нужно явно ограничивать длину сравниваемого фрагмента. №3 - для форматного чтения и вывода: sprintf , sprint_P , sscanf , sscanf_P . Функции с суффиксом _P отличаются тем, что строку форматирования берут из памяти программ PROGMEM, он же макрос F() в библиотеках Arduino.

Кстати

Кстати, если полноценно реализовать функции ввода-вывода отдельного символа getc и putc , то получите стандартные потоки ввода, вывода, ошибок и для работы с файлами, если таковые у вас есть. Часто можно обойтись, переопределив макросы putchar() и getchar() , работающие со стандартным вводом и выводом.

У меня сравнение строк выглядит так:

If (memcmp(str ,"statlist" ,8)==0) { // your code here }

Пожалуй, стоит оговориться, что сравниваются начала строк. Для поиска фрагментов можно использовать memmem .

строки для Си

строки для Си str , они же char * - это ссылка на начало последовательности char , последняя из которых имеет значение 0x00 . А значит, их надо где-то разместить. Например, в массиве. Или использовать malloc , calloc , free . Что не даёт делать ошибок подразумевает переложение ответственности на программиста за их размещение и контроль длинны .

То есть поиск команды может выглядеть так:

If (memcmp(str ,"statclear", 9)==0) { memset(journal, 0, sizeof(jrn_rec_t)*JRN_REC_NUM); Serial.println(F("ok")); }else if (memcmp(str ,"statlist" ,8)==0) { funcStatlist(); }else if (memcmp(str ,"cfgshow", 7)==0) { funcCfgShow(); }else if (memcmp(str ,"timeset", 7)==0) { funcTimeSet(str); // setup date and time YYYY-MM-DD hh:mm:ss }else if (memcmp(str ,"cfgset", 6)==0) { funcCfgSet(str); //funcPingdel(str); }else if (memcmp(str ,"time", 4)==0) { funcTime(); // print date and time from RTC }else if (memcmp(str ,"help", 4)==0) { // print short help Serial.println(F(" helprn statlist statclearrn time timesetrn cfgshow cfgset")); }else{ Serial.print(F("unknow cmd> ")); Serial.println(str); }

Неочевидный момент

Команды, они же строки, с большей длинной должны идти первыми в приведённом фрагменте. Задумайтесь, почему?

Строки «собираю» следующим образом: читаю байты с порта, пока не превышена допустимая длинна строки или пока не встречен один из символов перевода строки r или n.

чтение строки

Лучше доработать бы… Пока как есть. Вызывается всё время в основном кольце. Если нет работы - максимально быстро на выход, возвращаем false . Если набрали новую строку - true . bool readln(HardwareSerial &uart, char *outbuf) // return true when find CR, LF or both and if size limit { static char mybuf = { 0 }; static char idx = 0; while (uart.available()) { if (uart.peek()!= "r" && uart.peek()!= "n") { mybuf[ idx++ ] = uart.read(); } else {// если CR uart.read(); if (uart.peek()=="n" || uart.peek()=="r") uart.read(); if (idx == 0) { return 0; } mybuf[ idx++ ] = ""; // дописать 0 memcpy(outbuf, mybuf, idx); // скопировать idx = 0; return 1; } if (idx >=(SBUF_SZ-1)) { // проверяем на длину внутреннего буфера mybuf[ SBUF_SZ-1 ] = ""; // дописать 0 memcpy(outbuf, mybuf, 32); // скопировать idx = 0; return 1; } } return 0; }

Ещё очень полезен форматный ввод-вывод. Например, разбор строки с ведённой датой и временем выглядит так:

Sscanf_P(str, (const char *)F("%*s %d-%d-%d %d:%d:%d"), &y, &m, &d, &hh, &mm, &ss)

Получение строки для вывода IP:

Sprintf_P(buff, (const char *)F("Your IP: %d.%d.%d.%d"), ip, ip, ip, ip);

Вот собственно и всё. Надеюсь, кому-то данный материал поможет «отвязаться» от Arduino или просто лучше и за меньшее время писать свои программы. Но более типичная ситуация - обойти ограничения Wiring .



Есть вопросы?

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: