当前位置:   article > 正文

轻松玩转树莓派Pico之七、让Pico跑个分_树莓派移植coremark跑分

树莓派移植coremark跑分

1、CoreMark介绍

CoreMark是一个综合基准,用于测量嵌入式系统中使用的中央处理器(CPU)的性能。代码用C编写,包含以下算法:列表处理(增删改查和排序)、矩阵操作(公共矩阵操作)、状态机(确定输入流是否包含有效数字)和CRC(Cyclic redundancy check 循环冗余校验) 。目前 CoreMark已迅速成为测量与比较处理器性能的业界基准测试。

为了确保编译器在编译时不会预先计算结果,程序的每次计算均会即时得到一项数据,而此数据不会再编译时被得到。另外,在计时中,所有的代码均为基准自身的代码,而不是调用库中的代码。

测试标准是在配置参数的组合下单位时间内运行的CoreMark程序次数(单位:CoreMark/MHz),该数字值越大则说明测试的性能越好。

eembc官网https://www.eembc.org/coremark/scores.php

有各种CPU进行CoreMark测试后的数据可以查阅比对。不同编译器及编译器优化等级对应的coremark得分都不一样。

CoreMark官网:Embedded Microprocessor Benchmark Consortium

源码下载地址:GitHub - eembc/coremark: CoreMark® is an industry-standard benchmark that measures the performance of central processing units (CPU) and embedded microcrontrollers (MCU).

2、CoreMark适配

使用前文《pico-project-generator使用》生成的项目,将CoreMark代码下载至项目文件夹下。下载完成后,可以看到以下源文件在根目录下,其他文件夹都是针对不同平台的适配文件。

  • core_list_join.c

  • core_main.c

  • core_matrix.c

  • core_state.c

  • core_util.c

  • coremark.h

  • barebones目录:裸机环境下需要修改的适配文件

  • posix目录:cygwin、linux、freebsd、macos、rtems等操作系统都采用这个适配文件

  • simple目录:基本移植需要修改的适配文件

posix目录是为支持posix平台实现,如Linux。这次coremark基于FreeRTOS操作系统下进行,使用posix下的文件进行修改工作量较少。同时posix适配可通过修改MULTITHREAD宏进行多核并行运行。RP2040芯片是双核Cortex-M0+芯片,但本次只使用单核测试,也为后续做双核coremark测试做准备。

适配文件主要是修改posix目录下的core_portme.c和core_portme.h。

2.1、添加FreeRTOS相关文件

参照前文《FreeRTOS体验》一文,添加FreeRTOS相关文件,并可正常运行。

2.2、添加coremark相关文件

主要涉及CMakeLists.txt的add_executable加入coremark对应的c文件,target_include_directories加入对应.h路径。

  1. add_executable(pico_coremark pico_coremark.c
  2. FreeRTOS-Kernel/event_groups.c
  3. FreeRTOS-Kernel/list.c
  4. FreeRTOS-Kernel/queue.c
  5. FreeRTOS-Kernel/tasks.c
  6. FreeRTOS-Kernel/timers.c
  7. FreeRTOS-Kernel/portable/GCC/ARM_CM0/port.c
  8. FreeRTOS-Kernel/portable/MemMang/heap_4.c
  9. coremark/core_list_join.c
  10. coremark/core_main.c
  11. coremark/core_matrix.c
  12. coremark/core_state.c
  13. coremark/core_util.c
  14. coremark/posix/core_portme.c
  15. )

  1. target_include_directories(pico_coremark PRIVATE
  2. ${CMAKE_CURRENT_LIST_DIR}
  3. ${CMAKE_CURRENT_LIST_DIR}/.. # for our common lwipopts or any other standard includes, if required
  4. ${CMAKE_CURRENT_LIST_DIR}/FreeRTOS-Kernel/include
  5. ${CMAKE_CURRENT_LIST_DIR}/FreeRTOS-Kernel/portable/GCC/ARM_CM0
  6. ${CMAKE_CURRENT_LIST_DIR}/coremark
  7. ${CMAKE_CURRENT_LIST_DIR}/coremark/posix
  8. )

2.3、修改core_portme.h

在core_portme.h头文件中加入:

  • #define USE_CLOCK 1

  • #define MAIN_HAS_NOARGC 1

  • #define SEED_METHOD SEED_VOLATILE

  • #define ITERATIONS 10000,由于CoreMark必须要运行超过10s,如果coremark在运行过程中提示出错,须将此参数改大。

  • 设定memory模式:我选择的是使用FreeRTOS的堆,添加#define MEM_METHOD MEM_MALLOC

  • 指定编译参数:#define FLAGS_STR"-O3",根据当前编译优化参数写入

  • 指定存储相关参数:#define MEM_LOCATION "code in flash, data on heap"

  • 我们在适配中要使用到FreeRTOS相关接口,加入相关头文件

  1. #include "FreeRTOS.h"
  2. #include "task.h"
  • 其他参数使用默认设置

2.4、修改core_portme.c

  • 修改MEM_METHOD == MEM_MALLOC下对应malloc、free函数实现。

修改portable_malloc函数内malloc为pvPortMalloc

修改portable_free函数内malloc为pvPortFree

  1. /* Function: portable_malloc
  2. Provide malloc() functionality in a platform specific way.
  3. */
  4. void *
  5. portable_malloc(size_t size)
  6. {
  7. return pvPortMalloc(size);
  8. }
  9. /* Function: portable_free
  10. Provide free() functionality in a platform specific way.
  11. */
  12. void
  13. portable_free(void *p)
  14. {
  15. vPortFree(p);
  16. }
  • 修改USE_CLOCK使能后计时相关接口为FreeRTOS提供的函数

  1. #define NSECS_PER_SEC configTICK_RATE_HZ
  2. #define CORETIMETYPE TickType_t
  3. #define GETMYTIME(_t) (*_t = xTaskGetTickCount())

3、跑分

3.1、修改core_mian.c

由于pico默认有main函数,进入main函数进行硬件初始化,FreeRTOS任务创建等工作。core_main.c中也定义了main函数,重定义了,修改core_main.c中的main为coremark_main,并通过创建的task,在task中调用coremark_main,以免main函数栈空间不够运行失败。

代码如下:

  1. #include <stdio.h>
  2. #include "pico/stdlib.h"
  3. #include "FreeRTOS.h"
  4. #include "task.h"
  5. // UART defines
  6. // By default the stdout UART is `uart0`, so we will use the second one
  7. #define UART_ID uart1
  8. #define BAUD_RATE 9600
  9. // Use pins 4 and 5 for UART1
  10. // Pins can be changed, see the GPIO function select table in the datasheet for information on GPIO assignments
  11. #define UART_TX_PIN 4
  12. #define UART_RX_PIN 5
  13. // GPIO defines
  14. // Example uses GPIO 2
  15. #define GPIO 2
  16. void vTaskCode( void * pvParameters )
  17. {
  18. /* The parameter value is expected to be 1 as 1 is passed in the
  19. pvParameters value in the call to xTaskCreate() below.
  20. configASSERT( ( ( uint32_t ) pvParameters ) == 1 );
  21. */
  22. extern void coremark_main();
  23. coremark_main();
  24. const uint LED_PIN = PICO_DEFAULT_LED_PIN;
  25. gpio_init(LED_PIN);
  26. gpio_set_dir(LED_PIN, GPIO_OUT);
  27. for( ;; )
  28. {
  29. vTaskDelay(500);
  30. gpio_put(LED_PIN, 1);
  31. vTaskDelay(500);
  32. gpio_put(LED_PIN, 0);
  33. }
  34. }
  35. int main()
  36. {
  37. stdio_init_all();
  38. BaseType_t xReturned;
  39. TaskHandle_t xHandle = NULL;
  40. /* Create the task, storing the handle. */
  41. xReturned = xTaskCreate(
  42. vTaskCode, /* Function that implements the task. */
  43. "Blinky task", /* Text name for the task. */
  44. 512, /* Stack size in words, not bytes. */
  45. ( void * ) 1, /* Parameter passed into the task. */
  46. tskIDLE_PRIORITY,/* Priority at which the task is created. */
  47. &xHandle );
  48. vTaskStartScheduler();
  49. return 0;
  50. }

3.2、测速跑分

Pico默认工作频率为133MHz,代码通过QSPI运行在外部Flash上。

  • Debug编译模式下:

  1. 2K performance run parameters for coremark.
  2. CoreMark Size : 666
  3. Total ticks : 63178
  4. Total time (secs): 63.178000
  5. Iterations/Sec : 158.282947
  6. Iterations : 10000
  7. Compiler version : GCC10.2.1 20201103 (release)
  8. Compiler flags : -O0
  9. Memory location : code in flash, data on heap
  10. seedcrc : 0xe9f5
  11. [0]crclist : 0xe714
  12. [0]crcmatrix : 0x1fd7
  13. [0]crcstate : 0x8e3a
  14. [0]crcfinal : 0x988c
  15. Correct operation validated. See README.md for run and reporting rules.
  16. CoreMark 1.0 : 158.282947 / GCC10.2.1 20201103 (release) -O0 / code in flash, data on heap

  • Release编译模式下:

  1. 2K performance run parameters for coremark.
  2. CoreMark Size : 666
  3. Total ticks : 42558
  4. Total time (secs): 42.558000
  5. Iterations/Sec : 234.973448
  6. Iterations : 10000
  7. Compiler version : GCC10.2.1 20201103 (release)
  8. Compiler flags : -O3
  9. Memory location : code in flash, data on heap
  10. seedcrc : 0xe9f5
  11. [0]crclist : 0xe714
  12. [0]crcmatrix : 0x1fd7
  13. [0]crcstate : 0x8e3a
  14. [0]crcfinal : 0x988c
  15. Correct operation validated. See README.md for run and reporting rules.
  16. CoreMark 1.0 : 234.973448 / GCC10.2.1 20201103 (release) -O3 / code in flash, data on heap

3.3、跑分结果

Debug模式下 coremark为1.18CoreMark/MHz,Release模式下1.75CoreMark/MHz,Debug和Release编译模式运行速度有一定的差距。

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/凡人多烦事01/article/detail/468092
推荐阅读
相关标签
  

闽ICP备14008679号