笔触狂放9

这个屌丝很懒，什么也没留下！

热门标签

开源SPL,WebService Restful广泛应用于程序间通讯，如微服务、数据交换、公共或私有的数据服务等。

作者：笔触狂放9 | 2024-05-02 05:20:12

踩

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新大数据全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip204888 （备注大数据）

正文

比如，从文件读取多层XML串，解析为序表：


	A
1	=file(“d:\xml\emp_orders.xml”).read()
2	=xml(A1,“xml/row”)

点击A2格可以看到多层序表的结构，其中，EId、State等字段存储简单数据类型，Orders字段存储记录集合（二维表）。点击Orders中的某一行，可以展开观察数据：

1png

序表也可以表达来自文件的多层Json（与上面的XML同构）：


	A
1	=file(“d:\xml\emp_orders.json”).read()
2	=json(A1)

点击A2格可以看到，来自Json的序表与来自XML的序表一样。事实上，SPL序表可以统一地表达不同来源的多层数据，无论XML还是Json，无论WebService还是Restful，这是其他技术难以做到的。

SPL提供了方便的多层数据访问方法，可以通过点号访问不同的层级，通过下标访问不同的位置。

第1层的单个字段的集合：A2.(Client)

第1层的多个字段的集合：A2.([Client,Name])

第2层所有记录的集合：A2.conj(Orders)

第1层第10条记录：A2(10)

第1层第10条记录的Orders字段（即所有下层记录）：A2(10).Orders

第1层第10条件记录Orders字段的单个字段的集合：(A2(10).Orders).(Amount)

第1层第10条件记录Orders字段的第5条记录：(A2(10).Orders)(5)

第1层的第10-20条记录：A2(to(10,20))

第1层的最后三条记录：A2.m([-1,-2,-3])

SPL序表专业性强，可以表达复杂的层次关系。比如，针对多含多个子文档的多层Json：

[
   {
      "race": {
          "raceId":"1.33.1141109.2",
          "meetingId":"1.33.1141109"
      },
      ...
      "numberOfRunners": 2,
      "runners": [
        {     "horseId":"1.00387464",
              "trainer": {
                  "trainerId":"1.00034060"
              },
          "ownerColours":"Maroon,pink,dark blue."
          },
          {   "horseId":"1.00373620",
              "trainer": {
                  "trainerId":"1.00010997"
              },
          "ownerColours":"Black,Maroon,green,pink."
          }
      ]
   },
...
]

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

进行不同层级的分组汇总（对trainerId分组，统计每组中 ownerColours的成员个数），一般的技术难以写出代码，SPL就简单多了：


	A
1	…
2	=A1(1).runners
3	=A2.groups(trainer.trainerId; ownerColours.array().count():times)

强大计算能力

以序表为基础，SPL内置丰富的计算函数、日期函数、字符串函数，提供了强大的计算能力。依靠函数选项、层次参数等高级语法，SPL提供了超越SQL的计算能力。

SPL内置丰富的计算函数，基础计算一句完成。比如，对多层数据进行条件查询:


	A
2	…//省略取数解析
3	=A2.conj(Orders)
4	=A3.select(Amount>1000 && Amount<=2000 && like@c(Client,“business”))

可以看到，SPL对条件查询的支持很完整，包括关系运算符、逻辑运算符、正则表达式和字符串函数，如模糊匹配like。此外，SPL还支持在条件查询中使用数学运算符（函数）、位置函数、日期函数。

更多例子：


	A	B
2	…
3	= A3.sum(Salary)	聚合
4	=A2.groups(State,Gender;avg(Salary),count(1))	第1层分组汇总
5	=A2.conj(Orders).groups(Client;sum(Amount))	第2层分组汇总
6	=A1.new(Name,Gender,Dept,Orders.OrderID,Orders.Client,Orders.Client,Orders.SellerId,Orders.Amount,Orders.OrderDate)	关联
7	=A1.sort(Salary)	排序
8	=A1.id(State)	去重
9	=A2.top(-3;Amount)	topN
10	=A2.groups(Client;top(3,Amount))	组内TopN（窗口函数）

SPL内置大量日期函数和字符串函数，在数量和功能上远远超过其他技术甚至SQL，同样的运算代码量更短。比如：

时间类函数，日期增减：elapse(“2020-02-27”,5) //返回2020-03-03

星期几：day@w(“2020-02-27”) //返回5，即星期6

N个工作日之后的日期：workday(date(“2022-01-01”),25) //返回2022-02-04

字符串类函数，判断是否全为数字：isdigit(“12345”) //返回true

取子串前面的字符串：substr@l(“abCDcdef”,“cd”) //返回abCD

按竖线拆成字符串数组：“aa|bb|cc”.split(“|”) //返回[“aa”,“bb”,“cc”]

SPL还支持年份增减、求年中第几天、求季度、按正则表达式拆分字符串、拆出SQL的where或select部分、拆出单词、按标记拆HTML等功能。

SPL提供了函数选项、层次参数等方便的函数语法，可以提供更强的计算能力。功能相似的函数可以共用一个函数名，只用函数选项区分差别。比如select函数的基本功能是过滤，如果只过滤出符合条件的第1条记录，可使用选项@1：

Orders.select@1(Amount>1000)

数据量较大时，用并行计算提高性能，可使用选项@m：

Orders.select@m(Amount>1000)

对排序过的数据，用二分法进行快速过滤，可用@b：

Orders.select@b(Amount>1000)

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip204888 （备注大数据）

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

，不再深入研究，那么很难做到真正的技术提升。**

需要这份系统化的资料的朋友，可以添加V获取：vip204888 （备注大数据）
[外链图片转存中…(img-LtxAq1Xr-1713401436185)]

声明：本文内容由网友自发贡献，不代表【wpsshop博客】立场，版权归原作者所有，本站不承担相应法律责任。如您发现有侵权的内容，请联系我们。转载请注明出处：https://www.wpsshop.cn/w/笔触狂放9/article/detail/522386