赞
踩
https://gitee.com/lin_zixiang/school_name
因为在开发一个项目中需要中国大学数据表,在网上搜下,只有csdn有个付费资源,本着白嫖不到原则,只能自己整理个。
public void getData(){ String filePath = "C:\\Users\\RunDream\\Desktop\\school.txt"; // 文件路径 String regex = "<td>(.*?)</td>"; // 匹配<td>和</td>之间的任意字符,非贪婪匹配 try (BufferedReader br = new BufferedReader(new FileReader(filePath))) { String line; StringBuilder sb = new StringBuilder(); while ((line = br.readLine()) != null) { sb.append(line); } String data = sb.toString(); Pattern pattern = Pattern.compile(regex); Matcher matcher = pattern.matcher(data); ArrayList<String> list = new ArrayList<>(); /** * matcher.find(): find查找是否匹配,如果匹配到了,则返回true,matcher.group(1)会返回第一个匹配字符串。 * 如果有多个匹配项 则find会在每个匹配项上迭代,每次迭代matcher就会更新。要迭代所有匹配项就进行循环。 */ while (matcher.find()) { String university = matcher.group(1); if ((university.contains("大学")||university.contains("学院"))&&!university.contains("html")) { // 判断是否包含“大学”二字 list.add(university); } } /** * 插入数据 */ insertAll(list); } catch (IOException e) { e.printStackTrace(); } }
存入数据库表
创建一个springboot项目整合mybatis,把分割的数据用ArrayList存储,然后进行插入即可。
另外一种选择不用创建springboot项目,直接把数据整理成sql增加多条数据的格式。用sql语句插入数据库表。
如果有更好的方法希望可以不吝赐教。如果觉得有帮助希望可以点个赞。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。