当前位置:   article > 正文

[python]解析通达信盘后数据获取历史日线数据_lc1文件怎么打开

lc1文件怎么打开

平时我们在做 离线的模型 回溯测试时候,需要历史的k线数据。

可是通达信 的日线数据如下:
日线数据在通达信的安装目录: vipdoc\sh\lday  下面

本地的通达信 是没有开放api和外部的  自己的交易回溯测试 工具或框架 进行交互的。

虽然 我们也可以  通过 sina 的api ,或者 yahoo,或者 juhe聚合数据,或者 wind 或者 tushare (http://tushare.org/index.html),或者 通联金融大数据  等 网络的api接口 获取  股票的 历史K线数据,  但是网络的开销总是会比较耗时一些。

其实可以通过 python来 解析 通达信  的这些 day 文件的数据,变成 我们熟悉的csv格式的数据。

  1. #!/usr/bin/python  
  2. def exactStock(fileName, code):
  3.     ofile = open(fileName,'rb')
  4.     buf=ofile.read()
  5.     ofile.close()
  6.     num=len(buf)
  7.     no=num/32
  8.     b=0
  9.     e=32
  10.     items = list() 
  11.     for i in range(int(no)):
  12.         a=unpack('IIIIIfII',buf[b:e])
  13.         year = int(a[0]/10000);
  14.         m = int((a[0]%10000)/100);
  15.         month = str(m);
  16.         if m <10 :
  17.             month = "0" + month;
  18.         d = (a[0]%10000)%100;
  19.         day=str(d);
  20.         if d< 10 :
  21.             day = "0" + str(d);
  22.         dd = str(year)+"-"+month+"-"+day
  23.         openPrice = a[1]/100.0
  24.         high = a[2]/100.0
  25.         low =  a[3]/100.0
  26.         close = a[4]/100.0
  27.         amount = a[5]
  28.         vol = a[6]
  29.         unused = a[7]
  30.         if i == 0 :
  31.             preClose = close
  32.         ratio = round((close - preClose)/preClose*100, 2)
  33.         preClose = close
  34.         item=[code, dd, str(openPrice), str(high), str(low), str(close), str(ratio), str(amount), str(vol)]
  35.         items.append(item)
  36.         b=b+32
  37.         e=e+32
  38.         
  39.     return items
  40.  
  41. exactStock('E:\\new_tdx\\vipdoc\\sh\\lday\\sh000001.day',"000001")

然后调用 这个方法,就可以把day文件变成csv文件,方便pandas来处理。


(在调用这个py文件前, 先在通达信的 软件 菜单里面 ,把通达信的 历史日K线数据都下载到本地,一次即可下载整个市场所有股票品种的数据。。)

批量处理的,请参考下面脚本

  1. # coding: UTF-8
  2. from struct import *
  3.  
  4. import os
  5. import sys
  6.  
  7.  
  8.     
  9. def day2csv_data(dirname,fname,targetDir):
  10.     ofile=open(dirname+os.sep+fname,'rb')
  11.     buf=ofile.read()
  12.     ofile.close()
  13.      
  14.     ifile=open(targetDir+os.sep+fname+'.csv','w')
  15.     num=len(buf)
  16.     no=num/32
  17.     b=0
  18.     e=32
  19.     line='' 
  20.     linename=str('date')+','+str('open')+', '+str('high')+' ,'+str('low')+', '+str('close')+' ,'+str('amout')+', '+str('vol')+' ,'+str('str07')+''+'\n'
  21.       # print line
  22.     ifile.write(linename)
  23.     # for i in xrange(no):
  24.     for i in range(int(no)):
  25.        a=unpack('IIIIIfII',buf[b:e])
  26.        line=str(a[0])+','+str(a[1]/100.0)+', '+str(a[2]/100.0)+' ,'+str(a[3]/100.0)+', '+str(a[4]/100.0)+' ,'+str(a[5])+', '+str(a[6])+' ,'+str(a[7])+''+'\n'
  27.       # print line
  28.        ifile.write(line)
  29.        b=b+32
  30.        e=e+32
  31.     ifile.close()
  32.     
  33.  
  34.  
  35. # pathdir='/vipdoc/sh/lday'
  36. pathdir='X:\\股票\\解析通达信day日线数据\\day'
  37. # targetDir='/_python_gp_tdx/data_gupiao/sh/lday'
  38. targetDir='X:\\股票\\解析通达信day日线数据\\day'
  39.  
  40. listfile=os.listdir(pathdir)
  41.  
  42.  
  43. for f in listfile:
  44.    
  45.     day2csv_data(pathdir,f,targetDir)
  46. else:
  47.     print ('The for '+pathdir+' to '+targetDir+'  loop is over')


    
 
 
 调用示例:

  1. pathdir='/vipdoc/sh/lday'
  2. targetDir='/python_data_gupiao/sh/lday'
  3. listfile=os.listdir(pathdir)
  4. for f in listfile:
  5.       day2csv_data(pathdir,f,targetDir)

 

 打开这些文件如下:

是不是很熟悉的csv或者excel的格式。。。

大家就 可以用  python的数据分析的库 pandas 的 pd.read_csv 方法来读取了。

这样速度回比较快,而且python调用 通达信的历史数据 ,就很方便了。

【扩展】:如何用python读取通达信的lc1文件

  1. # 通达信5分钟线*.lc5文件和*.lc1文件
  2. #     文件名即股票代码
  3. #     每32个字节为一个5分钟数据,每字段内低字节在前
  4. #     00 ~ 01 字节:日期,整型,设其值为num,则日期计算方法为:
  5. #                   year=floor(num/2048)+2004;
  6. #                   month=floor(mod(num,2048)/100);
  7. #                   day=mod(mod(num,2048),100);
  8. #     02 ~ 03 字节: 从0点开始至目前的分钟数,整型
  9. #     04 ~ 07 字节:开盘价,float型
  10. #     08 ~ 11 字节:最高价,float型
  11. #     12 ~ 15 字节:最低价,float型
  12. #     16 ~ 19 字节:收盘价,float型
  13. #     20 ~ 23 字节:成交额,float型
  14. #     24 ~ 27 字节:成交量(股),整型
  15. #     28 ~ 31 字节:(保留)
  16.  
  17. from struct import *
  18. import numpy as np
  19. import pandas as pd
  20.  
  21. ofile=open('sz000005.lc5','rb')
  22.  
  23. buf=ofile.read()
  24. ofile.close()
  25.  
  26. num=len(buf)
  27. no=num//32
  28. # 原来是这样的,在python2中, '整数 / 整数 = 整数',以上面的 100 / 2 就会等于 50, 并且是整数。
  29. # 而在python3中, ‘整数/整数 = 浮点数’, 也就是100 / 2 = 50.0, 不过,使用 '//'就可以达到原python2中'/'的效果。
  30.  
  31. b=0
  32. e=32
  33. dl = []
  34. for i in range(no):
  35.    a=unpack('hhfffffii',buf[b:e])
  36.    dl.append([str(int(a[0]/2048)+2004)+'-'+str(int(a[0]%2048/100)).zfill(2)+'-'+str(a[0]%2048%100).zfill(2),str(int(a[1]/60)).zfill(2)+':'+str(a[1]%60).zfill(2)+':00',a[2],a[3],a[4],a[5],a[6],a[7]])
  37.    b=b+32
  38.    e=e+32
  39. df = pd.DataFrame(dl, columns=['date','time','open','high','low','close','amount','volume'])
  40. print(df)

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/171085
推荐阅读
相关标签
  

闽ICP备14008679号