热线电话:13121318867

登录
2019-01-19 阅读量: 911
Python将HTML表转换为json

我有一个像这样的html表。尝试使用pandas.read_html和beautifulsoup,。真的很沮丧,请帮忙!!

这是我原来的python代码:

url = 'http://financials.morningstar.com/ajax/keystatsAjax.html?t=wja&culture=en-CA&region=CAN'

lm_json = requests.get(url).json()

ksContent = BeautifulSoup(lm_json["ksContent"],"html.parser")

table = ksContent.find("table", {'class': "r_table1 text2"})

jsonD = json.dumps(table.text)

jsonL = json.loads(jsonD)

'table'将包含html表,但json转换会生成纯文本。

jsonD = json.dumps(htmlContent.text)将原始HTML内容转换为JSON字符串表示形式。jsonL = json.loads(jsonD)将JSON字符串解析回常规字符串/ unicode对象。这导致无操作,因为所做的任何转义都dumps()被还原loads()。jsonL包含与...相同的数据htmlContent.text。

137.0876
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子