2019-01-19
阅读量:
911
Python将HTML表转换为json
我有一个像这样的html表。尝试使用pandas.read_html和beautifulsoup,。真的很沮丧,请帮忙!!
这是我原来的python代码:
url = 'http://financials.morningstar.com/ajax/keystatsAjax.html?t=wja&culture=en-CA®ion=CAN'
lm_json = requests.get(url).json()
ksContent = BeautifulSoup(lm_json["ksContent"],"html.parser")
table = ksContent.find("table", {'class': "r_table1 text2"})
jsonD = json.dumps(table.text)
jsonL = json.loads(jsonD)
'table'将包含html表,但json转换会生成纯文本。
jsonD = json.dumps(htmlContent.text)将原始HTML内容转换为JSON字符串表示形式。jsonL = json.loads(jsonD)将JSON字符串解析回常规字符串/ unicode对象。这导致无操作,因为所做的任何转义都dumps()被还原loads()。jsonL包含与...相同的数据htmlContent.text。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论