YW

Results 10 comments of YW

你好, 非常感谢你的API和数据! 我在做R0(基本再生数)的变动,发现全国历史数据于时间点2020-02-01 23:35:31,2020-02-01 23:32:25,和 2020-02-01 23:28:19的累计确诊和累计疑似有异常。 累计确诊和累计疑似病例分别为 7351和200,皆少于之前的值13858 和17988,原API截图如下 ![脏数据](https://user-images.githubusercontent.com/56286591/74203785-bcddea00-4cab-11ea-86da-b808f7d4258f.png) 放在python数据框中更简单易懂,如下 ![zangshuju](https://user-images.githubusercontent.com/56286591/74203842-edbe1f00-4cab-11ea-9890-d58350fd6c7d.png) 我这边会自己做改动,只是想来提醒一下原主和分析数据的各位。 谢谢!

> 江西省疑似病例异常 "丁香园已经不针对省/市开放suspectedCount数据了,只有确诊、治愈、死亡数据公开。" #12

> 你好!当我获取[https://lab.isaaclin.cn/nCoV/api/area?latest=0时候](https://lab.isaaclin.cn/nCoV/api/area?latest=0%E6%97%B6%E5%80%99) 由于嵌套了list 小白的我不知道怎么处理了 请问能返回其他易处理的格式嘛 我用R 一直没找到办法处理这个问题 你好,可以用以下代码在R中读取API转换成数据框 ```r library(jsonlite) url = 'http://lab.isaaclin.cn/nCoV/api/overall?latest=0' df = readLines(url, encoding="UTF-8") df = fromJSON(df) View(df[["results"]]) ```

> 目前接口返回的最早数据是 2020-01-24,如果能获取更早的数据会更有价值。 > > 有篇论文 [SARS传播的数学原理及预测与控制](https://math.tongji.edu.cn/model/docs/tcumcm2003A.pdf) 提供了一个预测疫情的模型,其中数据要 25 天以上才能拟合的比较好。 > > 丁香园的数据中看上去有早期数据01-11。[网易新闻](https://news.163.com/special/epidemic/#map_block) 最早是01-21。 > 更完整的数据看上去只有从政府网站通报中爬取,但处理起来会非常麻烦。 > > 有一篇文章 [澎湃新闻网 - 面对肺炎疫情,政府的数据开放还有很大空间](https://pit.ifeng.com/c/7tXYB2NVYES) 看完深感政府数据开放太不完善了。 你好, 如果你用R的话,R中出了一个新的包```nCoV2019```,可以读取到1月13号的数据,代码如下 ```r library(nCov2019) library(dplyr) # now...

> 你好!当我获取[https://lab.isaaclin.cn/nCoV/api/area?latest=0时候](https://lab.isaaclin.cn/nCoV/api/area?latest=0%E6%97%B6%E5%80%99) 由于嵌套了list 小白的我不知道怎么处理了 请问能返回其他易处理的格式嘛 我用R 一直没找到办法处理这个问题 你好,不知道你是否有找到解决方案。有的话是否能分享一下,这边也遇到了一样的问题。

> > > 你好!当我获取[https://lab.isaaclin.cn/nCoV/api/area?latest=0时候](https://lab.isaaclin.cn/nCoV/api/area?latest=0%E6%97%B6%E5%80%99) 由于嵌套了list 小白的我不知道怎么处理了 请问能返回其他易处理的格式嘛 我用R 一直没找到办法处理这个问题 > > > > > > 你好,不知道你是否有找到解决方案。有的话是否能分享一下,这边也遇到了一样的问题。 > > 你好,我对R的了解比较少,之前@pzhaonet 在 #42 中提交过一份[R语言数据预处理包](https://github.com/pzhaonet/ncovr/blob/master/R/ncovr.R),里面包括了数据从API和CSV文件下载并载入DataFrame中,不确定是否有帮助,或许可以阅读他源代码中[get_ncov函数](https://github.com/pzhaonet/ncovr/blob/79b57c2f24ee511d5934d1f8d55294322597886f/R/ncovr.R#L20)找到解决方案。 你好, (忘记了他说的是他在用R,还以为他用Python) 我听了你的建议之后从R转用了python,根据上面的示范,改```all```为```area``` ```python import requests import pandas...

> 很抱歉,历史数据最早只从项目写完爬虫开始运行是才可得,目前能从API请求到的最早的数据就是我的数据库能查询到的最早的历史数据了。其他数据源的数据暂时没有收录,如果更新频率很低,或许等API和爬虫稳定可用之后,我会考虑手动录入数据。 > > 2月13日更新: > 目前项目各方面已经趋于稳定,请问是否有人知道2020年1月22日以前的省级数据/24日以前的市级数据有什么获取渠道吗?目前准备寻找之前发表的传播学模型的论文,查看是否有公开数据集,以及这些数据的整理时间。 你好, 微信公众号`biobabble`的`R`语言的包`nCov2019`中湖北武汉最早数据是到**1月11号**,黄冈是到**1月20号**。说全国各城市新型肺炎疫情详情是由[新一线城市研究所x8点健闻]提供的。 ```R province city time cum_confirm cum_heal 3785 湖北 仙桃 2020-01-23 2 NA 3786 湖北 宜昌 2020-01-23 1 NA 3787 湖北 十堰...

> 万分感谢!我会尽快查看,如果数据可靠会及时补全。 > > 另外,请问这份数据有具体的获取时间吗,是否是当天最后一次更新的数据呢? > > 全国所有省份的数据应该都可以往前再回溯一段时间,但因为数据不一定是当天最后一次更新,且具体更新时间不确定,所以一直没有将其载入数据库,因为对传播学没有了解,担心数据的准确性会影响其他人的研究成果。 你好, 这份`R`语言的包的数据是由**新一线城市研究所**与**8点健闻**整理出来提供给一名生物信息学科研学者,再由这名学者写成`R`语言的包`nCov2019`而成。 这份数据具体的获取时间因此便不得而知了,或许可从微信上联系公众号`biobabble`才能解答。 在当前情况下,毕竟一月份初期病情并未扩散且基数较小,综合潜伏者,政治及医疗设施的匮乏等因素,*数据信息的完整性*带来的**利**想必是比*更新时间的不确定性*和微小的*数据差异*的**弊**要大,在备注中注明不确定性即可。 个人建议补全数据及标注备注以警示学者。 万分感谢你的付出。

你好, [biendata](https://www.biendata.com/competition/epidemic/data/) 给参赛者提供了历史数据得csv,全国是到一月十号,省份则是到一月二十号。

你好,这一页下面的数据库里有写着链接字样的就是。选择最近的一天2-26就好。上面的百度只是提交的格式的例子 Isaac Lin 于 2020年2月27日周四 下午1:37写道: > 你好, > biendata > 给参赛者提供了历史数据得csv,全国是到一月十号,省份则是到一月二十号。 > > 你好,十分感谢。我已经注册了这个账号,但似乎并没有提供数据集。 > [image: image] > > > sample数据集仅245B大小,应该是提交数据的示例,训练集似乎并没有提供? > > — > You are receiving this...