JustDoPython
diff --git a/‎xianhuan/README.md‎
Lines changed: 8 additions & 0 deletions b/‎xianhuan/README.md‎
Lines changed: 8 additions & 0 deletions
diff --git a/‎xianhuan/bdindex/bdindexneed.py‎
Lines changed: 82 additions & 0 deletions b/‎xianhuan/bdindex/bdindexneed.py‎
Lines changed: 82 additions & 0 deletions
diff --git a/‎xianhuan/populationone/anaone.py‎
Lines changed: 167 additions & 0 deletions b/‎xianhuan/populationone/anaone.py‎
Lines changed: 167 additions & 0 deletions
diff --git a/‎xianhuan/populationone/populationone.py‎
Lines changed: 67 additions & 0 deletions b/‎xianhuan/populationone/populationone.py‎
Lines changed: 67 additions & 0 deletions
diff --git a/‎xianhuan/populationtwo/.DS_Store‎
6 KB b/‎xianhuan/populationtwo/.DS_Store‎
6 KB
@@ -0,0 +1,8 @@
+# Python 代码实例
+
+Python技术 公众号文章代码库
+
+
+关注公众号：python 技术，回复"python"一起学习交流
+
+![](http://favorites.ren/assets/images/python.jpg)
@@ -0,0 +1,82 @@
+#!/usr/bin/env python3
+# -*- coding: utf-8 -*-
+"""
+@author: 闲欢
+"""
+import requests
+import json
+from wordcloud import WordCloud
+from matplotlib import pyplot as plt
+
+
+class bdindex:
+    # 搜索指数URL
+    data_url = 'http://index.baidu.com/api/WordGraph/multi?wordlist[]={keyword}'
+    # 检查关键词url
+    check_url = 'http://index.baidu.com/api/AddWordApi/checkWordsExists?word=%s'
+    headers = {
+        "User-Agent": 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36',
+        "Cookie": 'PSTM=1579955530; BAIDUID=C98F0EF9DCB3FC7E06D3B0FA63695787:FG=1; BIDUPSID=1FB86823BF26D806A0117921DBD66135; BDSFRCVID=bpFOJeC62ZTm5dnuEvqKKASNJe3SOxnTH6aoprlQ5IIcI75XA-7tEG0P_U8g0KubIXdfogKKLgOTHPIF_2uxOjjg8UtVJeC6EG0Ptf8g0M5; H_BDCLCKID_SF=tJkf_D8XtK83fP36q470htFjMfQXetJyaR3UWpQvWJ5TMC_whlOFK-I0XHLjWUPf-eOW3C5dLxQ8ShPC-tnZ56Lv5tRT-xb83JbnbxO83l02VM7ae-t2ynLVbNJ324RMW23r0h7mWUJzsxA45J7cM4IseboJLfT-0bc4KKJxbnLWeIJIjjCajTcQjN_qq-JQa5TbstbHaJOqD4-k-PnVHPKXhUce2bQHKKI_0-3LK-0_hC_lD6LKjI6XDGLHJ6DfHJuHoC_htD0tftbzBPcqb-F0hHc2bP0hb6nLMbTeqR3bJRO6q6KKDjjLDGtXJjDDtJCH_5u-tDDKhD_6eTONjbtpbtbmhU-e56vQ3-5SWfK2sKTn0qjTD5v3hh6aaTv45J7ZVDKbtI8MbDLrMRoVK-A0hxLXt6kXKKOLVb6Eb4OkeqOJ2Mt5bjFihp_O0PrXB6bCQCoTKlvRjPbzX4Oo0jtpeG_DtjFqtJksL-35HtnheJ54KPu_-P4DeU8eaMRZ5mAqoqOoyI_bO45ODtD2yU_9X467K5btX5rnaIQqabIMeMJFbnOIjqDNbbPtafc43bRT0xKy5KJvfjCx-UAMhP-UyPvMWh37Lg5lMKoaMp78jR093JO4y4Ldj4oxJpOJ5JbMopCafD_2MCD6DTLhen-W5gTEaPoX5Kj-WjrJabCQHnnph4Tqhh4ShUO-f6_jtnuf8JOSKRr_eJR3MPoB5P4XbacKJT3-5RPt3RLKfnD5MD89epDh0btpbtbmhU-e3TrOb45vK-oGbKjCKqo-2t0F-xbW2PkfaR7ZVD_ytCL-bK_GenJb5ICEbfreanLXKK_s3tJIBhcqEIL4WlOVjt0H5toqbxni0G7waJKbLh7WDxbSj4QoKbDj0HoAB4JAJbTv56C5bp5nhMJ33j7JDMP0-4rvKP5y523i2n3vQpnmOqQ3DRoWXPIqbN7P-p5Z5mAqKl0MLPbtbb0xXj_0-nDSHHuOJjOP; BDUSS=UJsNmwzSnVwLWJ6eGJiTGtBMXRxVkNVVHFYOEgzZ0NMemo0V2o4dG9RaH5xbmxlRVFBQUFBJCQAAAAAAAAAAAEAAAArVO4Kzt7D-3ZpcGVyAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAH8dUl5~HVJee; BDORZ=B490B5EBF6F3CD402E515D22BCDA1598; Hm_lvt_d101ea4d2a5c67dab98251f0b5de24dc=1582632851; bdshare_firstime=1582719699670; bdindexid=lbhlaubfjakm0eklbjbislhal1; Hm_lpvt_d101ea4d2a5c67dab98251f0b5de24dc=1582940553; delPer=0; PSINO=6; H_PS_PSSID=1445_21119_30790_30905_30823_26350; RT="sl=2&ss=k771w9qf&tt=1yz&bcn=https%3A%2F%2Ffclog.baidu.com%2Flog%2Fweirwood%3Ftype%3Dperf&z=1&dm=baidu.com&si=0pgwidvcjf8&ld=1ab9"',
+        "Host": "index.baidu.com",
+        "Referer": "http://index.baidu.com/v2/main/index.html"
+    }
+
+    # 获取指数数据
+    def get_index(self, params):
+        url = self.data_url.format(**params)
+        response = requests.get(url, headers=self.headers)
+
+        data = json.loads(response.text)['data']
+        print(data)
+
+        pv_dict = {}
+        ratio_dict = {}
+        for item in data['wordlist'][0]['wordGraph']:
+            pv_dict[item['word']] = item['pv']
+            ratio_dict[item['word']] = item['ratio']
+
+        # 生成词云
+        self.gen_wc_tags(pv_dict)
+        self.gen_wc_tags(ratio_dict)
+
+    # 检查关键词是否存在
+    def check_word(self, kw):
+        url = self.check_url % kw
+        response = requests.get(url, headers=self.headers)
+        data = json.loads(response.text)['data']
+        return not len(data['result'])
+
+    # 生成词云
+    def gen_wc_tags(self, tags):
+        # 设置一个底图
+        # mask = np.array(Image.open('./bf.jpg'))
+        wordcloud = WordCloud(background_color='black',
+                              mask=None,
+                              max_words=100,
+                              max_font_size=100,
+                              width=800,
+                              height=600,
+                              # 如果不设置中文字体，可能会出现乱码
+                              font_path='/System/Library/Fonts/PingFang.ttc').generate_from_frequencies(tags)
+
+        # 展示词云图
+        plt.imshow(wordcloud, interpolation='bilinear')
+        plt.axis('off')
+        plt.show()
+
+        # 保存词云图
+        wordcloud.to_file('./gzbd_wc.png')
+
+if __name__ == '__main__':
+    bdindex = bdindex()
+    # keyword = '股市'
+    # keyword = '新冠状病毒'
+    keyword = '特朗普'
+    word_exists = bdindex.check_word(keyword)
+    if word_exists:
+        params = {
+            'keyword': keyword,
+        }
+        bdindex.get_index(params)
+    else:
+        print('keyword is not found')
@@ -0,0 +1,167 @@
+#!/usr/bin/env python3
+# -*- coding: utf-8 -*-
+"""
+@author: 闲欢
+"""
+import numpy as np
+import pandas as pd
+import pyecharts.options as opts
+from pyecharts.charts import Line, Bar, Page, Pie
+
+
+# 读取数据
+pdata = pd.read_excel('populationone.xlsx')
+
+
+# 分析总人口
+def analysis_total():
+    # 处理数据
+    x_data = pdata['年份'].tolist()
+    # 将人口单位转换为亿
+    y_data1 = pdata['年末总人口(万人)'].map(lambda x: "%.2f" % (x / 10000)).tolist()
+    y_data2 = pdata['人口自然增长率(‰)'].tolist()
+    y_data3 = pdata['人口出生率(‰)'].tolist()
+    y_data4 = pdata['人口死亡率(‰)'].tolist()
+
+    # 总人口柱状图
+    bar = Bar(init_opts=opts.InitOpts(width="1200px", height="500px"))
+    bar.add_xaxis(x_data)
+    bar.add_yaxis("年末总人口（亿）", y_data1, category_gap="10%", label_opts=opts.LabelOpts(rotate=90, position="inside"))
+    bar.set_global_opts(
+        title_opts=opts.TitleOpts(title="年末总人口变化情况", pos_bottom="bottom", pos_left="center"),
+        xaxis_opts=opts.AxisOpts(
+            type_="category",
+            name='年份',
+            # 坐标轴名称显示位置
+            name_location='end',
+            # x轴数值与坐标点的偏移量
+            # boundary_gap=False,
+            axislabel_opts=opts.LabelOpts(is_show=True, margin=10, color="#000", interval=1, rotate=90),
+            # axisline_opts=opts.AxisLineOpts(is_show=True, symbol="arrow"),
+            axistick_opts=opts.AxisTickOpts(is_show=True, is_align_with_label=True),
+            axispointer_opts=opts.AxisPointerOpts(type_="line", label=opts.LabelOpts(is_show=True))
+        ),
+        # y轴相关选项设置
+        yaxis_opts=opts.AxisOpts(
+            type_="value",
+            position="left",
+        ),
+        legend_opts=opts.LegendOpts(is_show=True)
+    )
+
+    # bar.render('bartest.html')
+
+    # 自然增长率、出生率、死亡率折线图
+    line = Line(init_opts=opts.InitOpts(width="1400px", height="500px"))
+    line.add_xaxis(x_data)
+    line.add_yaxis(
+        series_name="自然增长率(‰)",
+        y_axis=y_data2,
+        label_opts=opts.LabelOpts(
+            is_show=False
+        )
+    )
+    line.add_yaxis('出生率(‰)', y_data3, label_opts=opts.LabelOpts(is_show=False))
+    line.add_yaxis('死亡率(‰)', y_data4, label_opts=opts.LabelOpts(is_show=False))
+    line.set_global_opts(
+        title_opts=opts.TitleOpts(title="人口自然增长率、出生率、死亡率", pos_bottom="bottom", pos_left="center"),
+        xaxis_opts=opts.AxisOpts(
+            name='年份',
+            name_location='end',
+            type_="value",
+            min_="1949",
+            max_interval=1,
+            # 设置x轴不必与y轴的0对齐
+            axisline_opts=opts.AxisLineOpts(is_on_zero=False),
+            axislabel_opts=opts.LabelOpts(is_show=True, color="#000", interval=0, rotate=90),
+            axistick_opts=opts.AxisTickOpts(is_show=True, is_align_with_label=True),
+            axispointer_opts=opts.AxisPointerOpts(type_="shadow", label=opts.LabelOpts(is_show=True))
+        ),
+        # y轴相关选项设置
+        yaxis_opts=opts.AxisOpts(
+            name='比例',
+            type_="value",
+            position="left",
+            min_=-10,
+            axislabel_opts=opts.LabelOpts(is_show=True)
+        ),
+        legend_opts=opts.LegendOpts(is_show=True)
+    )
+
+    # 渲染图像，将多个图像显示在一个html中
+    # DraggablePageLayout表示可拖拽
+    page = Page(layout=Page.DraggablePageLayout)
+    page.add(bar)
+    page.add(line)
+    page.render('population_total.html')
+
+# 分析男女比
+def analysis_sex():
+    x_data = pdata['年份'].tolist()
+    # 历年男性人口数
+    y_data_man = pdata['男性人口(万人)']
+    # 历年女性人口数
+    y_data_woman = pdata['女性人口(万人)']
+    # 2019年男女比饼图
+    sex_2019 = pdata[pdata['年份'] == 2019][['男性人口(万人)', '女性人口(万人)']]
+
+    # 两列相减，获得新列
+    y_data_man_woman = pdata['男性人口(万人)'] - pdata['女性人口(万人)']
+
+    pie = Pie()
+    pie.add("", [list(z) for z in zip(['男', '女'], np.ravel(sex_2019.values))])
+    pie.set_global_opts(title_opts=opts.TitleOpts(title="2019中国男女比", pos_bottom="bottom", pos_left="center"))
+    pie.set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {d}%"))
+    pie.render('nvpie.html')
+
+    line = Line(init_opts=opts.InitOpts(width="1400px", height="500px"))
+    line.add_xaxis(x_data)
+    line.add_yaxis(
+        series_name="男女差值",
+        y_axis=y_data_man_woman.values,
+        # 标出关键点的数据
+        markpoint_opts=opts.MarkPointOpts(
+            data=[
+                opts.MarkPointItem(type_="min"),
+                opts.MarkPointItem(type_="max"),
+                opts.MarkPointItem(type_="average")
+            ]
+        ),
+        label_opts=opts.LabelOpts(
+            is_show=False
+        ),
+        markline_opts=opts.MarkLineOpts(data=[opts.MarkLineItem(type_="average")])
+    )
+    line.set_global_opts(
+        title_opts=opts.TitleOpts(title="中国70年(1949-2019)男女差值（万人）", pos_left="center", pos_top="bottom"),
+        legend_opts=opts.LegendOpts(is_show=False),
+        xaxis_opts=opts.AxisOpts(
+            name='年份',
+            name_location='end',
+            type_="value",
+            min_="1949",
+            max_interval=1,
+            # 设置x轴不必与y轴的0对齐
+            axisline_opts=opts.AxisLineOpts(is_on_zero=False),
+            axislabel_opts=opts.LabelOpts(is_show=True, color="#000", interval=0, rotate=90),
+            axistick_opts=opts.AxisTickOpts(is_show=True, is_align_with_label=True),
+            axispointer_opts=opts.AxisPointerOpts(type_="shadow", label=opts.LabelOpts(is_show=True))
+        ),
+        yaxis_opts=opts.AxisOpts(
+            name='差值（万人）',
+            type_="value",
+            position="left",
+            axislabel_opts=opts.LabelOpts(is_show=True)
+        ),
+    )
+
+    # 5、渲染图像，将多个图像显示在一个html中
+    page = Page(layout=Page.DraggablePageLayout)
+    page.add(pie)
+    page.add(line)
+    page.render('population_sex.html')
+
+
+if __name__ == '__main__':
+    analysis_total()
+    analysis_sex()
@@ -0,0 +1,67 @@
+#!/usr/bin/env python3
+# -*- coding: utf-8 -*-
+"""
+@author: 闲欢
+"""
+import pandas as pd
+import requests
+
+# 人口数量excel文件保存路径
+POPULATION_EXCEL_PATH = 'populationone.xlsx'
+
+# 爬取人口数据
+def spider_population():
+    # 请求参数 sj（时间），zb（指标）
+    # 总人口
+    dfwds1 = '[{"wdcode": "sj", "valuecode": "LAST70"}, {"wdcode":"zb","valuecode":"A0301"}]'
+    # 人口出生率、死亡率、自然增长率
+    dfwds2 = '[{"wdcode": "sj", "valuecode": "LAST70"}, {"wdcode":"zb","valuecode":"A0302"}]'
+    url = 'http://data.stats.gov.cn/easyquery.htm?m=QueryData&dbcode=hgnd&rowcode=sj&colcode=zb&wds=[]&dfwds={}'
+    # 将所有数据放这里，年份为key，值为各个指标值组成的list
+    # 因为 2019 年数据还没有列入到年度数据表里，所以根据统计局2019年经济报告中给出的人口数据计算得出
+    # 数据顺序为历年数据
+    population_dict = {
+
+    }
+
+    response1 = requests.get(url.format(dfwds1))
+    get_population_info(population_dict, response1.json())
+
+    response2 = requests.get(url.format(dfwds2))
+    get_population_info(population_dict, response2.json())
+
+    population_dict['2019'] = [2019, 140005, 71527, 68478, 84843, 55162, 10.48, 7.14, 3.34]
+    save_excel(population_dict)
+
+    return population_dict
+
+# 提取人口数量信息
+def get_population_info(population_dict, json_obj):
+    datanodes = json_obj['returndata']['datanodes']
+    for node in datanodes:
+        # 获取年份
+        year = node['code'][-4:]
+        # 数据数值
+        data = node['data']['data']
+        if year in population_dict.keys():
+            population_dict[year].append(data)
+        else:
+            population_dict[year] = [int(year), data]
+    return population_dict
+
+# 人口数据生成excel文件
+def save_excel(population_dict):
+    # .T 是行列转换
+    df = pd.DataFrame(population_dict).T[::-1]
+    df.columns = ['年份', '年末总人口(万人)', '男性人口(万人)', '女性人口(万人)', '城镇人口(万人)', '乡村人口(万人)', '人口出生率(‰)', '人口死亡率(‰)',
+                  '人口自然增长率(‰)']
+    writer = pd.ExcelWriter(POPULATION_EXCEL_PATH)
+    # columns参数用于指定生成的excel中列的顺序
+    df.to_excel(excel_writer=writer, index=False, encoding='utf-8', sheet_name='中国70年人口数据')
+    writer.save()
+    writer.close()
+
+
+if __name__ == '__main__':
+    result_dict = spider_population()
+    # print(result_dict)