Tensorflow基礎

2020-02-122020-02-12 admin

說明：本文實例使用Python版本為3.5.6，Tensorflow版本為2.0

介紹

Tensorflow是Google推出的機器學習開源神器，對Python有着良好的語言支持，支持CPU，GPU和Google TPU等硬件，並且已經擁有了各種各樣的模型和算法。目前，Tensorflow已被廣泛應用於文本處理，語音識別和圖像識別等多項機器學習和深度學習領域。

基礎框架

分為三層：應用層、接口層和核心層

應用層

提供了機器學習相關的訓練庫、預測庫和針對Python、C++和Java等變成語言的編程環境，類似於web系統的前端，主要實現了對計算圖的構造。

接口層

對Tensorflow功能模塊的封裝，便於其它語言平台的調用。

核心層

最重要的部分，包括設備層、網絡層、數據操作層和圖計算層，執行應用層的計算。

1.設備層

包括Tensorflow在不同硬件設備上的實現，主要支持CPU、GPU和Mobile等設備，在不同硬件設備上實現計算命令的轉換，給上層提供統一的接口，實現程序的跨平台功能。

2.網絡層

網絡層主要包括RPC和RDMA通信協議，實現不同設備之間的數據傳輸和更新，這些協議都會在分佈式計算中用到。

3.數據操作層

以tensor為處理對象，實現tensor的各種操作和計算。

4.圖計算層

包括分佈式計算圖和本地計算圖的實現，實現圖的創建、編譯、優化和執行等。

設計理念

可以將Tensorflow理解為一張計算圖中“張量的流動”，其中，Tensor（張量）代表了計算圖中的邊，Flow(流動)代表了計算圖中節點所做的操作而形成的數據流動。

其設計理念是以數據流為核心，當構建相應的機器學習模型后，使用訓練數據在模型中進行數據流動，同時將結果以反向傳播的方式反饋給模型中的參數，以進行調參，使用調整后的參數對訓練數據再次進行迭代計算。

編程特點

有兩個編程特點：

圖的定義和圖的運行完全分開

在tensorflow中，需要預先定義各種變量，建立相關的數據流圖，在數據流圖中創建各種變量之間的計算關係，完成圖的定義，需要把運算的輸入數據放進去后，才會形成輸出值。

圖的計算在會話中執行

tensorflow的相關計算在圖中進行定義，而圖的具體運行壞境在會話(session)中，開啟會話后，才能開始計算，關閉會話就不能再進行計算了。

舉個例子：

import tensorflow as tf
tf.compat.v1.disable_eager_execution()


a = 3
b = 4
c = 5
y = tf.add(a*b, c)
print(y)

a = tf.constant(3, tf.int32)
b = tf.constant(4, tf.int32)
c = tf.constant(5, tf.int32)
y = tf.add(a*b, c)
print(y)
session = tf.compat.v1.Session()
print(session.run(y))
session.close()

可以看出，在圖創建后，並在會話中執行數據計算，最終輸出結果。

設計的好處就是：學習的過程中，消耗最多的是對數據的訓練，這樣設計的話，當進行計算時，圖已經確定，計算就只剩下一個不斷迭代的過程。

基本概念

Tensor

張量，是tensorflow中最主要的數據結構，張量用於在計算圖中進行數據傳遞，創建了張量后，需要將其賦值給一個變量或佔位符，之後才會將該張量添加到計算圖中。

session

會話，是Tensorflow中計算圖的具體執行者，與圖進行實際的交互。一個會話中可以有多個圖，會話的主要目的是將訓練數據添加到圖中進行計算，也可以修改圖的結構。

調用模式推薦使用with語句：

with session:
    session.run()

Variable

變量，表示圖中的各個計算參數，通過調整這些變量的狀態來優化機器學習算法。創建變量應使用tf.Variable()，通過輸入一個張量，返回一個變量，變量聲明后需進行初始化才能使用。

舉例說明：

import tensorflow as tf
tf.compat.v1.disable_eager_execution()

tensor = tf.ones([1, 3])
test_var = tf.Variable(tensor)
# 初始化變量
init_op = tf.compat.v1.global_variables_initializer()
session = tf.compat.v1.Session()
with session:
    print("tensor is ", session.run(tensor))
    # print("test_var is ", session.run(test_var))
    session.run(init_op)
    print("after init, test_var is", session.run(test_var))

Placeholder

佔位符，用於表示輸入輸出數據的格式，聲明了數據位置，允許傳入指定類型和形狀的數據，通過會話中的feed_dict參數獲取數據，在計算圖運行時使用獲取的數據進行計算，計算完畢后獲取的數據就會消失。

舉例說明：

x = tf.compat.v1.placeholder(tf.int32)
y = tf.compat.v1.placeholder(tf.int32)
z = tf.add(x, y)
session = tf.compat.v1.Session()
with session:
    print(session.run([z], feed_dict={x: [1, 2], y: [2, 3]}))

Operation

操作，是圖中的節點，輸入輸出都是Tensor，作用是完成各種操作，包括：

數學運算：add, sub, mul, div, exp …
數組運算：concat, slice, split, rank …
矩陣運算：matmul, matrixinverse …
神經網絡構建：softmax, sigmoid, relu …
檢查點：save, restore …
隊列和同步：enqueue, dequeue, mutexacquire, mutexrelease …
張量控制：merge, switch, enter, leave …

Queue

隊列，圖中有狀態的節點。包含入列（endqueue）和出列（dequeue）兩個操作，入列返回計算圖中的一個操作節點，出列返回一個tensor值。

其中，隊列有兩種：

1. FIFOQueue

按入列順序出列的隊列，在需要讀入的訓練樣本有序時使用。舉個例子：

fifo_queue = tf.compat.v1.FIFOQueue(10, 'int32')
init = fifo_queue.enqueue_many(([1, 2, 3, 4, 5, 6], ))
with tf.compat.v1.Session() as session:
    session.run(init)
    queue_size = session.run(fifo_queue.size())
    for item in range(queue_size):
        print('fifo_queue', session.run(fifo_queue.dequeue()))

2. RandomShuffleQueue

以隨機順序出列的隊列，讀入的訓練樣本無序時使用。舉個例子：

rs_queue = tf.compat.v1.RandomShuffleQueue(capacity=5, min_after_dequeue=0, dtypes='int32')
init = rs_queue.enqueue_many(([1, 2, 3, 4, 5], ))
with tf.compat.v1.Session() as session:
    session.run(init)
    queue_size = session.run(rs_queue.size())
    for i in range(queue_size):
        print('rs_queue', session.run(rs_queue.dequeue()))

代碼參考：

以上。

本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理【其他文章推薦】

※帶您來了解什麼是 USB CONNECTOR ?

※自行創業缺乏曝光? 下一步"網站設計"幫您第一時間規劃公司的門面形象

※如何讓商品強力曝光呢? 網頁設計公司幫您建置最吸引人的網站，提高曝光率!!

※綠能、環保無空污,成為電動車最新代名詞，目前市場使用率逐漸普及化

※廣告預算用在刀口上，網站設計公司幫您達到更多曝光效益

Java IO入門

2020-02-122020-02-12 admin

我們從兩個方面來理解Java IO，數據源（流）、數據傳輸，即IO的核心就是對數據源產生的數據進行讀寫並高效傳輸的過程。

一. 數據源（流）

數據源可以理解為水源，指可以產生數據的事物，如硬盤（文檔、數據庫等文件…）、網絡（填寫的form表單、物聯感知信息..），在Java中有對文件及文件夾操作的類File，常用的文件方法如下：

public static void printFileDetail(File file) throws IOException {
    System.out.println("文件是否存在：" + file.exists());
    if(!file.exists()){
        System.out.println("創建文件：" + file.getName());
        file.createNewFile();
    }
    if(file.exists()){
        System.out.println("是否為文件：" + file.isFile());
        System.out.println("是否為文件夾：" + file.isDirectory());
        System.out.println("文件名稱：" + file.getName());
        System.out.println("文件構造路徑：" + file.getPath());
        System.out.println("文件絕對路徑：" + file.getAbsolutePath());
        System.out.println("文件標準路徑：" + file.getCanonicalPath());
        System.out.println("文件大小：" + file.length());
        System.out.println("所在文件夾路徑：" + file.getParentFile().getCanonicalPath());
        System.out.println("設置為只讀文件：" + file.setReadOnly());
    }
}
public static void main(String[] args) throws IOException {
    File file = new File("./遮天.txt");
    printFileDetail(file);
}

結果如下：

文件是否存在：false
創建文件：遮天.txt
是否為文件：true
是否為文件夾：false
文件名稱：遮天.txt
文件構造路徑：.\遮天.txt
文件絕對路徑：E:\idea-work\javase-learning\.\遮天.txt
文件標準路徑：E:\idea-work\javase-learning\遮天.txt
文件大小：0
所在文件夾路徑：E:\idea-work\javase-learning
設置為只讀文件：true

二. 數據傳輸

數據傳輸的核心在於傳輸數據源產生的數據，Java IO對此過程從兩方面進行了考慮，分別為輸入流和輸出流，輸入流完成外部數據向計算機內存寫入，輸出流則反之。

而針對輸入流和輸出流，Java IO又從字節和字符的不同，再次細分了字節流和字符流。

說明：Java中最小的計算單元是字節，沒有字符流也能進行IO操作，只是因為現實中大量的數據都是文本字符數據，基於此單獨設計了字符流，使操作更簡便。

4個頂層接口有了，接下來Java IO又從多種應用場景（包括了基礎數據類型、文件、數組、管道、打印、序列化）和傳輸效率（緩衝操作）進行了考慮，提供了種類眾多的Java IO流的實現類，看下圖：

當然我們不用都記住，而實際在使用過程中用的最多的還是文件類操作、轉換類操作、序列化操作，當然在此基礎上我們可以使用Buffered來提高效率（Java IO使用了裝飾器模式）。下面我們通過文件拷貝來簡單說明一下主要類的使用

    /**
     * 文件拷貝（所有文件，文檔、視頻、音頻、可執行文件...），未使用緩衝
     * @param sourceFileName 源文件路徑
     * @param targetFileName 拷貝后目標文件路徑
     * @throws IOException IO異常
     */
    public static void slowlyCopyFile(String sourceFileName, String targetFileName) throws IOException{
        //獲取字節輸入流
        FileInputStream fileInputStream = new FileInputStream(sourceFileName);
        //File targetFile = new File(targetFileName);
        //獲取字節輸出流
        FileOutputStream fileOutputStream = new FileOutputStream(targetFileName);
        byte[] bytes = new byte[1024];
        //當為-1時說明讀取到最後一行了
        while ((fileInputStream.read(bytes)) != -1) {
            fileOutputStream.write(bytes);
        }
        fileInputStream.close();
        fileOutputStream.close();
    }
    
    /**
     * 文件拷貝（所有文件，文檔、視頻、音頻、可執行文件...），使用緩衝
     * @param sourceFileName 源文件路徑
     * @param targetFileName 拷貝后目標文件路徑
     * @throws IOException IO異常
     */
    public static void fastCopyFile(String sourceFileName, String targetFileName) throws IOException{
        //獲取字節輸入流
        FileInputStream fileInputStream = new FileInputStream(sourceFileName);
        //緩衝字節輸入流
        BufferedInputStream bufferedInputStream = new BufferedInputStream(fileInputStream);
        //獲取字節輸出流
        FileOutputStream fileOutputStream = new FileOutputStream(targetFileName);
        //緩衝字節輸出流
        BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(fileOutputStream);
        byte[] bytes = new byte[1024];

        //當為-1時說明讀取到最後一行了
        while ((bufferedInputStream.read(bytes)) != -1) {
            bufferedOutputStream.write(bytes);
        }
        bufferedOutputStream.flush();
        bufferedInputStream.close();
        fileInputStream.close();
        bufferedOutputStream.close();
        fileOutputStream.close();
    }

    public static void main(String[] args) throws IOException {
        long startTime = System.currentTimeMillis();
        //文件215M
        slowlyCopyFile("D:\\Download\\jdk-8u221.exe","D:\\jdk-8u221.exe");//執行：1938ms
        fastCopyFile("D:\\Download\\jdk-8u221.exe","D:\\jdk-8u221.exe");//執行：490ms
        System.out.println(System.currentTimeMillis() - startTime);
    }

    /**
     * 文本文件拷貝，不使用緩衝
     * @param sourceFileName 源文件路徑
     * @param targetFileName 拷貝后目標文件路徑
     * @throws IOException IO異常
     */
    public static void slowlyCopyTextFile(String sourceFileName, String targetFileName) throws IOException {
        FileReader fileReader = new FileReader(sourceFileName);
        FileWriter fileWriter = new FileWriter(targetFileName);
        int c;
        while ((c = fileReader.read()) != -1) {
            fileWriter.write((char)c);
        }
        fileReader.close();
        fileWriter.close();
    }

    /**
     * 文本文件拷貝，使用緩衝
     * @param sourceFileName 源文件路徑
     * @param targetFileName 拷貝后目標文件路徑
     * @throws IOException IO異常
     */
    public static void fastCopyTextFile(String sourceFileName, String targetFileName) throws IOException {
        FileReader fileReader = new FileReader(sourceFileName);
        BufferedReader bufferedReader = new BufferedReader(fileReader);
        FileWriter fileWriter = new FileWriter(targetFileName);
        BufferedWriter bufferedWriter = new BufferedWriter(fileWriter);
        String str;
        while ((str = bufferedReader.readLine()) != null) {
            bufferedWriter.write(str + "\n");
        }
        bufferedReader.close();
        fileReader.close();
        bufferedWriter.close();
        fileWriter.close();
    }

    public static void main(String[] args) throws IOException {
        long startTime = System.currentTimeMillis();
        //文件30M
        slowlyCopyTextFile("D:\\Download\\小說合集.txt","D:\\小說合集.txt");//3182ms
        fastCopyTextFile("D:\\Download\\小說合集.txt","D:\\小說合集.txt");//1583ms
        System.out.println(System.currentTimeMillis() - startTime);
    }

三. 總結

本文主要對Java IO相關知識點做了結構性梳理，包括了Java IO的作用，數據源File類，輸入流，輸出流，字節流，字符流，以及緩衝流，不同場景下的更細化的流操作類型，同時用了一個文件拷貝代碼簡單地說明了主要的流操作，若有不對之處，請批評指正，望共同進步，謝謝！。

本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理【其他文章推薦】

※USB CONNECTOR掌控什麼技術要點? 帶您認識其相關發展及效能

※評比前十大台北網頁設計、台北網站設計公司知名案例作品心得分享

※智慧手機時代的來臨，RWD網頁設計已成為網頁設計推薦首選

中國工信部：將制定停止產銷傳統能源汽車的時間表

2020-02-122020-02-12 admin

新華社9日報導，中國工信部副部長辛國斌表示，一些國家已經制定了停止生產銷售傳統能源汽車的時間表。他說，目前工信部也啟動了相關研究、將會同相關部門制定中國的時間表。

報導指出，從現在到2025年將是汽車產業變革最為劇烈的幾年，傳統汽車節能減排要求越來越高，新能源汽車發展加快的同時對技術要求也越來越高，智能聯網將對整個產業巨大影響。辛國斌及專家建議中國車企應深刻認識這種趨勢、及時調整策略。

Thomson Reuters上個月底引述消息人士報導，根據最新提案，明年底中國境內車商8%銷售必須是電動車或油電混合車種、2019年升至10%、2020年升至12%。報導指出，這項規定預計將自2019年起開始落實執行、較原先規劃晚一年。

英國跟隨法國以及馬德里、墨西哥城和雅典等城市的抗空汙腳步，7月宣布將自2040年起禁止販售汽油和柴油新車。英國最大汽車製造商Jaguar Land Rover(JLR)9月7日宣布，2020年起旗下所有新車都將具備電動或油電混合驅動選項。德國車廠BMW也宣布將自2020年起開始量產電動車、預估到2025年將有12種純電動車款。

BBC News 10日報導，上述最新消息將對中國石油需求帶來連鎖效應。中國目前是全球第二大石油消費國。依據目前的規劃，中國希望在2025年將電動車/油電混合車銷售佔比至少拉升至五分之一。

根據DNV GL首度發布的「能源轉型展望」報告，受電動車滲透率持續上揚的影響，石油供應將在2020-2028年期間轉趨持平、隨後大幅下降，2034年將遭天然氣超越。

這份報告預估電動車、內燃引擎車將在2022年達到「成本平價」，預估到2033年全球半數輕型新車銷售量都將是電動車。

（本文內容由授權使用。圖片出處：public domain CC0）

本站聲明:網站內容來源於EnergyTrend https://www.energytrend.com.tw/ev/,如有侵權,請聯繫我們,我們將及時處理

【其他文章推薦】

※台北網頁設計公司這麼多，該如何挑選?? 網頁設計報價省錢懶人包"嚨底家"

※網頁設計公司推薦更多不同的設計風格，搶佔消費者視覺第一線

※想知道購買電動車哪裡補助最多?台中電動車補助資訊懶人包彙整

SpringBoot系列之i18n集成教程

2020-02-122020-02-12 admin

SpringBoot系統之i18n國際化語言集成教程
@

1、環境搭建

本博客介紹一下SpringBoot集成i18n，實現系統語言國際化處理，ok，先創建一個SpringBoot項目，具體的參考我的博客專欄：

環境準備：

IntelliJ IDEA
Maven

項目集成：

Thymeleaf(模板引擎，也可以選jsp或者freemark)
SpringBoot2.2.1.RELEASE

2、resource bundle資源配置

ok，要實現國際化語言，先要創建resource bundle文件：
在resources文件夾下面創建一個i18n的文件夾，其中：

messages.properties是默認的配置
messages_zh_CN.properties是（中文/中國）
messages_en_US.properties是（英文/美國）
etc.
IDEA工具就提供了很簡便的自動配置功能，如圖，只要點擊新增按鈕，手動輸入，各配置文件都會自動生成屬性

messages.properties：

messages.loginBtnName=登錄~
messages.password=密碼~
messages.rememberMe=記住我~
messages.tip=請登錄~
messages.username=用戶名~

messages_zh_CN.properties：

messages.loginBtnName=登錄
messages.password=密碼
messages.rememberMe=記住我
messages.tip=請登錄
messages.username=用戶名

messages_en_US.properties：

messages.loginBtnName=login
messages.password=password
messages.rememberMe=Remember me
messages.tip=Please login in
messages.username=userName

在項目的application.properties修改默認配置，讓SpringBoot的自動配置能讀取到resource bundle資源文件

## 配置i18n
# 默認是i18n（中文/中國）
spring.mvc.locale=zh_CN
# 配置resource bundle資源文件的前綴名eg:i18n是文件夾名，messages是資源文件名，支持的符號有.號或者/
spring.messages.basename=i18n.messages
# 設置緩存時間，2.2.1是s為單位，之前版本才是毫秒
spring.messages.cache-duration=1
# 設置資源文件編碼格式為utf8
spring.messages.encoding=utf-8

注意要點：

spring.messages.basename必須配置，否則SpringBoot的自動配置將失效
MessageSourceAutoConfiguration.ResourceBundleCondition 源碼：

protected static class ResourceBundleCondition extends SpringBootCondition {
        //定義一個map緩存池
        private static ConcurrentReferenceHashMap<String, ConditionOutcome> cache = new ConcurrentReferenceHashMap<>();

        @Override
        public ConditionOutcome getMatchOutcome(ConditionContext context, AnnotatedTypeMetadata metadata) {
            String basename = context.getEnvironment().getProperty("spring.messages.basename", "messages");
            ConditionOutcome outcome = cache.get(basename);//緩存拿得到，直接從緩存池讀取
            if (outcome == null) {//緩存拿不到，重新讀取
                outcome = getMatchOutcomeForBasename(context, basename);
                cache.put(basename, outcome);
            }
            return outcome;
        }

        private ConditionOutcome getMatchOutcomeForBasename(ConditionContext context, String basename) {
            ConditionMessage.Builder message = ConditionMessage.forCondition("ResourceBundle");
            for (String name : StringUtils.commaDelimitedListToStringArray(StringUtils.trimAllWhitespace(basename))) {
                for (Resource resource : getResources(context.getClassLoader(), name)) {
                    if (resource.exists()) {
                    //匹配resource bundle資源
                        return ConditionOutcome.match(message.found("bundle").items(resource));
                    }
                }
            }
            return ConditionOutcome.noMatch(message.didNotFind("bundle with basename " + basename).atAll());
        }
        //解析資源文件
        private Resource[] getResources(ClassLoader classLoader, String name) {
            String target = name.replace('.', '/');//spring.messages.basename參數值的點號換成斜桿
            try {
                return new PathMatchingResourcePatternResolver(classLoader)
                        .getResources("classpath*:" + target + ".properties");
            }
            catch (Exception ex) {
                return NO_RESOURCES;
            }
        }

    }

cache-duration在2.2.1版本，指定的是s為單位，找到SpringBoot的MessageSourceAutoConfiguration自動配置類

3、LocaleResolver類

SpringBoot默認採用AcceptHeaderLocaleResolver類作為默認LocaleResolver，LocaleResolver類的作用就是作為i18n的分析器，獲取對應的i18n配置，當然也可以自定義LocaleResolver類


import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
import org.springframework.lang.Nullable;
import org.springframework.util.StringUtils;
import org.springframework.web.servlet.LocaleResolver;

import javax.servlet.http.HttpServletRequest;
import javax.servlet.http.HttpServletResponse;
import java.util.Locale;

/**
 * <pre>
 *  自定義LocaleResolver類
 * </pre>
 * @author nicky
 * <pre>
 * 修改記錄
 *    修改后版本:     修改人：  修改日期: 2019年11月23日  修改內容:
 * </pre>
 */
public class CustomLocalResolver implements LocaleResolver {

    Logger LOG = LoggerFactory.getLogger(this.getClass());

    @Nullable
    private Locale defaultLocale;

    public void setDefaultLocale(@Nullable Locale defaultLocale) {
        this.defaultLocale = defaultLocale;
    }

    @Nullable
    public Locale getDefaultLocale() {
        return this.defaultLocale;
    }

    @Override
    public Locale resolveLocale(HttpServletRequest request) {
        Locale defaultLocale = this.getDefaultLocale();//獲取application.properties默認的配置
        if(defaultLocale != null && request.getHeader("Accept-Language") == null) {
            return defaultLocale;//http請求頭沒獲取到Accept-Language才採用默認配置
        } else {//request.getHeader("Accept-Language")獲取得到的情況
            Locale requestLocale = request.getLocale();//獲取request.getHeader("Accept-Language")的值
            String localeFlag = request.getParameter("locale");//從URL獲取的locale值
            //LOG.info("localeFlag:{}",localeFlag);
            //url鏈接有傳locale參數的情況，eg:zh_CN
            if (!StringUtils.isEmpty(localeFlag)) {
                String[] split = localeFlag.split("_");
                requestLocale = new Locale(split[0], split[1]);
            }
            //沒傳的情況，默認返回request.getHeader("Accept-Language")的值
            return requestLocale;
        }
    }

    @Override
    public void setLocale(HttpServletRequest request, HttpServletResponse response, Locale locale) {

    }
}

4、I18n配置類

I18n還是要繼承WebMvcConfigurer，注意，2.2.1版本才是實現接口就可以，之前1.+版本是要實現WebMvcConfigurerAdapter適配器類的

import com.example.springboot.i18n.component.CustomLocalResolver;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.autoconfigure.web.servlet.WebMvcProperties;
import org.springframework.boot.context.properties.EnableConfigurationProperties;
import org.springframework.context.annotation.Bean;
import org.springframework.context.annotation.Configuration;
import org.springframework.web.servlet.LocaleResolver;
import org.springframework.web.servlet.config.annotation.InterceptorRegistry;
import org.springframework.web.servlet.config.annotation.ViewControllerRegistry;
import org.springframework.web.servlet.config.annotation.WebMvcConfigurer;
import org.springframework.web.servlet.i18n.LocaleChangeInterceptor;

/**
 * <pre>
 *  I18nConfig配置類
 * </pre>
 * <p>
 * <pre>
 * @author nicky.ma
 * 修改記錄
 *    修改后版本:     修改人：  修改日期: 2019/11/24 11:15  修改內容:
 * </pre>
 */
 //Configuration必須加上，不然不能加載到Spring容器
@Configuration
//使WebMvcProperties配置類可用，這個可以不加上，本博客例子才用
@EnableConfigurationProperties({ WebMvcProperties.class})
public class I18nConfig implements WebMvcConfigurer{
    
    //裝載WebMvcProperties 屬性
    @Autowired
    WebMvcProperties webMvcProperties;
    /**
     * 定義SessionLocaleResolver
     * @Author nicky.ma
     * @Date 2019/11/24 13:52
     * @return org.springframework.web.servlet.LocaleResolver
     */
//    @Bean
//    public LocaleResolver localeResolver() {
//        SessionLocaleResolver sessionLocaleResolver = new SessionLocaleResolver();
//        // set default locale
//        sessionLocaleResolver.setDefaultLocale(Locale.US);
//        return sessionLocaleResolver;
//    }

    /**
     * 定義CookieLocaleResolver
     * @Author nicky.ma
     * @Date 2019/11/24 13:51
     * @return org.springframework.web.servlet.LocaleResolver
     */
//    @Bean
//    public LocaleResolver localeResolver() {
//        CookieLocaleResolver cookieLocaleResolver = new CookieLocaleResolver();
//        cookieLocaleResolver.setCookieName("Language");
//        cookieLocaleResolver.setCookieMaxAge(1000);
//        return cookieLocaleResolver;
//    }

    /**
     * 自定義LocalResolver
     * @Author nicky.ma
     * @Date 2019/11/24 13:45
     * @return org.springframework.web.servlet.LocaleResolver
     */
    @Bean
    public LocaleResolver localeResolver(){
        CustomLocalResolver localResolver = new CustomLocalResolver();
        localResolver.setDefaultLocale(webMvcProperties.getLocale());
        return localResolver;
    }

    /**
     * 定義localeChangeInterceptor
     * @Author nicky.ma
     * @Date 2019/11/24 13:45
     * @return org.springframework.web.servlet.i18n.LocaleChangeInterceptor
     */
    @Bean
    public LocaleChangeInterceptor localeChangeInterceptor(){
        LocaleChangeInterceptor localeChangeInterceptor = new LocaleChangeInterceptor();
        //默認的請求參數為locale，eg: login?locale=zh_CN
        localeChangeInterceptor.setParamName(LocaleChangeInterceptor.DEFAULT_PARAM_NAME);
        return localeChangeInterceptor;
    }

    /**
     * 註冊攔截器
     * @Author nicky.ma
     * @Date 2019/11/24 13:47
     * @Param [registry]
     * @return void
     */
    @Override
    public void addInterceptors(InterceptorRegistry registry) {
     registry.addInterceptor(localeChangeInterceptor()).addPathPatterns("/**");
    }
}

注意要點：

舊版代碼可以不加LocaleChangeInterceptor 攔截器，2.2.1版本必須通過攔截器
如下代碼，bean的方法名必須為localeResolver，否則會報錯

@Bean
    public LocaleResolver localeResolver(){
        CustomLocalResolver localResolver = new CustomLocalResolver();
        localResolver.setDefaultLocale(webMvcProperties.getLocale());
        return localResolver;
    }

原理：
跟一下源碼，點進LocaleChangeInterceptor類

DispatcherServlet是Spring一個很重要的分發器類，在DispatcherServlet的一個init方法里找到這個LocaleResolver的init方法

這個IOC獲取的bean類名固定為localeResolver，寫例子的時候，我就因為改了bean類名，導致一直報錯，跟了源碼才知道Bean類名要固定為localeResolver

拋異常的時候，也是會獲取默認的LocaleResolver的

找到資源文件，確認，還是默認為AcceptHeaderLocaleResolver

配置了locale屬性的時候，還是選用AcceptHeaderLocaleResolver作為默認的LocaleResolver

spring.mvc.locale=zh_CN

WebMvcAutoConfiguration.localeResolver方法源碼，ConditionalOnMissingBean主鍵的意思是LocaleResolver沒有自定義的時候，才作用，ConditionalOnProperty的意思，有配了屬性才走這裏的邏輯

攔截器攔截的請求參數默認為locale，要使用其它參數，必須通過攔截器設置 ,eg：localeChangeInterceptor.setParamName("lang");
LocalResolver種類有：CookieLocaleResolver(Cookie)、SessionLocaleResolver(會話)、FixedLocaleResolver、AcceptHeaderLocaleResolver(默認)、.etc

5、Thymeleaf集成

本博客的模板引擎採用Thymeleaf的，所以新增項目時候就要加上maven相關依賴，沒有的話，自己加上：

<dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-thymeleaf</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-web</artifactId>
        </dependency>

ok，然後去找個bootstrap的登錄頁面，本博客已尚硅谷老師的例子為例，進行拓展，引入靜態資源文件：

Thymeleaf的i18n支持是採用#符號的

<!DOCTYPE html>
<html lang="en" xmlns:th="http://www.thymeleaf.org">
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
        <meta name="viewport" content="width=device-width, initial-scale=1, shrink-to-fit=no">
        <meta name="description" content="">
        <meta name="author" content="">
        <title>SpringBoot i18n example</title>
        <!-- Bootstrap core CSS -->
        <link href="asserts/css/bootstrap.min.css" th:href="@{asserts/css/bootstrap.min.css}" rel="stylesheet">
        <!-- Custom styles for this template -->
        <link href="asserts/css/signin.css" th:href="@{asserts/css/signin.css}" rel="stylesheet">
    </head>

    <body class="text-center">
        <form class="form-signin" action="dashboard.html">
            <img class="mb-4" th:src="@{asserts/img/bootstrap-solid.svg}" alt="" width="72" height="72">
            <h1 class="h3 mb-3 font-weight-normal" th:text="#{messages.tip}">Please sign in</h1>
            <label class="sr-only" th:text="#{messages.username}">Username</label>
            <input type="text" class="form-control" th:placeholder="#{messages.username}" required="" autofocus="">
            <label class="sr-only" th:text="#{messages.password} ">Password</label>
            <input type="password" class="form-control" th:placeholder="#{messages.password}" required="">
            <div class="checkbox mb-3">
                <label>
          <input type="checkbox" value="remember-me" > [[#{messages.rememberMe}]]
        </label>
            </div>
            <button class="btn btn-lg btn-primary btn-block" type="submit" th:text="#{messages.loginBtnName}">Sign in</button>
            <p class="mt-5 mb-3 text-muted">© 2019</p>
            <a class="btn btn-sm" th:href="@{/login(locale='zh_CN')} ">中文</a>
            <a class="btn btn-sm" th:href="@{/login(locale='en_US')} ">English</a>
        </form>

    </body>

</html>

切換中文網頁：

切換英文網頁：

當然不點鏈接傳locale的方式也是可以自動切換的，瀏覽器設置語言：

原理localeResolver類會獲取Accept language參數

附錄：
logging manual：
example source：

本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理【其他文章推薦】

※網頁設計公司推薦更多不同的設計風格，搶佔消費者視覺第一線

※廣告預算用在刀口上，網站設計公司幫您達到更多曝光效益

※自行創業缺乏曝光? 下一步"網站設計"幫您第一時間規劃公司的門面形象

小白學 Python 爬蟲（3）：前置準備（二）Linux基礎入門

2020-02-112020-02-12 admin

人生苦短，我用 Python

前文傳送門：

Linux 基礎

CentOS 官網：。

CentOS 官方下載鏈接：。

Linux 目前在企業中廣泛的應用於服務器系統，無論是寫好的代碼，還是使用的第三方的開源的產品，絕大多數都是部署在 Linux 上面運行的。

可能很多同學一提到 Linux 就慫了，黒糊糊的一篇，連個界面都沒有，滿屏幕都是神秘代碼，沒有一個看得懂的。

表怕，本文就帶你入門 Linux 。

Linux 有不同的發行版本，而我們在企業中一般使用的是 CentOS ，目前比較常用的版本已經到了 7.x 。

由於 Linux 是開源的，所以不同廠商之間提供的發行版會有非常多，比較常見的有 Ubuntu（基於Debian的桌面版）、Debian（國際化組織的開源操作系統）、 RedHat（紅帽企業系統）、 Fedora（最初由紅帽公司發起的桌面版系統套件）等等。

因為在企業中使用比較多的還是 CentOS ，所以我們還是拿 CentOS 來介紹。

在 win 系統下的安裝可以使用第三方廠商提供的 VMware 或者 win 自帶的 Hyper-V 構建一個虛擬機進行安裝，也可以使用雲服務廠商提供的入門版的雲服務器（1H1G1M），一般新用戶首年價格都在100元以內。

安裝的過程我就不介紹了，百度一下大把。

安裝完成后，設置好 Linux root 用戶的密碼后，可以使用 ssh 工具進行連接，這裏的工具可以選擇 xshell （個人使用免費，就是官網屬實有點慢），打開 xshell 輸入 ip 、用戶名（root）、密碼后，應該可以看到如下界面：

小編這裏使用的是京東雲的服務器，打碼部分涉及 IP 信息，所以隱藏掉了，屬實怕大神搞我。

因為我們的目標不是 Linux 運維工程師，只需要能正常使用，一些簡單常用指令足夠我們日常操作 Linux 了。

首先介紹一下 Linux 的目錄，因為是使用 root 賬號登錄的，所以我們登錄后的目錄是在 /root ，查詢當前所在目錄可以使用命令 pwd ，如下：

輸入命令 cd / ，進入根目錄，再輸出命令 ls ，查看根目錄下都有什麼目錄：

大致介紹下每個目錄放的都是什麼東西：

目錄	簡介
/bin	常用命令一般在這個目錄。
/boot	存放用於系統引導時使用的各種文件。
/dev	用於存放設備文件。
/etc	一般用於存放系統的管理和配置文件。
/home	存放所有用戶文件的根目錄，是用戶主目錄的基點，比如用戶user的主目錄就是/home/user，可以用~user表示。
/lib	存放跟文件系統中的程序運行所需要的共享庫及內核模塊。共享庫又叫動態鏈接共享庫，作用類似windows里的.dll文件，存放了根文件系統程序運行所需的共享文件。
/usr	用於存放系統應用程序，比較重要的目錄/usr/local 本地系統管理員軟件安裝目錄（安裝系統級的應用）。這是最龐大的目錄，要用到的應用程序和文件幾乎都在這個目錄。
/opt	額外安裝的可選應用程序包所放置的位置。
/root	超級用戶（系統管理員）的主目錄。
/var	用於存放運行時需要改變數據的文件，也是某些大文件的溢出區，比方說各種服務的日誌文件（系統啟動日誌等）等。

很多都是系統使用的目錄，我們無需關注，一般會使用到的目錄有 /etc （修改一些系統配置，如改host文件，系統環境變量等）， /usr （這裡會安裝一些應用程序），/opt （這裏其實也是安裝一些應用程序）。

簡單介紹幾個命令，有了這幾個命令，基本上我們就可以愉快的操作起來了：

cd：這個不用多講了吧，就是切換目錄。
ls：這個是查看目錄內容。
pwd：显示當前工作目錄。
mkdir：創建目錄。
vi：編輯文檔，這個命令稍微複雜一點
1. vi 文件名 ：進入一般模式（不能輸入）
2. 按下 i 從一般模式，進入到插入模式，這時可以修改文檔
3. 按下esc從插入模式，退出到一般模式，這時無法修改文檔
4. 在一般模式下，輸入:wq ，保存退出編輯；或者還可以輸入 !q 不保存編輯內容退出。
ps： 查看任務管理器： ps -ef ，例如查看 mysql 的進程，ps -ef | grep mysql 。
kill：這個就是殺進程，常用格式 kill -9 pid（進程編號），配合上面的 ps 命令一起使用，殺掉你想殺的進程。
tar：壓縮與解壓，常用解壓命令 tar -xvzf [需解壓的文件名] ，常用壓縮命令 tar -cvzf [壓縮后的文件名] [被壓縮的文件名] 。
reboot：重啟
halt：關機
rm：刪除命令，常用核彈級命令 rm -rf / ；此命令禁止在任何地方嘗試，一旦執行，將無法逆轉，含義是將跟目錄直接刪除。

下面我們來演示下如何在 CentOS 上安裝 Python3 。

因為 CentOS 本身自帶 Python ，但是版本是 Python2.7 ：

這裏我們不去管它，首先去 Python 官網找到 Python 的下載地址：

Python 官網下載鏈接：

小編這裏選擇的是截止目前最新發布的 3.8.0 版本。

這時我們切換到 xshell 的操作界面開始操作起來，首先切換至 /opt 目錄：

cd /opt

然後下載 Python3.8 的安裝包：

wget https://www.python.org/ftp/python/3.8.0/Python-3.8.0.tgz

這裏遇到新的命令 wget ，這個命令如果 CentOS 未提供，需要先進行安裝：

yum install wget

簡單介紹一下， yum 是在 Linux 中的一個包管理工具，可以進行簡單的安裝操作。

等待進度條下載完，下載完成后直接解壓：

tar -xvzf Python-3.8.0.tgz

解壓后編譯安裝：

# 創建安裝目錄
mkdir /usr/local/python3
cd Python-3.8.0
# 檢查配置
./configure --prefix=/usr/local/python3
# 編譯、安裝
make && make install
# 創建軟連接
ln -s /usr/local/python3/bin/python3 /usr/bin/python3
ln -s /usr/local/python3/bin/pip3 /usr/bin/pip3

測試安裝結果：

# 輸入
python3 -V
# 輸出
Python 3.8.0
# 輸入
pip3 -V
# 輸出
pip 19.2.3 from /usr/local/python3/lib/python3.8/site-packages/pip (python 3.8)

因為 Linux 部分功能也是依賴 Python 的，我們不覆蓋當前的 Python 命令的版本，直接創建一個新的 Python 命令 python3 。以及新的 pip 包管理命令 pip3 。

希望各位同學可以自己使用虛擬機安裝一個 CentOS 試試看，後續的部分內容將會涉及 Linux 。

本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理【其他文章推薦】

※網頁設計公司推薦更多不同的設計風格，搶佔消費者視覺第一線

※廣告預算用在刀口上，網站設計公司幫您達到更多曝光效益

※自行創業缺乏曝光? 下一步"網站設計"幫您第一時間規劃公司的門面形象

　　我於2007年參加高考，順利考入一所男女比例嚴重失調的師範大學，主修計算機科學與技術。其實高中的時候本來想選生物的，可惜報生物的人太少，就沒有開班，後面選修了化學。原計劃是想學高分子材料相關專業的，怎奈高考分數太低，沒有考上相關的大學。第二志願填寫的是計算機相關的學校，當初並不知道這個專業是編程，以為是修理電腦的。因為自家電腦老是這個那個的問題，所以就義無反顧的報考了計算機專業。填志願的時候沒有什麼偉大的理想，也沒有什麼周密的計劃，就是隨意的這麼一填，沒想到現在就靠這個吃飯了。

一、課程

1）疑惑

　　本校的這門計算機科學與技術是偏向綜合的，既要學軟件相關的知識，又要學硬件相關的知識。剛進入大一的時候，對一些課程感到疑惑，例如數學、物理、英語、模擬電路等課程，修電腦怎麼要學這些課程，後來才知道，其實我們學的不是修電腦，而是編程。

2）為分數而學習

　　由於對編程並不熱愛，因此上課其實也不是很上心，剛開始就是為了分數而學習，完全領會不到這些課程的意義。比較上心的就是C語言了，譚浩強出的那本。一開始完全沒有基礎，寫代碼很吃力，而且那時候筆記本電腦還沒普及，也很少有機會上機調試。雖然學校有機房，但離的比較遠，基本是不會去的。後面練習的多了，慢慢也就會了，應付考試是沒問題的，但寫的代碼不夠有靈性。大二學了數據結構，比較難理解，也是靠課後練習，當時純粹是應試，所以過段時間就都忘了。包括後面的網絡、離散數學、排列組合等等，都是為了考個好成績才學的。

3）學習氛圍

　　大一和大二被安排在遠離繁華都市的偏僻海邊的新校區，在這裏沒有量販KTV、沒有大型超市、沒有巨型商場。此處雖然資源有限，但是卻非常適合學習。不過，大家高中時候都學累了，進入大學后就都很放鬆。很多人喜歡去網絡文化交流中心包夜，最誇張的是隔壁班的一個同學，居然一去就是幾個月。在這種環境中，想要心無雜念的深入學習計算機真的蠻難的，況且自己也不熱愛，所以經常告訴自己學這個只是為了以後能有個混口飯吃的技能。

　　後面大三回到老校區，遇到了專升本的那幫人，他們的學習熱情與我們正好相反。他們真的是熱愛這個專業，有次放學路過，發現他們把任課老師圍了起來，正在向老師諮詢這個那個的問題，他們肯定是已經明白了學習的意義，所以才能這麼投入。

4）教授

　　我們文科學院的教授講課都非常有趣，可以用引人入勝來形容，上他們的課相對會有勁很多，尤其是歷史課，可以聽到很多故事。反觀我們理科院的教授，就不那麼有趣了，很多時候都是蠻枯燥的，上課很容易走神。他們的水平都很高，就是講課的時候很難讓我們理解，當時有一門離散數學，讓我印象深刻，大部分人都不會。課堂氛圍比較好的是操作系統課的那位老師，他講的蠻通俗的，有時候上課還能互動互動。

5）操作課

　　大二有一門網頁設計課，授課老師讓我們用Dreamwever製作一張靜態網頁，模板就是他的博客首頁，他博客的訪問量一度飆升。這門課提起了大家的興趣，都在宿舍開筆記本製作，還會對比，看誰做的相似度最高，有的人做的很不錯。看來大家還是喜歡這種能看到效果的操作課，像數據庫、數據結構那種理論課，都提不起大家的興趣。

　　大三的時候，還有一門多媒體，這門課會教點PS的內容，讓我們整天P一個胖子，摳圖啥的，大家有時候還是會有點興趣。

6）ACM

　　ACM是一項編程競賽，大一的時候，有學長過來做宣講，說拿到好名次能為以後找工作提供很大的便利，一下子就勾起了一大批人的興趣，大家爭相報名參加。因為名次的含金量高，所以這項編程競賽難度也很大。ACM考的是算法，並且他的題目都是英文的，有專門的刷題網站，很多人一看要做題目，興緻就降低了很多，後面又看到題目難度很大，有些題目有點奧數的味道，漸漸的越來越多的人選擇退出。我當時也堅持了一段時間，不過自己的數學建模能力實在太弱，最終也還是放棄了。隔壁班有個同學堅持了，還能拿到名次，畢業的時候直接進了騰訊。

二、實習

1）ERP系統

　　大三下半年輔導員給了我一個機會，讓我和一個學長一起做個校外的項目，雖然這個項目做到一半終止了，但對我的影響是很大的。當時是用的軟件編輯器是VS2005，打算做個ERP系統，學長是在英特爾上班的，他把那套成熟的軟件開發模式帶了過來。第一次使用項目管理系統readmine，第一次使用版本控制系統SVN，第一次使用C#開發系統，第一次製作一個完整的項目，第一次採集需求等各種第一次，讓我感覺自己好像已經進入了職場。每個月還能有500塊的收入，我用第一個月的收入買了塊500G的移動硬盤。不得不說，這次實習經歷，直接改變了我未來的職業規劃，促使我踏上了程序員這條道路。

2）商城系統

　　時間很快到了大四，那一年我的一個初中同學聯繫到了我，和我說他同學搞了個軟件項目，正好缺人，想讓我也加入。當時學長的那個ERP項目已經被腰斬，正好沒事，馬上就答應了。抽了一天時間，坐了很久的公交，到了他們租的一套公寓里，了解到他們想搞個商城系統，正好也是用C#開發，模仿當時的一套開源系統來做。這次的經歷讓我接觸到了前端，確切的說是JavaScript，因為CSS和HTML由團隊的另外一個成員做。與此同時，我也迷上了前端，因為在完成某個效果時，能帶給我巨大的成就感和滿足感。不過，一直到6年後，才有機會轉型成全職前端。

3）戶外旅遊網

　　商城系統團隊後面由於種種客觀原因無奈解散了，當時正好有一家戶外旅遊網在我們大學里招實習生維護公司的網站。我就報名了，學校在徐匯區，而這家公司在虹口區，兩者相距蠻遠的，地鐵都要坐一個多小時，然後下地鐵再走到公司。這家公司還有另外一個同事管網站這塊，不過他只能算半個，因為他主要管旅遊產品那塊。舊網站是用ASP開發的，我過來后老闆讓我先做點邊邊角角的事情，然後讓我開發一個和開心網類似的社交網站。這次是獨立完成了這個項目，包括數據庫設計、頁面製作、產品規劃等，我的另一篇文章《》就詳細記錄了其中的開發過程。實習期間，還拿了公司傳單在學校里發，中午的時候，在人流量最多的地方發，對自己也是一種挑戰。

三、2012年

　　轉眼四年過去了，我也畢業了。但一直到畢業的時候，還沒意識到大學四年是用來打基礎的，導致剛畢業那會兒軟件基礎很薄弱。

　　實習的那家旅遊公司也和我簽約了，但由於個人原因，我辭掉了這份工作。經一個朋友推薦，我回到了家附近，位於上海郊區，在那裡找到了一家軟件外包公司。這家公司主要給政府做PPT和網站，規模很小，全公司只有8個人，我從那離職7年多了，另外那7人還在。

　　這裏我建議剛畢業的學生有機會去規模大點的公司，還是要把握中，因為上規模的公司在組織架構、技術沉澱、規章制度等各方面都比較成熟，並且還有比較好的人脈網，社會終歸是由人組成的，你的人脈越廣，好的機會也會越多。

四、新的開始

1）面試

　　2011年9月我來到了這家小外包公司面試，我記得那天是周末，過去的時候公司里一個人都沒的。公司老闆面的我，沒涉及多少技術，就說了當前開發用的是我比較熟悉的C#語言，還介紹了一下公司的業務，主要做些和政府相關的項目，然後就讓我第二天來上班了。這裏說個很巧的事情，公司周五有個同事離職，而我過來就是替代此人的，我結婚那天才發現這個同事就是我老婆關係很近的表姐，真是無巧不成書。

　　這家公司很少加班，朝八晚五，基本到點就走，包中飯，老財務早上會去菜場買菜，然後在公司燒。活挺輕鬆的，不過就是工資太低，公積金也不交，試用期是2000一個月，轉正後也只有3500，就這樣我幹了一年半。

　　其實當時還有另外一次面試，另一個朋友推薦的，一家大公司，在上海市中心南京西路上。我面試后感覺自己能力還不夠，並且離家太遠，當時不怎麼想太折騰，於是就婉拒了他們的複試。安心的在這家小公司鍛煉，希望能快速的成長。

2）上手

　　說個題外話，剛進入這家公司的時候，我開通了個人博客，不過對自己不夠自信，怕被別人嘲諷，一直到3年後的2014年才撰寫了自己的第一篇博文。其實現在想想，平時寫點技術和項目的總結，對自己的成長會有很大的幫助。

　　剛開始給我安排的都是些遺留項目，就是簡單的改改頁面中的細節，難度不大。有一次，老闆問我壓力大不大，我很爽快的回答不大。後面讓我獨立的完成一些項目，總體來說沒有什麼大難度。政府項目都比較有規律，後台的模塊大部分都能套用，前台的頁面只是換個皮膚，大框架也比較類似。不過，這段時間對CSS、HTML和JavaScript有了新的認識，公司真正意義上的開發除了我就是另外一個同事，因此很多時候做特效都得自己想辦法解決。這段時間搜索引擎發揮了巨大的作用，公司有段時間不能上百度，google又上不去，就改用了Bing，搜索質量感覺比百度要好一點。

3）挑戰

　　要說這段時間比較有挑戰的項目應該就是一個重陽節登高的報名活動，就是個表單頁面，然後填手機號、姓名等信息，最後返回一個報名號給用戶。這個頁面的併發量比較高，5000個報名量基本在兩三個小時內就能全部搶完，對於我這個菜鳥來說，要處理這並不算高的併發還是有點挑戰的。我清晰的記得上線前的一天晚上輾轉反側，很擔心會出大事故，像頁面打不開、報錯等等，因為這邊沒有專業的測試，全憑自己測試，這就很難保證質量。還好，沒出大事故，但還是出現了兩個或多個領到了同一個報名號的問題，最後另外兩個同事一個個的打電話通知他們，換了新號碼給他們，這件事就算這麼過去了。

　　活動上線后的第二天，和別人聊天的時候，他正好提到了這個活動，我跟他說這個活動我做的，還是蠻自豪的。

4）跑客戶

　　外包公司免不了要跑到客戶那邊去，了解需求或修改BUG。有些客戶就在附近，走過去就行，有些就比較遠了，不僅如此，遇到颳風下雨烈日的天氣，還得跑出去，日晒雨淋的還是蠻苦的。

　　有一次蠻坑的，跑到長寧區，基本一個下午就沒了，背個電腦過去，然後發現是他們Excel模板用的不對，只能呵呵了，再跑回來，基本已經快到五點下班時間了，一天就沒了。還有一次跑到太倉去，老闆想開發新客戶，然後當天開車來回，有時候回公司已經六七點了。我運氣比較好，遇到的客戶都是蠻客氣的，也很配合，聽說太倉那個客戶，後面有個老頭總是刁難我們。

5）離職

　　我離職的主要原因還是工資的問題，實在太低，後面有個朋友找我，他那邊在創業，有個很好的項目，讓我過去幫忙，工資還開雙倍，我馬上就答應了。這個時候是2012年的12月份，馬上要過年了，雖然有點年終獎，但很少，所以也就不在意了。

　　與公司同事相處的還是很融洽的，他們也都很理解我，我在離職前特地請大家去吃了頓小肥羊火鍋，算是散夥飯。今年技術有所提升，人際關係的處理上也愈加成熟。

五、兼職

　　這家公司的活蠻輕鬆的，上家實習的旅遊公司又不想再去外面招人，就找到了我，讓我兼職乾著，每個月給個固定的2000元。

1）職能

　　主要就是維護網站，其中最忙的是兩次改版。尤其是2011年的12月份，我晚上下班后改頁面，周末去虹口和公司的人對需求，對頁面，那段時間非常的辛苦。當時很年輕，也不覺得，只感覺自己的生活很充實。但有時候，我白天上班的時候旅遊網出了問題，就只能遠程修改一下了。有一次最嚴重，周五的時候，頁面打不開了，下午就請假，直接打了200多的車過去，然後周末就一直在那邊改代碼。現在讓我做兼職我肯定是不願意的。

本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理【其他文章推薦】

※帶您來了解什麼是 USB CONNECTOR ?

※自行創業缺乏曝光? 下一步"網站設計"幫您第一時間規劃公司的門面形象

※如何讓商品強力曝光呢? 網頁設計公司幫您建置最吸引人的網站，提高曝光率!!

※綠能、環保無空污,成為電動車最新代名詞，目前市場使用率逐漸普及化

※廣告預算用在刀口上，網站設計公司幫您達到更多曝光效益

神奇的 SQL 之 MySQL 性能分析神器 → EXPLAIN，SQL 起飛的基石！

2020-02-102020-02-10 admin

前言

　　開心一刻

　　　　某人養了一頭豬，煩了想放生，可是豬認識回家的路，放生幾次它都自己回來了。一日，這個人想了個狠辦法，開車帶着豬轉了好多路進山區放生，放生后又各種打轉，然後掏出電話給家裡人打了個電話，問道：“豬回去了嗎？”，家裡人：“早回來了，你在哪了，怎麼還沒回來？”，他大怒道：“讓它來接我，我特么迷路了！！！”

還不如我了

背景

　　某一天，樓主打完上班卡，坐在工位逛園子的時候，右下角的 QQ 閃了起來，而且還是個美女頭像！我又驚又喜，腦中閃過我所認識的可能聯繫我的女性，得出個結論：她們這會不可能聯繫我呀，圖像也沒映象，到底是誰了？打開聊天窗口聊了起來

　　她：您好，我是公司客服某某某，請問 xxx後台是您負責的嗎？

　　我：您好，是我負責的，有什麼問題嗎？

　　她：我發現 xxx 頁面點查詢后，一直是加載中… ，數據一直出不來，能幫忙看看嗎？

　　我：是不是您的姿勢不對？

　　她：我就 xxx，然後點查詢

　　我：騷等下，我試試，確實有點慢，很長時間才能出來

　　她：是的，太慢了，出不來，都急死我了，能快點嗎？

　　我：肯定能、必須能！您覺得什麼速度讓您覺得最舒服？

　　她：越快越好吧

　　我：呃…，是嗎，我先看看是什麼問題，處理好了告訴您，保證讓您覺得舒服！

　　她：好的，謝謝！

　　公司沒有專門的搜索服務，都是直接從 MySQL 查詢，做簡單的數據處理后返回給頁面，慢的原因肯定就是 SQL 查詢了。找到對應的查詢 SQL ，就是兩個表的聯表查詢，連接鍵也有索引，WHERE 條件也能走索引，怎麼會慢了？然後我用 EXPLAIN 看了下這條 SQL 的執行計劃，找到了慢的原因，具體原因後面揭曉（誰讓你不是豬腳！）

EXPLAIN 是什麼

　　它是 MySQL 的一個命令，用來查看 SQL 的執行計劃（SQL 如何執行），根據其輸出結果，我們能夠知道以下信息：表的讀取順序，數據讀取類型，哪些索引可以使用，哪些索引實際使用了，表之間的連接類型，每張表有多少行被優化器查詢等信息，根據這些信息，我們可以找出 SQL 慢的原因，並做針對性的優化

　　MySQL 5.6 之前的版本，EXPLAIN 只能用於查看 SELECT 的執行計劃，而從 MySQL 5.6 開始，可以查看 SELECT 、 DELETE 、 INSERT 、 REPLACE 和 UPDATE 的執行計劃，這可不是我瞎掰，不信的可以去 MySQL 的官網查看：

　　EXPLAIN 使用方式非常簡單，簡單的你都不敢相信，就是在我們常寫的 SELECT 、 DELETE 、 INSERT 、 REPLACE 和 UPDATE 語句之前加上 EXPLAIN 即可

EXPLAIN SELECT * FROM mysql.`user`;

EXPLAIN DELETE FROM t_user WHERE user_name = '123';

　　莫看 EXPLAIN 短，但它胖呀

雖然有點嬰兒肥，但也掩不住我逼人的帥氣！

　　雖然 EXPLAIN 使用起來非常簡單，但它的輸出結果中信息量非常大，雖然我胖，但我肚中有貨呀！

環境和數據準備

　　MySQL 版本是 5.7.2 ，存儲引擎是 InnoDB

-- 查看 MySQL 版本
SELECT VERSION();

-- MySQL 提供什麼存儲引擎
SHOW ENGINES;

-- 查看默認存儲引擎
SHOW VARIABLES LIKE '%storage_engine%';

　　準備兩張表：用戶表 tbl_user 和用戶登錄記錄表 tbl_user_login_log ，並初始化部分部分數據

-- 表創建與數據初始化
DROP TABLE IF EXISTS tbl_user;
CREATE TABLE tbl_user (
  id INT(11) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '自增主鍵',
  user_name VARCHAR(50) NOT NULL COMMENT '用戶名',
  sex TINYINT(1) NOT NULL COMMENT '性別, 1:男，0:女',
  create_time datetime NOT NULL COMMENT '創建時間',
  update_time datetime NOT NULL COMMENT '更新時間',
    remark VARCHAR(255) NOT NULL DEFAULT '' COMMENT '備註',
  PRIMARY KEY (id)
) COMMENT='用戶表';

DROP TABLE IF EXISTS tbl_user_login_log;
CREATE TABLE tbl_user_login_log (
  id INT(11) UNSIGNED NOT NULL AUTO_INCREMENT COMMENT '自增主鍵',
  user_name VARCHAR(50) NOT NULL COMMENT '用戶名',
  ip VARCHAR(15) NOT NULL COMMENT '登錄IP',
  client TINYINT(1) NOT NULL COMMENT '登錄端, 1:android, 2:ios, 3:PC, 4:H5',
  create_time datetime NOT NULL COMMENT '創建時間',
  PRIMARY KEY (id)
) COMMENT='登錄日誌';
INSERT INTO tbl_user(user_name,sex,create_time,update_time,remark) VALUES
('何天香',1,NOW(), NOW(),'朗眉星目，一表人材'),
('薛沉香',0,NOW(), NOW(),'天星樓的總樓主薛搖紅的女兒，也是天星樓的少總樓主，體態豐盈，烏髮飄逸，指若春蔥，袖臂如玉，風姿卓然，高貴典雅，人稱“天星絕香”的武林第一大美女'),
('慕容蘭娟',0,NOW(), NOW(),'武林東南西北四大世家之北世家慕容長明的獨生女兒，生得玲瓏剔透，粉雕玉琢，脾氣卻是剛烈無比，又喜着火紅，所以人送綽號“火鳳凰”，是除天星樓薛沉香之外的武林第二大美女'),
('萇婷',0,NOW(), NOW(),'當今皇上最寵愛的侄女，北王府的郡主，腰肢纖細，遍體羅綺，眉若墨畫，唇點櫻紅；雖無沉香之雅重，蘭娟之熱烈，卻別現出一種空靈'),
('柳含姻',0,NOW(), NOW(),'武林四絕之一的添愁仙子董婉婉的徒弟，體態窈窕，姿容秀麗，真箇是秋水為神玉為骨，芙蓉如面柳如腰，眉若墨畫，唇若點櫻，不弱西子半分，更勝玉環一籌; 搖紅樓、聽雨軒，琵琶一曲值千金!'),
('李凝雪',0,NOW(), NOW(),'李相國的女兒，神采奕奕，英姿颯爽，愛憎分明'),
('周遺夢',0,NOW(), NOW(),'音神傳人，湘妃竹琴的擁有者，雲髻高盤，穿了一身黑色蟬翼紗衫，愈覺得冰肌玉骨，粉面櫻唇，格外嬌艷動人'),
('恭弘=叶 恭弘留痕',0,NOW(), NOW(),'聖域聖女，膚白如雪，白衣飄飄，宛如仙女一般，微笑中帶着說不出的柔和之美'),
('郭疏影',0,NOW(), NOW(),'揚灰右使的徒弟，秀髮細眉，玉肌豐滑，嬌潤脫俗'),
('鍾鈞天',0,NOW(), NOW(),'天界，玄天九部 - 鈞天部的部主，超凡脫俗，仙氣逼人'),
('王雁雲',0,NOW(), NOW(),'塵緣山莊二小姐，刁蠻任性'),
('許侍霜',0,NOW(), NOW(),'藥王穀穀主女兒，醫術高明'),
('馮黯凝',0,NOW(), NOW(),'桃花門門主，嬌艷如火，千嬌百媚');
INSERT INTO tbl_user_login_log(user_name, ip, client, create_time) VALUES
('薛沉香', '10.53.56.78',2, '2019-10-12 12:23:45'),
('萇婷', '10.53.56.78',2, '2019-10-12 22:23:45'),
('慕容蘭娟', '10.53.56.12',1, '2018-08-12 22:23:45'),
('何天香', '10.53.56.12',1, '2019-10-19 10:23:45'),
('柳含姻', '198.11.132.198',2, '2018-05-12 22:23:45'),
('馮黯凝', '198.11.132.198',2, '2018-11-11 22:23:45'),
('周遺夢', '198.11.132.198',2, '2019-06-18 22:23:45'),
('郭疏影', '220.181.38.148',3, '2019-10-21 09:45:56'),
('薛沉香', '220.181.38.148',3, '2019-10-26 22:23:45'),
('萇婷', '104.69.160.60',4, '2019-10-12 10:23:45'),
('王雁雲', '104.69.160.61',4, '2019-10-16 20:23:45'),
('李凝雪', '104.69.160.62',4, '2019-10-17 20:23:45'),
('許侍霜', '104.69.160.63',4, '2019-10-18 20:23:45'),
('恭弘=叶 恭弘留痕', '104.69.160.64',4, '2019-10-19 20:23:45'),
('王雁雲', '104.69.160.65',4, '2019-10-20 20:23:45'),
('恭弘=叶 恭弘留痕', '104.69.160.66',4, '2019-10-21 20:23:45');

SELECT * FROM tbl_user;
SELECT * FROM tbl_user_login_log;

View Code

EXPLAIN 輸出格式概覽

　　樓主再不講重點，估計有些看官老爺找他的 2 米長的大砍刀去了

　　這麼滴，我們先來看看 EXPLAIN 輸出結果的大概，是不是長得滿臉麻子，讓我們望而生畏 ?

　　白白凈凈的，挺好，關鍵長啊！解釋如下

EXPLAIN 輸出格式詳解

　　EXPLAIN 的輸出字段雖然有點多，但常關注的就那麼幾個，但樓主秉着負責的態度，都給大家講一下，需要重點關注的字段，樓主也會標明滴

　　EXPLAIN 支持的 SQL 語句有好幾種，但工作中用的最多的還是 SELECT ，所以樓主就偷個懶，以 SELECT 來講解 EXPLAIN，有興趣的老爺去試試其他的

　　id

　　　　輸出的是整數，用來標識整個 SQL 的執行順序。id 如果相同，從上往下依次執行id不同；id 值越大，執行優先級越高，越先被執行；如果行引用其他行的並集結果，則該值可以為NULL

　　　　不重要，有所了解就好（其實非常簡單，看一遍基本就能記住了）

　　select_type

　　　　查詢的類型，說明如下

　　　　簡單幫大家翻譯一下（有能力的去讀官網，畢竟那是原配，最具權威性）

　　　　SIMPLE：簡單的 SELECT 查詢，沒有 UNION 或者子查詢，包括單表查詢或者多表 JOIN 查詢

　　　　PRIMARY：最外層的 select 查詢，常見於子查詢或 UNION 查詢，最外層的查詢被標識為 PRIMARY

　　　　UNION：UNION 操作的第二個或之後的 SELECT，不依賴於外部查詢的結果集（外部查詢指的就是 PRIMARY 對應的 SELECT）

　　　　DEPENDENT UNION：UNION 操作的第二個或之後的 SELECT，依賴於外部查詢的結果集

　　　　UNION RESULT：UNION 的結果（如果是 UNION ALL 則無此結果）

　　　　SUBQUERY：子查詢中的第一個 SELECT 查詢，不依賴於外部查詢的結果集

　　　　DEPENDENT SUBQUERY：子查詢中的第一個select查詢，依賴於外部查詢的結果集

　　　　DERIVED：派生表（臨時表），常見於 FROM 子句中有子查詢的情況

　　　　　　注意：MySQL5.7 中對 Derived table 做了一個新特性，該特性允許將符合條件的 Derived table 中的子表與父查詢的表合併進行直接JOIN，從而簡化簡化了執行計劃，同時也提高了執行效率；默認情況下，MySQL5.7 中這個特性是開啟的，所以默認情況下，上面的 SQL 的執行計劃應該是這樣的

　　　　　　可通過 SET SESSION optimizer_switch=‘derived_merge=on|off‘ 來開啟或關閉當前 SESSION 的該特性。貌似扯的有點遠了（樓主你是不是在隨性發揮？），更多詳情可以去查閱

　　　　MATERIALIZED：被物化的子查詢，MySQL5.6 引入的一種新的 select_type，主要是優化 FROM 或 IN 子句中的子查詢，更多詳情請查看：

　　　　UNCACHEABLE SUBQUERY：對於外層的主表，子查詢不可被緩存，每次都需要計算

　　　　UNCACHEABLE UNION：類似於 UNCACHEABLE SUBQUERY，只是出現在 UNION 操作中

　　　　SIMPLLE、PRIMARY、SUBQUERY、DERIVED 這 4 個在實際工作中碰到的會比較多，看得懂這 4 個就行了，至於其他的，碰到了再去查資料就好了（我也想全部記住，但用的少，太容易忘記了，我也很無賴呀）

　　table

　　　　显示了對應行正在訪問哪個表(有別名就显示別名)，還會有 <union2,3> 、 <subquery2> 、 <derived2> （這裏的 2,3、2、2 指的是 id 列的值）類似的值，具體可以往上看，這裏就不演示了（再演示就太長了，你們都看不下去了，那我不是白忙乎了 ?）

　　partitions

　　　　查詢進行匹配的分區，對於非分區表，該值為NULL。大多數情況下用不到分區，所以這一列我們無需關注

　　type

　　　　關聯類型或者訪問類型，它指明了 MySQL 決定如何查找表中符合條件的行，這是我們判斷查詢是否高效的重要依據（type 之於 EXPLAIN，就好比三圍之於女人！），完整介紹請看：

　　　　其值有多種，我們以性能好到性能差的順序一個一個來看　　　　　

　　　　system

　　　　　　該表只有一行（=系統表），是 const 類型的特例
　　　　const

　　　　　　確定只有一行匹配的時候，mysql 優化器會在查詢前讀取它並且只讀取一次，速度非常快。用於 primary key 或 unique 索引中有常亮值比較的情形

　　　　eq_ref

　　　　　　對於每個來自於前面的表的行，從該表最多只返回一條符合條件的記錄。當連接使用的索引是 PRIMARY KEY 或 UNIQUE NOT NULL 索引時使用，非常高效

　　　　ref

　　　　　　索引訪問，也稱索引查找，它返回所有匹配某個單個值的行。此類型通常出現在多表的 JOIN 查詢, 針對於非 UNIQUE 或非 PRIMARY KEY, 或者是使用了最左前綴規則索引的查詢，換句話說，如果 JOIN 不能基於關鍵字選擇單個行的話，則使用ref

　　　　fulltext

　　　　　　當使用全文索引時會用到，這種索引一般用不到，會用專門的搜索服務(solr、elasticsearch等)來替代
　　　　ref_or_null

　　　　　　類似ref，但是添加了可以專門搜索 NULL 的行

　　　　　　這個是有前提條件的，前提為 weapon 列有索引，且 weapon 列存在 NULL

　　　　index_merge

　　　　　　該訪問類型使用了索引合併優化方法

　　　　　　這個同樣也是有條件的， id 列和 weapon 列都有單列索引。如果出現 index_merge，並且這類 SQL 後期使用較頻繁，可以考慮把單列索引換為組合索引，這樣效率更高

　　　　unique_subquery

　　　　　　類似於兩表連接中被驅動表的 eq_ref 訪問方式，unique_subquery 是針對在一些包含 IN 子查詢的查詢語句中，如果查詢優化器決定將 IN 子查詢轉換為 EXISTS 子查詢，而且子查詢可以使用到主鍵或者唯一索引進行等值匹配時，則會使用 unique_subquery

　　　　index_subquery

　　　　　　index_subquery 與 unique_subquery類似，只不過訪問子查詢中的表時使用的是普通的索引

　　　　range

　　　　　　使用索引來檢索給定範圍的行，當使用 =、<>、>、>=、<、<=、IS NULL、<=>、BETWEEN 或者 IN 操作符，用常量比較關鍵字列時，則會使用 rang

　　　　　　前提是必須基於索引，也就是 id 上必須有索引

　　　　index

　　　　　　當我們可以使用索引覆蓋，但需要掃描全部的索引記錄時，則會使用 index；進行統計時非常常見

　　　　ALL

　　　　　　我們熟悉的全表掃描

　　possible_keys

　　　　展示在這個 SQL 中，可能用到的索引有哪些，但不一定在查詢時使用。若為空則表示沒有可以使用的索引，此時可以通過檢查 WHERE 語句看是否可以引用某些列或者新建索引來提高性能

　　key

　　　　展示這個 SQL 實際使用的索引，如果沒有選擇索引，則此列為null，要想強制 MySQL 使用或忽視 possible_keys 列中的索引，在查詢中使用 FORCE INDEX、USE INDEX 或者I GNORE INDEX

　　key_len

　　　　展示 MySQL 決定使用的鍵長度（字節數）。如果 key 是 NULL，則長度為 NULL。在不損失精確性的情況下，長度越短越好

　　ref

　　　　展示的是與索引列作等值匹配的東東是個啥，比如只是一個常數或者是某個列。它显示的列的名字（或const），此列多數時候為 Null

　　rows

　　　　展示的是 mysql 解析器認為執行此 SQL 時預計需要掃描的行數。此數值為一個預估值，不是具體值，通常比實際值小

　　filtered

　　　　展示的是返回結果的行數所佔需要讀到的行（rows 的值）的比例，當然是越小越好啦

　　extra

　　　　表示不在其他列但也很重要的額外信息。取值有很多，我們挑一些比較常見的過一下

　　　　using index

　　　　　　表示 SQL 使用了使用覆蓋索引，而不用回表去查詢數據，性能非常不錯

　　　　using where

　　　　　　表示存儲引擎搜到記錄後進行了後過濾(POST-FILTER)，如果查詢未能使用索引，using where 的作用只是提醒我們 mysql 要用 where 條件過濾結果集

　　　　using temporary

　　　　　　表示 mysql 需要使用臨時表來存儲結果集，常見於排序和分組查詢

　　　　using filesort

　　　　　　表示 mysql 無法利用索引直接完成排序（排序的字段不是索引字段），此時會用到緩衝空間（內存或者磁盤）來進行排序；一般出現該值，則表示 SQL 要進行優化了，它對 CPU 的消耗是比較大的

　　　　impossible where

　　　　　　查詢語句的WHERE子句永遠為 FALSE 時將會提示該額外信息

　　　　當然還有其他的，不常見，等碰到了大家再去查吧（現在凌晨 1 點，我實在是太困了！）

總結

　　1、背景疑問

　　　　還記得客服小姐姐的問題嗎，她嫌我們太慢，具體原因下篇再詳細介紹，這裏就提一下：連表查詢的連接鍵類型不一致，一個 INT 類型，一個 VARCHAR 類型，導致 type 是 ALL（這誰設計的呀，坑死人呀！難道是我？）

　　2、思維導圖

　　　　本來是想自己畫個思維導圖的，可上網一搜，發現了一個人家畫好了的思維導圖，我就偷個懶借用下：，裏面描述的很詳細，同時也包括了各種示例，真香！

　　3、肚中精華

　　　　EXPLAIN 的輸出內容很多，我們沒必要全部掌握，重點我已經幫大家划好

　　　　type，就像 RMB 一樣重要

　　　　key，也像 RMB 一樣重要

　　　　extra，還像 RMB 一樣重要

　　　　說白了還是 RMB 最重要，不是，我的意思是 type、key、extra 都很重要，其他的用到了再去買吧

　　4、示例代碼

本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理【其他文章推薦】

※USB CONNECTOR掌控什麼技術要點? 帶您認識其相關發展及效能

※評比前十大台北網頁設計、台北網站設計公司知名案例作品心得分享

※智慧手機時代的來臨，RWD網頁設計已成為網頁設計推薦首選

Docker從入門到掉坑(三)：容器太多，操作好麻煩

2020-02-072020-02-07 admin

前邊的兩篇文章裏面，我們講解了基於docker來部署基礎的SpringBoot容器，如果閱讀本文之前沒有相關基礎的話，可以回看之前的教程。

不知道大家在初次使用docker的時候是否有遇到這種場景，每次部署微服務都是需要執行docker run xxx,docker kill xxx 等命令來操作容器。假設說一個系統中依賴了多個docker容器，那麼對於每個docker容器的部署豈不是都需要手動編寫命令來啟動和關閉，這樣做就會增加運維人員的開發工作量，同時也容易出錯。

Docker Compose 編排技術

在前邊的文章中，我們講解了Docker容器化技術的發展，但是隨着我們的Docker越來越多的時候，對於容器的管理也是特別麻煩，因此Docker Compose技術也就誕生了。

Docker Compose技術是通過一份文件來定義和運行一系列複雜應用的Docker工具，通過Docker-compose文件來啟動多個容器，網上有很多關於Docker-compose的實戰案例，但是都會有些細節地方有所遺漏，所以下邊我將通過一個簡單的案例一步步地帶各位從淺入深地對Docker-compose進行學習。

基於Docker Compose來進行對SpringBoot微服務應用的打包集成

我們還是按照老樣子來構建一套基礎的SpringBoot微服務項目，首先我們來看看基礎版本的項目結構：

首先是我們pom文件的配置內容：

<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
         xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
         xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
    <modelVersion>4.0.0</modelVersion>

    <groupId>com.sise.idea</groupId>
    <artifactId>springboot-docker</artifactId>
    <version>1.0-SNAPSHOT</version>
    <packaging>jar</packaging>

    <name>spring-boot-docker</name>
    <url>http://maven.apache.org</url>

    <parent>
        <groupId>org.springframework.boot</groupId>
        <artifactId>spring-boot-starter-parent</artifactId>
        <version>2.0.3.RELEASE</version>
    </parent>

    <properties>
        <project.build.sourceEncoding>UTF-8</project.build.sourceEncoding>
    </properties>

    <dependencies>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-web</artifactId>
        </dependency>
        <dependency>
            <groupId>org.projectlombok</groupId>
            <artifactId>lombok</artifactId>
            <version>1.16.18</version>
        </dependency>
    </dependencies>

    <build>
        <finalName>springboot-docker</finalName>
        <plugins>
            <plugin>
                <groupId>org.springframework.boot</groupId>
                <artifactId>spring-boot-maven-plugin</artifactId>
            </plugin>
            <plugin>
                <groupId>org.apache.maven.plugins</groupId>
                <artifactId>maven-compiler-plugin</artifactId>
                <configuration>
                    <source>1.8</source>
                    <target>1.8</target>
                </configuration>
            </plugin>
        </plugins>
    </build>
</project>

然後是java程序的內容代碼，這裏面有常規的controller，application類，代碼如下所示：

啟動類Application

package com.sise.docker;

import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;

/**
 * @author idea
 * @data 2019/11/20
 */
@SpringBootApplication
public class Application {

    public static void main(String[] args) {
        SpringApplication.run(Application.class);
    }
}

控制器 DockerController

package com.sise.docker.controller;

import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

/**
 * @author idea
 * @data 2019/11/20
 */
@RestController
@RequestMapping(value = "/docker")
public class DockerController {


    @GetMapping(value = "/test")
    public String test(){
        System.out.println("=========docker test=========");
        return "this is docker test";
    }
}

yml配置文件：

server:
  port: 7089

接下來便是docker-compose打包時候要用到的配置文件了。這裏採用的方式通常都是針對必要的docker容器編寫一份dockerfile，然後統一由Docker Compose進行打包管理，假設我們的微服務中需要引用到了MySQL,MongoDB等應用，那麼整體架構如下圖所示：

那麼我們先從簡單的單個容器入手，看看該如何對SpringBoot做Docker Compose的管理，下邊是一份打包SpringBoot進入Docker容器的Dockerfile文件：

#需要依賴的其他鏡像
FROM openjdk:8-jdk-alpine
# Spring Boot應用程序為Tomcat創建的默認工作目錄。作用是在你的主機”/var/lib/docker”目錄下創建一個臨時的文件，並且鏈接到容器中#的”/tmp”目錄。
VOLUME /tmp

#是指將原先的src文件 添加到我們需要打包的鏡像裏面
ADD target/springboot-docker.jar app.jar

#設置鏡像的時區,避免出現8小時的誤差
ENV TZ=Asia/Shanghai

#容器暴露的端口號 和SpringBoot的yml文件暴露的端口號要一致
EXPOSE 7089

#輸入的啟動參數內容 下邊這段內容相當於運行了java -Xms256m -Xmx512m -jar app.jar 
ENTRYPOINT ["java","-Xms256m","-Xmx512m","-jar","app.jar"]

接着便是加入docker-compose.yml文件的環節了,下邊是腳本的內容：

#docker引擎對應所支持的docker-compose文本格式
version: '3'
services:

  #服務的名稱
  springboot-docker:
    build:
      context: .
      # 構建這個容器時所需要使用的dockerfile文件
      dockerfile: springboot-dockerfile
    ports:
      # docker容器和宿主機之間的端口映射
      - "7089:7089"

docker-compose.ym配置文件有着特殊的規則，通常我們都是先定義version版本號，然後便是列舉一系列與容器相關的services內容。

接下來將這份docker服務進行打包，部署到相關的linux服務器上邊，這裏我採用的是一台阿里雲上邊購買的服務器來演示。

目前該文件還沒有進行打包處理，所以沒有target目錄，因此dockerfile文件構建的時候是不會成功的，因此需要先進行mvn的打包：

mvn package

接着便是進行Docker-Compose命令的輸入了：

[root@izwz9ic9ggky8kub9x1ptuz springboot-docker]# docker-compose up -d
Starting springboot-docker_springboot-docker_1 ... done
[root@izwz9ic9ggky8kub9x1ptuz springboot-docker]#

你會發現這次輸入的命令和之前教程中提及的docker指令有些出入，變成了docker-compose 指令，這條指令是專門針對Docker compose文件所設計的，加入了一個-d的參數用於表示後台運行該容器。由於我們的docker-compose文件中知識編寫了對於SpringBoot容器的打包，因此啟動的時候只會显示一個docker容器。

為了驗證docker-compose指令是否生效，我們可以通過docker–compose ps命令來進行驗證。

這裏邊我們使用 docker logs [容器id] 指令可以進入容器查看日誌的打印情況：

docker logs ad83c82b014d

最後我們通過請求之前寫好的接口便會看到相關的響應：

基礎版本的SpringBoot+Docker compose案例已經搭建好了，還記得我在開頭畫的那張圖片嗎：

通常在實際開發中，我們所面對的docker容器並不是那麼的簡單，還有可能會依賴到多個容器，那麼這個時候該如何來編寫docker compose文件呢？

下邊我們對原先的SpringBoot項目增加對於MySQL和MongoDB的依賴,為了方便下邊的場景模擬，這裏我們增加兩個實體類：

用戶類

package com.sise.docker.domain;

import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;

/**
 * @author idea
 * @data 2019/11/23
 */
@AllArgsConstructor
@NoArgsConstructor
@Data
public class User {

    private Integer id;

    private String username;
}

汽車類：

package com.sise.docker.domain;

import lombok.AllArgsConstructor;
import lombok.Data;
import lombok.NoArgsConstructor;
import org.springframework.data.annotation.Id;

/**
 * @author idea
 * @data 2019/11/23
 */
@Data
@AllArgsConstructor
@NoArgsConstructor
public class Car {

    @Id
    private Integer id;

    private String number;
}

增加對於mongodb，mysql的pom依賴內容

 <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-data-mongodb</artifactId>
        </dependency>
        <dependency>
            <groupId>org.springframework.boot</groupId>
            <artifactId>spring-boot-starter-jdbc</artifactId>
        </dependency>
        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <version>5.1.21</version>
        </dependency>

編寫相關的dao層：

package com.sise.docker.dao;

import com.sise.docker.domain.Car;
import org.springframework.data.mongodb.repository.MongoRepository;
import org.springframework.stereotype.Repository;

/**
 * @author idea
 * @data 2019/11/23
 */
@Repository
public interface CarDao extends MongoRepository<Car, Integer> {
}
 

package com.sise.docker.dao;

import com.sise.docker.domain.User;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.jdbc.core.JdbcTemplate;
import org.springframework.jdbc.core.RowMapper;
import org.springframework.stereotype.Repository;

import java.sql.ResultSet;
import java.sql.SQLException;

/**
 * @author idea
 * @data 2019/11/23
 */
@Repository
public class UserDao {

    @Autowired
    private JdbcTemplate jdbcTemplate;


    public void insert() {
        String time = String.valueOf(System.currentTimeMillis());
        String sql = "insert into t_user (username) values ('idea-" + time + "')";
        jdbcTemplate.update(sql);
        System.out.println("==========執行插入語句==========");
    }

    class UserMapper implements RowMapper<User> {

        @Override
        public User mapRow(ResultSet resultSet, int i) throws SQLException {
            User unitPO = new User();
            unitPO.setId(resultSet.getInt("id"));
            unitPO.setUsername(resultSet.getString("username"));
            return unitPO;
        }
    }
}

在控制器中添加相關的函數入口：

package com.sise.docker.controller;

import com.sise.docker.dao.CarDao;
import com.sise.docker.dao.UserDao;
import com.sise.docker.domain.Car;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RestController;

import java.util.Random;

/**
 * @author idea
 * @data 2019/11/20
 */
@RestController
@RequestMapping(value = "/docker")
public class DockerController {

    @Autowired
    private UserDao userDao;
    @Autowired
    private CarDao carDao;

    @GetMapping(value = "/insert-mongodb")
    public String insertMongoDB() {
        Car car = new Car();
        car.setId(new Random().nextInt(15000000));
        String number = String.valueOf(System.currentTimeMillis());
        car.setNumber(number);
        carDao.save(car);
        return "this is insert-mongodb";
    }

    @GetMapping(value = "/insert-mysql")
    public String insertMySQL() {
        userDao.insert();
        return "this is insert-mysql";
    }

    @GetMapping(value = "/test2")
    public String test() {
        System.out.println("=========docker test222=========");
        return "this is docker test";
    }
}

對原先的docker-compose.yml文件添加相應的內容，主要是增加對於mongodb和mysql的依賴模塊，

#docker引擎對應所支持的docker-compose文本格式
version: '3'
services:

  #服務的名稱
  springboot-docker:
    container_name: docker-springboot
    build:
      context: .
      dockerfile: springboot-dockerfile
    ports:
      - "7089:7089"

    depends_on:
      - mongodb


  mongodb:
    #容器的名稱
    container_name: docker-mongodb
    image: daocloud.io/library/mongo:latest
    ports:
      - "27017:27017"

  mysql:
    #鏡像的版本
    image: mysql:5.7
    container_name: docker-mysql
    ports:
      - 3309:3306
    environment:
       MYSQL_DATABASE: test
       MYSQL_ROOT_PASSWORD: root
       MYSQL_ROOT_USER: root
       MYSQL_ROOT_HOST: '%'

這裏頭我嘗試將application.yml文件通過不同的profile來進行區分：

應上篇文章中有讀者問到，不同環境不同配置的指定問題，這裡有一種思路，springboot依舊保持原有的按照profile來識別不同環境的配置，具體打包之後讀取的配置，可以通過springboot-dockerfile這份文件的ENTRYPOINT 參數來指定，例如下邊這種格式：

FROM openjdk:8-jdk-alpine

VOLUME /tmp

ADD target/springboot-docker.jar springboot-docker.jar

#設置鏡像的時區,避免出現8小時的誤差
ENV TZ=Asia/Shanghai

EXPOSE 7089
#這裏可以通過-D參數在對jar打包運行的時候指定需要讀取的配置問題
ENTRYPOINT ["java","-Xms256m","-Xmx512m","-Dspring.profiles.active=prod","-jar","springboot-docker.jar"]

最後便是我們的yml配置文件內容，由於配置類docker容器的依賴，所以這裏面對於yml的寫法不再是通過ip來訪問相應的數據庫了，而是需要通過service-name的映射來達成目標。

application-prod.yml

server:
  port: 7089

spring:
    data:
      mongodb:
        uri: mongodb://mongodb:27017
        database: test

    datasource:
             driver-class-name: com.mysql.jdbc.Driver
             url: jdbc:mysql://mysql:3306/test?useUnicode=true&amp;characterEncoding=UTF-8
             username: root
             password: root

當相關的代碼和文件都整理好了之後，將這份代碼發送到服務器上進行打包。

mvn package

接着我們便可以進行docker-compose的啟動了。

這裡有個小坑需要注意一下，由於之前我們已經對單獨的springboot容器進行過打包了，所以在執行docker-compose up指令的時候會優先使用已有的容器，而不是重新創建容器。

這個時候需要先將原先的image鏡像進行手動刪除，再打包操作：

[root@izwz9ic9ggky8kub9x1ptuz springboot-docker]# docker images
REPOSITORY                                           TAG                 IMAGE ID            CREATED             SIZE
springboot-docker                  latest              86f32bd9257f        4 hours ago         128MB
<none>                                               <none>              411616c3d7f7        2 days ago          679MB
<none>                                               <none>              77044e3ad9c2        2 days ago          679MB
<none>                                               <none>              5d9328dd1aca        2 days ago          679MB
springbootmongodocker_springappserver                latest              36237acf08e1        3 days ago          695MB

刪除鏡像的命令：

docker rmi 【鏡像id】

此時再重新進行docker-compose指令的打包操作即可：

docker-compose up

啟動之後，可以通過docker-compose自帶的一些指令來進行操作，常用的一些指令我都歸納在了下邊：

docker-compose [Command]

Commands:
  build              構建或重建服務
  bundle             從compose配置文件中產生一個docker綁定
  config             驗證並查看compose配置文件
  create             創建服務
  down               停止並移除容器、網絡、鏡像和數據卷
  events             從容器中接收實時的事件
  exec               在一個運行中的容器上執行一個命令
  help               獲取命令的幫助信息
  images             列出所有鏡像
  kill               通過發送SIGKILL信號來停止指定服務的容器
  logs               從容器中查看服務日誌輸出
  pause              暫停服務
  port               打印綁定的公共端口
  ps                 列出所有運行中的容器
  pull               拉取並下載指定服務鏡像
  push               Push service images
  restart            重啟YAML文件中定義的服務
  rm                 刪除指定已經停止服務的容器
  run                在一個服務上執行一條命令
  scale              設置指定服務運行容器的個數
  start              在容器中啟動指定服務
  stop               停止已運行的服務
  top                显示各個服務容器內運行的進程
  unpause            恢復容器服務
  up                 創建並啟動容器
  version            显示Docker-Compose版本信息

最後對相應的接口做檢測：

相關的完整代碼我已經上傳到了gitee地址，如果有需要的朋友可以前往進行下載。

代碼地址：https://gitee.com/IdeaHome_admin/wfw

實踐完畢之後，你可能會覺得有了docker-compose之後，對於多個docker容器來進行管理顯得就特別輕鬆了。

但是往往現實中並沒有這麼簡單，docker-compose存在着一個弊端，那就是不能做跨機器之間的docker容器進行管理。

因此隨者技術的發展，後邊也慢慢出現了一種叫做Kubernetes的技術。Kubernetes（俗稱k8s）是一個開源的，用於管理雲平台中多個主機上的容器化的應用，Kubernetes的目標是讓部署容器化的應用簡單並且高效（powerful）,Kubernetes提供了應用部署，規劃，更新，維護的一種機制。

Kubernetes這類技術對於小白來說入門的難度較高，後邊可能會抽空專門來寫一篇適合小白閱讀的k8s入門文章。

本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理【其他文章推薦】

※帶您來了解什麼是 USB CONNECTOR ?

※自行創業缺乏曝光? 下一步"網站設計"幫您第一時間規劃公司的門面形象

※如何讓商品強力曝光呢? 網頁設計公司幫您建置最吸引人的網站，提高曝光率!!

※綠能、環保無空污,成為電動車最新代名詞，目前市場使用率逐漸普及化

※廣告預算用在刀口上，網站設計公司幫您達到更多曝光效益

程序員修神之路–kubernetes是微服務發展的必然產物

2020-02-072020-02-07 admin

菜菜哥，我昨天又請假出去面試了

戰況如何呀？

多數面試題回答的還行，但是最後讓我介紹微服務和kubernetes的時候，掛了

話說微服務和kubernetes內容確實挺多的

那你給我大體介紹一下唄

可以呀，不過要請和coffee哦

◆◆

kubernetes介紹

◆◆

在很多項目的發展初期，都是小型或者大型的單體項目，部署在單台或者多台服務器上，以單個進程的方式來運行。這些項目隨着需求的遞增，發布周期逐漸增長，迭代速度明顯下降。傳統的發布方式是：開發人員將項目打包發給運維人員，運維人員進行部署、資源分配等操作。

隨着軟件行業架構方式的改變，這些大型的單體應用按照業務或者其他維度逐漸被分解為可獨立運行的組件，我們稱之為微服務。微服務彼此之間被獨立開發、部署、升級、擴容，真正實現了大型應用的解耦工作。關於微服務的介紹，大家可以去擼一下菜菜之前的文章：

https://mp.weixin.qq.com/s/b7Bd8giwWVNF1CtkaDaVpw

https://mp.weixin.qq.com/s/BixgyGFrlwZ7wpgDdrmU_g

軟件開發行業就是這樣奇葩，每一個問題被解決之後總是伴隨着另外的問題出現，就像程序員改bug，為什麼總有改不完的bug，真的很令人頭大！！!

微服務雖然解決了一些問題，但是隨着微服務數量的增多，配置、管理、擴容、高可用等要求的實現變的越來越困難，包括運維團隊如何更好的利用硬件資源並降低服務器成本，以及部署的自動化和故障處理等問題變得原來越棘手。

以上問題正是kubernetes要解決並且擅長的領域，它可以讓開發者自主部署應用，自主控制迭代的頻率，完全解放運維團隊。而運維團隊的工作重心從以往的服務器資源管理轉移到了kubernetes的資源管理。kubernetes最厲害之處是對硬件基礎設施進行了封裝和抽象，使得開發人員完全不用去了解硬件的基礎原理，不用去關注底層服務器。kubernetes內部把設置的服務器抽象為資源池，在部署應用的時候，它會自動給應用分配合適合理的服務器資源，並且能夠保證這些應用能正常的和其他應用進行通信。一個kubernetes集群的大體結構如下：

那kubernetes有哪些具體優勢呢？能說下不？

再加一杯coffee？

◆◆

kubernetes優勢

◆◆

微服務雖好，但是數量多了就會有量帶來的問題。隨着系統組件的不斷增長，這些組件的管理問題逐漸浮出水面。首先我們要明白kubernetes是一個軟件系統，它依賴於linux容器的特性來管理組件（kubernetes和容器並非一個概念，請不要混淆）。通過kubernetes部署應用程序時候，你的集群無論包含多少個節點，對於kubernetes來說不會有什麼差異，這完全得益於它對底層基礎設置的抽象，使得數個節點運行的時候表現的好像一個節點一樣。

自動擴容

在kubernetes系統中，它可以對每個應用進行實時的監控，並能根據策略來應對突發的流量做出反應。例如：在流量高峰期間，kubernetes可以根據各個節點的資源利用情況，進行自動的增加節點或者減少節點操作，這在以前的傳統應用部署方式中是不容易做到的。

簡化部署流程

以往的傳統應用發布的時候，需要開發人員把項目打包，並檢查項目的配置文件是否正確，然後發給運維人員，運維人員然後把線上的應用版本備份，然後停止服務進行更新。在kubernetes中，我們多數情況下只需要一條指令或者點擊一個按鈕，就可以把應用升級到最新版本，而且升級的過程中還可做做到不間斷服務。當然整個的流程還涉及到容器的操作，本次這裏不再做過多介紹。

但是這裡有一個意外情況，如果kubernetes集群中存在不同架構CPU的服務器，而你的應用程序是針對特定CPU架構的軟件，可能需要在kubernetes中指定節點去運行你的應用程

提高服務器資源的利用率

傳統應用部署的時候，多數情況下總會把資源留有一定的比例來作為資源的緩衝，來應對流量的峰值，很少有人把單個服務器資源利用率提高到90%以上，從服務器故障的概率來說，服務器資源使用率在90%要比50%高很多，而且服務器一旦出現故障，都是運維人員來解決問題和背鍋，所以傳統的物理機或者虛擬機部署應用的方式，硬件的資源利用率相比較來說是比較低的。

而kubernetes對集群的管理由於抽象了底層硬件設施，所以已經將應用程序和基礎設施分離開來。當你告訴kubernetes運行你應用程序時，它會根據程序的資源需求和集群內每隔節點的可用資源情況選擇合適的節點來運行。而且通過容器的技術，可以讓應用程序在任何時間遷移到集群中的任何機器上。而對於服務器選擇的最優的組合，kubernetes比人工做的更好，它會根據集群中每台服務器的負載情況來把硬件利用率提高到最高。

自動修復

在傳統的應用架構中，如果一台服務器發生故障，那麼這台服務器上的應用將會全部down掉，多數情況下需要運維人員去處理，這也是為什麼運維人員需要7*24小時隨時待命的一個重要原因。相信你也曾看到過因為半夜故障運維人員罵娘的情景。在kubernetes中，它監視並管理着所有的節點和應用，在節點出現故障的時候，kubernetes可以自動將該節點上的應用遷移到其他健康節點，並將故障節點在資源池中排除。如果你的kubernetes集群基礎設施有足夠的備用資源來支撐系統的正常運行，運維人員完全可以拖延到正常的工作時間再處理故障，讓程序員和運維人員過一下965的工作節奏。

這點有點像Actor模型的設計理論，提倡的是任其崩潰原理。

一致的運行環境

無論你是開發還是運維人員，在傳統的部署方案中，總會有運行環境差異性的煩惱，這樣的差異性大到每個服務器的差異，小到開發環境、仿真環境、生產環境，而且每個環境的服務器都會隨着時間的推移而變化。我相信你一定遇到過開發環境程序運行正常，生產環境卻異常的情況。這種差異性不僅僅是因為生產環境由運維團隊管理，開發環境由開發者管理，更重要的這兩組人對系統的要求是不同的，運維團隊會對線上生產環境定時的打補丁，做安全監測等操作，而開發者可能根本就不會弔這些問題。除此之外，應用系統依賴的第三方庫可能在開發、仿真、生產環境中版本不同，這樣的問題反正我是遇到過。

而kubernetes採用的容器技術，在把應用打包的時候，運行環境也一起被打入包中，這就保證了相同版本的容器包（鏡像）在任何服務器上都有相同的運行環境

kubernetes原來有這麼優勢，那我得好好學學了

雖然kubernetes優勢很多，但是入門門檻比較高，而且在個別情況下反而不合適

kubernetes要求開發人員對容器技術和網絡知識有一定了解，所以是否採用kubernetes要根據團隊的綜合技能和項目斟酌使用，並不是所有項目採用kubernetes都有利

本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理【其他文章推薦】

※USB CONNECTOR掌控什麼技術要點? 帶您認識其相關發展及效能

※評比前十大台北網頁設計、台北網站設計公司知名案例作品心得分享

※智慧手機時代的來臨，RWD網頁設計已成為網頁設計推薦首選

使用Amazon EMR和Apache Hudi在S3上插入，更新，刪除數據

2020-02-062020-02-06 admin

將數據存儲在Amazon S3中可帶來很多好處，包括規模、可靠性、成本效率等方面。最重要的是，你可以利用Amazon EMR中的Apache Spark，Hive和Presto之類的開源工具來處理和分析數據。儘管這些工具功能強大，但是在處理需要進行增量數據處理以及記錄級別插入，更新和刪除場景時，仍然非常具有挑戰。

與客戶交談時，我們發現有些場景需要處理對單條記錄的增量更新，例如：

遵守數據隱私法規，在該法規中，用戶選擇忘記或更改應用程序對數據使用方式的協議。
使用流數據，當你必須要處理特定的數據插入和更新事件時。
實現變更數據捕獲（CDC）架構來跟蹤和提取企業數據倉庫或運營數據存儲中的數據庫變更日誌。
恢復遲到的數據，或分析特定時間點的數據。

從今天開始，EMR 5.28.0版包含Apache Hudi（孵化中），因此你不再需要構建自定義解決方案來執行記錄級別的插入，更新和刪除操作。Hudi是Uber於2016年開始開發，以解決攝取和ETL管道效率低下的問題。最近幾個月，EMR團隊與Apache Hudi社區緊密合作，提供了一些補丁，包括將Hudi更新為Spark 2.4.4，支持Spark Avro，增加了對AWS Glue Data Catalog的支持，以及多個缺陷修復。

使用Hudi，即可以在S3上執行記錄級別的插入，更新和刪除，從而使你能夠遵守數據隱私法律、消費實時流、捕獲更新的數據、恢復遲到的數據和以開放的、供應商無關的格式跟蹤歷史記錄和回滾。創建數據集和表，然後Hudi管理底層數據格式。Hudi使用Apache Parquet和Apache Avro進行數據存儲，並內置集成Spark，Hive和Presto，使你能夠使用與現在所使用的相同工具來查詢Hudi數據集，並且幾乎實時地訪問新數據。

啟動EMR群集時，只要選擇以下組件之一（Hive，Spark，Presto），就可以自動安裝和配置Hudi的庫和工具。你可以使用Spark創建新的Hudi數據集，以及插入，更新和刪除數據。每個Hudi數據集都會在集群的已配置元存儲庫（包括AWS Glue Data Catalog）中進行註冊，並显示為可以通過Spark，Hive和Presto查詢的表。

Hudi支持兩種存儲類型，這些存儲類型定義了如何寫入，索引和從S3讀取數據：

寫時複製（Copy On Write）– 數據以列格式（Parquet）存儲，並且在寫入時更新數據數據會創建新版本文件。此存儲類型最適合用於讀取繁重的工作負載，因為數據集的最新版本在高效的列式文件中始終可用。
讀時合併（Merge On Read）– 將組合列（Parquet）格式和基於行（Avro）格式來存儲數據；更新記錄至基於行的增量文件中，並在以後進行壓縮，以創建列式文件的新版本。此存儲類型最適合於繁重的寫工作負載，因為新提交（commit）會以增量文件格式快速寫入，但是要讀取數據集，則需要將壓縮的列文件與增量文件合併。

下面讓我們快速預覽下如何在EMR集群中設置和使用Hudi數據集。

結合Apache Hudi與Amazon EMR

從EMR控制台開始創建集群。在高級選項中，選擇EMR版本5.28.0（第一個包括Hudi的版本）和以下應用程序：Spark，Hive和Tez。在硬件選項中，添加了3個任務節點，以確保有足夠的能力運行Spark和Hive。

群集就緒后，使用在安全性選項中選擇的密鑰對，通過SSH進入主節點並訪問Spark Shell。使用以下命令來啟動Spark Shell以將其與Hudi一起使用：

$ spark-shell --conf "spark.serializer=org.apache.spark.serializer.KryoSerializer"
              --conf "spark.sql.hive.convertMetastoreParquet=false"
              --jars /usr/lib/hudi/hudi-spark-bundle.jar,/usr/lib/spark/external/lib/spark-avro.jar

使用以下Scala代碼將一些示例ELB日誌導入寫時複製存儲類型的Hudi數據集中：

import org.apache.spark.sql.SaveMode
import org.apache.spark.sql.functions._
import org.apache.hudi.DataSourceWriteOptions
import org.apache.hudi.config.HoodieWriteConfig
import org.apache.hudi.hive.MultiPartKeysValueExtractor

//Set up various input values as variables
val inputDataPath = "s3://athena-examples-us-west-2/elb/parquet/year=2015/month=1/day=1/"
val hudiTableName = "elb_logs_hudi_cow"
val hudiTablePath = "s3://MY-BUCKET/PATH/" + hudiTableName

// Set up our Hudi Data Source Options
val hudiOptions = Map[String,String](
    DataSourceWriteOptions.RECORDKEY_FIELD_OPT_KEY -> "request_ip",
    DataSourceWriteOptions.PARTITIONPATH_FIELD_OPT_KEY -> "request_verb", 
    HoodieWriteConfig.TABLE_NAME -> hudiTableName, 
    DataSourceWriteOptions.OPERATION_OPT_KEY ->
        DataSourceWriteOptions.INSERT_OPERATION_OPT_VAL, 
    DataSourceWriteOptions.PRECOMBINE_FIELD_OPT_KEY -> "request_timestamp", 
    DataSourceWriteOptions.HIVE_SYNC_ENABLED_OPT_KEY -> "true", 
    DataSourceWriteOptions.HIVE_TABLE_OPT_KEY -> hudiTableName, 
    DataSourceWriteOptions.HIVE_PARTITION_FIELDS_OPT_KEY -> "request_verb", 
    DataSourceWriteOptions.HIVE_ASSUME_DATE_PARTITION_OPT_KEY -> "false", 
    DataSourceWriteOptions.HIVE_PARTITION_EXTRACTOR_CLASS_OPT_KEY ->
        classOf[MultiPartKeysValueExtractor].getName)

// Read data from S3 and create a DataFrame with Partition and Record Key
val inputDF = spark.read.format("parquet").load(inputDataPath)

// Write data into the Hudi dataset
inputDF.write
       .format("org.apache.hudi")
       .options(hudiOptions)
       .mode(SaveMode.Overwrite)
       .save(hudiTablePath)

在Spark Shell中，現在就可以計算Hudi數據集中的記錄：

scala> inputDF2.count()
res1: Long = 10491958

在選項（options）中，使用了與為集群中的Hive Metastore集成，以便在默認數據庫（default）中創建表。通過這種方式，我可以使用Hive查詢Hudi數據集中的數據：

hive> use default;
hive> select count(*) from elb_logs_hudi_cow;
...
OK
10491958

現在可以更新或刪除數據集中的單條記錄。在Spark Shell中，設置了一些用來查詢更新記錄的變量，並準備用來選擇要更改的列的值的SQL語句：

val requestIpToUpdate = "243.80.62.181"
val sqlStatement = s"SELECT elb_name FROM elb_logs_hudi_cow WHERE request_ip = '$requestIpToUpdate'"

執行SQL語句以查看列的當前值：

scala> spark.sql(sqlStatement).show()
+------------+                                                                  
|    elb_name|
+------------+
|elb_demo_003|
+------------+

然後，選擇並更新記錄：

// Create a DataFrame with a single record and update column value
val updateDF = inputDF.filter(col("request_ip") === requestIpToUpdate)
                      .withColumn("elb_name", lit("elb_demo_001"))

現在用一種類似於創建Hudi數據集的語法來更新它。但是這次寫入的DataFrame僅包含一條記錄：

// Write the DataFrame as an update to existing Hudi dataset
updateDF.write
        .format("org.apache.hudi")
        .options(hudiOptions)
        .option(DataSourceWriteOptions.OPERATION_OPT_KEY,
                DataSourceWriteOptions.UPSERT_OPERATION_OPT_VAL)
        .mode(SaveMode.Append)
        .save(hudiTablePath)

在Spark Shell中，檢查更新的結果：

scala> spark.sql(sqlStatement).show()
+------------+                                                                  
|    elb_name|
+------------+
|elb_demo_001|
+------------+

現在想刪除相同的記錄。要刪除它，可在寫選項中傳入了EmptyHoodieRecordPayload有效負載：

// Write the DataFrame with an EmptyHoodieRecordPayload for deleting a record
updateDF.write
        .format("org.apache.hudi")
        .options(hudiOptions)
        .option(DataSourceWriteOptions.OPERATION_OPT_KEY,
                DataSourceWriteOptions.UPSERT_OPERATION_OPT_VAL)
        .option(DataSourceWriteOptions.PAYLOAD_CLASS_OPT_KEY,
                "org.apache.hudi.EmptyHoodieRecordPayload")
        .mode(SaveMode.Append)
        .save(hudiTablePath)

在Spark Shell中，可以看到該記錄不再可用：

scala> spark.sql(sqlStatement).show()
+--------+                                                                      
|elb_name|
+--------+
+--------+

Hudi是如何管理所有的更新和刪除？我們可以通過Hudi命令行界面（CLI）連接到數據集，便可以看到這些更改被解釋為提交（commits）：

可以看到，此數據集是寫時複製數據集，這意味着每次對記錄進行更新時，包含該記錄的文件將被重寫以包含更新后的值。你可以查看每次提交（commit）寫入了多少記錄。表格的底行描述了數據集的初始創建，上方是單條記錄更新，頂部是單條記錄刪除。

使用Hudi，你可以回滾到每個提交。例如，可以使用以下方法回滾刪除操作：

hudi:elb_logs_hudi_cow->commit rollback --commit 20191104121031

在Spark Shell中，記錄現在回退到更新之後的位置：

scala> spark.sql(sqlStatement).show()
+------------+                                                                  
|    elb_name|
+------------+
|elb_demo_001|
+------------+

寫入時複製是默認存儲類型。通過將其添加到我們的hudiOptions中，我們可以重複上述步驟來創建和更新讀時合併數據集類型：

DataSourceWriteOptions.STORAGE_TYPE_OPT_KEY -> "MERGE_ON_READ"

如果更新讀時合併數據集並使用Hudi CLI查看提交（commit）時，則可以看到讀時合併與寫時複製相比有何不同。使用讀時合併，你僅寫入更新的行，而不像寫時複製一樣寫入整個文件。這就是為什麼讀時合併對於需要更多寫入或使用較少讀取次數更新或刪除繁重工作負載的用例很有幫助的原因。增量提交作為Avro記錄（基於行的存儲）寫入磁盤，而壓縮數據作為Parquet文件（列存儲）寫入。為避免創建過多的增量文件，Hudi會自動壓縮數據集，以便使得讀取盡可能地高效。

創建讀時合併數據集時，將創建兩個Hive表：

第一個表的名稱與數據集的名稱相同。
第二個表的名稱後面附加了字符_rt； _rt後綴表示實時。

查詢時，第一個表返回已壓縮的數據，並不會显示最新的增量提交。使用此表可提供最佳性能，但會忽略最新數據。查詢實時表會將壓縮的數據與讀取時的增量提交合併，因此該數據集稱為讀時合併。這將導致可以使用最新數據，但會導致性能開銷，並且性能不如查詢壓縮數據。這樣，數據工程師和分析人員可以靈活地在性能和數據新鮮度之間進行選擇。

已可用

EMR 5.28.0的所有地區現在都可以使用此新功能。將Hudi與EMR結合使用無需額外費用。你可以在EMR文檔中了解更多有關Hudi的信息。這個新工具可以簡化你在S3中處理，更新和刪除數據的方式。也讓我們知道你打算將其用於哪些場景！

本站聲明:網站內容來源於博客園,如有侵權,請聯繫我們,我們將及時處理【其他文章推薦】

※帶您來了解什麼是 USB CONNECTOR ?

※自行創業缺乏曝光? 下一步"網站設計"幫您第一時間規劃公司的門面形象

※如何讓商品強力曝光呢? 網頁設計公司幫您建置最吸引人的網站，提高曝光率!!

※綠能、環保無空污,成為電動車最新代名詞，目前市場使用率逐漸普及化

※廣告預算用在刀口上，網站設計公司幫您達到更多曝光效益