首頁手記 Protobuf入門教程：從零開始學習Protobuf基礎

Protobuf入門教程：從零開始學習Protobuf基礎

標簽：

數據結構算法與數據結構 API

概述

本文介绍了Google开发的Protocol Buffers（简称Protobuf）的数据序列化格式，解释了其轻便高效、跨语言支持和灵活的数据结构等优点，并详细阐述了Protobuf在数据交换中的广泛应用场景和安装配置方法。Protobuf的紧凑格式和高效解析使其在多种编程语言中得到广泛应用。

Protobuf简介

什么是Protobuf

Protocol Buffers（简称Protobuf）是由Google开发的一种轻便高效的结构化数据序列化格式。它主要用于数据交换，其设计目标是与语言无关、平台无关、可扩展。用户定义数据结构的.proto文件中定义的数据结构可以被编译成各种语言的源代码，这些源代码提供读写该结构数据的功能。

Protobuf的作用和优点

作用

数据序列化：Protobuf可以将结构化数据序列化为二进制格式，方便在网络上传输或持久化存储。
跨语言支持：Protobuf支持多种编程语言（如Java、Python、C++等），使得不同语言之间可以方便地交换数据。
灵活的数据结构：Protobuf允许定义灵活的数据结构，可以适应各种应用需求。

优点

高效：Protobuf的序列化格式非常紧凑，相比于XML或JSON等其他数据格式，占用更少的带宽和存储空间。
快速：Protobuf的解析速度非常快，比JSON快数十倍。
易于扩展：添加新的字段不会破坏现有的编码数据，使得系统可以很容易地进行升级。
简单：使用.proto文件定义数据结构，简单易懂。
轻量级：Protobuf库本身非常小，易于集成到应用程序中。

Protobuf的应用场景

网络通信：Protobuf被广泛用于网络通信协议中，如Google内部的RPC框架。
数据存储：由于其紧凑的格式，Protobuf常用于数据库中存储结构化数据。
日志记录：很多系统使用Protobuf来记录日志，既可以提高效率，又便于解析和分析。
配置文件：用Protobuf定义的配置文件格式清晰，易于维护。
游戏开发：在游戏开发中，Protobuf被用于网络通信和数据传递。

安装和配置Protobuf环境

在不同操作系统上安装Protobuf

在Linux上安装

在Ubuntu上可以通过以下命令安装Protobuf：

sudo apt-get update
sudo apt-get install protobuf-compiler

在Windows上安装

在Windows上，可以通过protoc下载页面下载对应版本的安装包。通常，下载安装包后解压到需要的目录。

在macOS上安装

在macOS上，可以使用Homebrew安装Protobuf：

brew install protobuf

配置Protobuf开发环境

为了方便地使用Protobuf工具，建议将protoc的路径添加到环境变量中。以下是Linux和macOS上的配置示例：

在Linux/macOS上配置环境变量

export PATH=$PATH:/usr/local/bin

在Windows上，可以将protoc的安装目录添加到系统环境变量PATH中。

Protobuf基本语法

定义Protobuf消息类型

Protobuf的数据定义使用.proto文件来描述。在.proto文件中，定义了一组消息类型，这些消息类型表示了一个结构化数据的格式。

示例

syntax = "proto3";

message Person {
  string name = 1;
  int32 id = 2;
  string email = 3;
}

语法解释

syntax = "proto3";：指定.proto文件使用的语法版本。
message：定义一个消息类型。消息类型可以包含字段、其他消息类型等。
fields：消息类型中的字段，每个字段都有一个唯一的数字标签和一个类型。

消息字段类型和规则

字段类型

Protobuf支持多种字段类型，包括但不限于：

基础类型：int32、int64、uint32、uint64、sint32、sint64、fixed32、fixed64、sfixed32、sfixed64、float、double、bool、string、bytes。
复杂类型：message、enum（枚举类型）。

字段规则

标签：每个字段都需要一个唯一的数字标签，范围是1-536870911。
重复字段：可以定义一个字段为重复类型，如repeated int32 list = 4;。
嵌套消息：可以在一个消息类型中定义另一个消息类型，如message Address { ... };。

使用Protobuf编译器生成代码

使用protoc编译器可以将.proto文件转换为指定语言的代码。

示例

protoc --java_out=. person.proto

这将生成Java代码，并保存在当前目录下。

生成的代码结构

编译后生成的代码通常包含以下内容：

消息类：与.proto文件中的消息类型相对应的类。
方法：用于序列化和反序列化的各种方法。
枚举：如果.proto文件中定义了枚举类型。

Protobuf消息类型实例

创建简单的Protobuf消息定义

示例定义

syntax = "proto3";

message Person {
  string name = 1;
  int32 id = 2;
  string email = 3;
}

message AddressBook {
  repeated Person people = 1;
}

说明

Person 消息表示个人的信息，包含姓名、ID和邮箱。
AddressBook 消息表示地址簿，包含一个Person消息的列表。

如何编译消息定义文件

使用protoc编译器编译.proto文件。

protoc --java_out=. addressbook.proto

这将生成Java代码，并保存在当前目录下。

使用生成的代码创建和解析消息

示例代码

import com.example.addressbook.AddressBookProtos;

public class ProtobufExample {
  public static void main(String[] args) {
    // 创建一个新的Person消息
    AddressBookProtos.Person person = AddressBookProtos.Person.newBuilder()
        .setId(1234)
        .setName("John Doe")
        .setEmail("[email protected]")
        .build();

    // 将Person消息添加到AddressBook消息中
    AddressBookProtos.AddressBook addressBook = AddressBookProtos.AddressBook.newBuilder()
        .addPeople(person)
        .build();

    // 将AddressBook消息序列化为字节
    byte[] addressBookBytes = addressBook.toByteArray();

    // 反序列化字节为AddressBook消息
    AddressBookProtos.AddressBook parsedAddressBook = AddressBookProtos.AddressBook.parseFrom(addressBookBytes);

    // 打印解析后的AddressBook消息中的第一个Person
    System.out.println(parsedAddressBook.getPeople(0));
  }
}

代码解释

创建消息：使用newBuilder()方法创建一个新的消息构建器。
添加字段：使用setId()、setName()、setEmail()等方法添加字段。
序列化：使用toByteArray()方法将消息序列化为字节数组。
反序列化：使用parseFrom()方法将字节数组反序列化为消息对象。

在Java中使用Protobuf

编译.proto文件

在Java中使用Protobuf，首先需要编译.proto文件。

protoc --java_out=. addressbook.proto

示例代码

import com.example.addressbook.AddressBookProtos;

public class JavaProtobufExample {
  public static void main(String[] args) {
    // 创建一个新的Person消息
    AddressBookProtos.Person person = AddressBookProtos.Person.newBuilder()
        .setId(1234)
        .setName("John Doe")
        .setEmail("[email protected]")
        .build();

    // 将Person消息添加到AddressBook消息中
    AddressBookProtos.AddressBook addressBook = AddressBookProtos.AddressBook.newBuilder()
        .addPeople(person)
        .build();

    // 打印AddressBook消息
    System.out.println(addressBook);
  }
}

说明

创建消息：使用newBuilder()方法创建一个新的消息构建器。
添加字段：使用setId()、setName()、setEmail()等方法添加字段。
序列化和反序列化：可以使用toByteArray()和parseFrom()方法进行序列化和反序列化。

在Python中使用Protobuf

编译.proto文件

在Python中使用Protobuf，首先需要编译.proto文件。

protoc --python_out=. addressbook.proto

示例代码

import addressbook_pb2

def main():
    # 创建一个新的Person消息
    person = addressbook_pb2.Person()
    person.id = 1234
    person.name = "John Doe"
    person.email = "[email protected]"

    # 创建一个新的AddressBook消息
    address_book = addressbook_pb2.AddressBook()
    address_book.people.append(person)

    # 打印AddressBook消息
    print(address_book)

if __name__ == "__main__":
    main()

说明

创建消息：使用Person()方法创建一个新的Person消息。
添加字段：直接使用id、name、email属性进行设置。
序列化和反序列化：可以使用SerializeToString()和ParseFromString()方法进行序列化和反序列化。

在C++中使用Protobuf

编译.proto文件

在C++中使用Protobuf，首先需要编译.proto文件。

protoc --cpp_out=. addressbook.proto

示例代码

#include <iostream>
#include "addressbook.pb.h"

void printPerson(const addressbook::Person& person) {
    std::cout << "Name: " << person.name() << " ID: " << person.id() << " Email: " << person.email() << std::endl;
}

int main() {
    // 创建一个新的Person消息
    addressbook::Person person;
    person.set_id(1234);
    person.set_name("John Doe");
    person.set_email("[email protected]");

    // 创建一个新的AddressBook消息
    addressbook::AddressBook address_book;
    *address_book.add_people() = person;

    // 打印AddressBook消息中的第一个Person
    printPerson(*address_book.mutable_people(0));

    return 0;
}

说明

创建消息：使用Person()构造函数创建一个新的Person消息。
添加字段：使用set_id()、set_name()、set_email()方法添加字段。
序列化和反序列化：可以使用SerializeToString()和ParseFromString()方法进行序列化和反序列化。

Protobuf进阶技巧

如何优化Protobuf性能

优化序列化性能

减少数据字段：减少不必要的字段可以提高序列化速度。
使用紧凑的数据类型：使用更紧凑的数据类型，如int32而不是int64，可以减少序列化后的数据大小。
减少嵌套层次：减少消息中的嵌套层次可以提高序列化和反序列化速度。

优化反序列化性能

预先解析字段：在反序列化时，预先解析需要用到的字段，减少不必要的解析操作。
批量处理：如果在应用中需要处理大量的数据，可以考虑批量处理，以减少频繁的序列化和反序列化操作。

Protobuf与JSON之间的转换

JSON转Protobuf

可以使用第三方库（如protobuf-json）将JSON字符串转换为Protobuf消息。

from google.protobuf.json_format import Parse

json_str = '{"id": 1234, "name": "John Doe", "email": "[email protected]"}'
person = addressbook_pb2.Person()
Parse(json_str, person)

Protobuf转JSON

可以使用ToJsonString()方法将Protobuf消息转换为JSON字符串。

json_str = person.ToJsonString()

示例代码

import addressbook_pb2

def json_to_protobuf(json_str):
    person = addressbook_pb2.Person()
    Parse(json_str, person)
    return person

def protobuf_to_json(person):
    return person.ToJsonString()

if __name__ == "__main__":
    json_str = '{"id": 1234, "name": "John Doe", "email": "[email protected]"}'
    person = json_to_protobuf(json_str)
    print("Person from JSON:", person)

    json_str = protobuf_to_json(person)
    print("JSON from Person:", json_str)

常见问题及解决方法

问题1：字段缺失

问题描述：在反序列化过程中，如果消息中某些字段缺失，会导致解析失败。

解决方法：通过设置字段的has_field()方法检查字段是否存在，如果不存在则跳过该字段的解析。

问题2：数据格式不一致

问题描述：不同版本的.proto文件导致数据格式不一致。

解决方法：在.proto文件中使用optional、required、repeated等关键字来定义字段的可选性，确保不同版本的字段兼容性。

问题3：性能瓶颈

问题描述：频繁的序列化和反序列化操作导致性能瓶颈。

解决方法：批量处理数据，减少频繁的序列化和反序列化操作。如果可能，可以考虑使用更高效的数据结构和序列化方法。

问题4：消息定义错误

问题描述：消息定义错误导致编译失败或运行时错误。

解决方法：仔细检查.proto文件中的消息定义，确保没有语法错误或重复的字段标签。

问题5：跨语言通信问题

问题描述：不同语言之间的通信出现问题。

解决方法：确保在不同语言中使用相同的.proto文件定义消息，检查编译生成的代码是否正确。

通过以上内容，你已经对Protobuf的基本概念、安装配置、基本语法、实际应用以及进阶技巧有了全面了解。使用Protobuf可以极大提高数据序列化和反序列化的效率，支持跨语言的数据交换，适用于多种应用场景。希望本文能帮助你在项目中更好地利用Protobuf。

點擊查看更多內容

為 TA 點贊

若覺得本文不錯，就分享一下吧！

評論

評論

共同學習，寫下你的評論

評論加載中...

展開查看更多評論

作者其他優質文章

正在加載中

侃侃爾雅

手記
篇

粉絲

10

獲贊與收藏

13

關注作者，訂閱最新文章

閱讀免費教程

數據結構入門教程

7個小節 24347 637

后端通用面試教程

41個小節 32486 366

ES6-10 入門教程

61個小節 96674 755

推薦

評論

收藏

共同學習，寫下你的評論



感謝您的支持，我會繼續努力的～

掃碼打賞，你說多少就多少

贊賞金額會直接到老師賬戶

支付方式

打開微信掃一掃，即可進行掃碼打賞哦

今天注冊有機會得

100積分直接送

付費專欄免費學

大額優惠券免費領

立即參與放棄機會

點擊
抽獎

慕課手記新用戶專享福利

恭喜你，你的運氣太好了，居然抽中了 100個積分！

恭喜你，抽中了價值元的專欄！

太棒了，直接落到你賬戶里！

積分商城里的羅技鼠標、機械鍵盤、
Kindle 閱讀器、小米平衡車
Apple iPad （10.2英寸）、大額優惠券
在等著你去兌換了噢

作者：

免費贈送

兌換碼：1111222211 復制

優惠券可用于購買實戰課、體系課
無門檻使用

先去看看，有什么好東西馬上兌換我愛學習，選課去


亚洲在线久爱草,狠狠天天香蕉网,天天搞日日干久草,伊人亚洲日本欧美

熱搜

最近搜索清空

Protobuf入門教程：從零開始學習Protobuf基礎

作用

优点

在Linux上安装

在Windows上安装

在macOS上安装

在Linux/macOS上配置环境变量

示例

语法解释

字段类型

字段规则

示例

生成的代码结构

示例定义

说明

示例代码

代码解释

编译.proto文件

示例代码

说明

编译.proto文件

示例代码

说明

编译.proto文件

示例代码

说明

优化序列化性能

优化反序列化性能

JSON转Protobuf

Protobuf转JSON

示例代码

问题1：字段缺失

问题2：数据格式不一致

问题3：性能瓶颈

问题4：消息定义错误

问题5：跨语言通信问题

閱讀免費教程