zeerd’s blog

Linux 系统自监控异常退出重启机制

2024-08-07T00:00:00+08:00

在前文的基础上进行调整，实现一个自监控异常退出重启机制。

#include 
#include 
#include 
#include 
#include 
#include 
#include 

static pid_t pid_ = -1;
static int argc_;
static char **argv_;
static bool run_ = true;
static void sig_chld(int signo);
static void sig_term(int signo);
static int start_main(int argc, char *argv[]);

void real_main(int argc, char *argv[])
{
    // 主进程的实际任务
    srand(getpid());
    while (1) {
        printf("[%d]主进程正在运行...\n", getpid());
        sleep(1);
        // 模拟崩溃
        if (rand() % 5 == 0) {
            printf("[%d]主进程崩溃了！\n", getpid());
            char *a = NULL;
            *a      = 1;
        }
        // 模拟退出
        if (rand() % 5 == 0) {
            printf("[%d]主进程主动退出了！\n", getpid());
            if (rand() % 2 == 0) {
                exit(0);
            }
            else {
                exit(1);
            }
        }
    }
}

static void sig_term(int signo)
{
    printf("监控者被终止，信号：%d\n", signo);
    if (pid_ > 0) {
        printf("终止主进程，信号：%d\n", signo);
        kill(pid_, SIGTERM);
    }
    run_ = false;
}

static void sig_chld(int signo)
{
    int status;
    do {
        waitpid(pid_, &status, 0);
        if (WIFEXITED(status)) {
            int ret = WEXITSTATUS(status);
            if (ret == 0) {
                printf("主进程正常退出\n");
            }
            else {
                printf("主进程出错退出，状态码：%d\n", ret);
            }
            run_ = false;
            break;
        }
        else if (WIFSIGNALED(status)) {
            if (WTERMSIG(status) == SIGTERM || WTERMSIG(status) == SIGKILL) {
                printf("主进程被终止，信号：%d\n", WTERMSIG(status));
                run_ = false;
                break;
            }
            else {
                printf("主进程被异常信号终止，信号：%d\n", WTERMSIG(status));
            }
        }
        printf("重新启动主进程...\n");
        start_main(argc_, argv_);
    } while (0);
    return;
}

static int start_main(int argc, char *argv[])
{
    pid_ = fork();
    if (pid_ == -1) {
        perror("fork");
        exit(1);
    }
    else if (pid_ == 0) {
        real_main(argc, argv);
    }
    else {
        signal(SIGTERM, &sig_term);
        signal(SIGCHLD, &sig_chld);
        printf("监控者进程号：%d\n", getpid());
        printf("主进程进程号：%d\n", pid_);
    }
}

int main(int argc, char *argv[])
{
    int ret = 0;
    argc_   = argc;
    argv_   = argv;

    start_main(argc, argv);
    while (run_) {
        sleep(1);
    }

    return ret;
}

基于 Binder 让 MediaCodec 在独立的 Native 服务进程播放视频并描画到 JAVA 层提供的窗口上

2024-05-12T00:00:00+08:00

让我们在前文的基础上继续讨论。

通过 Binder 发送窗口句柄和 URI

JNIEXPORT void JNICALL Java_com_zeerd_ndk_NativePlayer_createPlayer(
        JNIEnv* env, jclass clazz, jobject surface, jstring uri)
{
    const char *curi = env->GetStringUTFChars(uri, NULL);
    ANativeWindow *window = ANativeWindow_fromSurface(env, surf);

    sp<Surface> surface = static_cast<Surface *>(window);
    sp<IGraphicBufferProducer> producer = surface->getIGraphicBufferProducer();

    Parcel data;
    data.writeStrongBinder(IInterface::asBinder(producer));
    data.writeCString(curi);

    sp<IServiceManager> sm = defaultServiceManager();
    sp<IBinder> binder = sm->getService(String16(SERVICE_NAME));
    binder->transact(0, data, nullptr, 0);
}

通过 Binder 接收窗口句柄和 URI

#include 
#include 
#include 

using namespace android;

class NativeService : public BBinder {
   public:
    virtual ~NativeService() {}
    static const char* getServiceName() { return SERVICE_NAME; }

    virtual status_t onTransact(uint32_t code, const Parcel& data,
                                Parcel* reply, uint32_t flags = 0)
    {
        switch (code) {
            case 0: {
                sp<IGraphicBufferProducer> producer =
                    interface_cast<IGraphicBufferProducer>(
                        data.readStrongBinder());
                sp<Surface> surf = new android::Surface(producer, true);
                ANativeWindow *window = surf.get();
                const char* curi = data.readCString();
                // playWith(window, curi);
                return NO_ERROR;
            }
            default:
                return BBinder::onTransact(code, data, reply, flags);
        }
    }
};

int main(int argc, char** argv)
{
    sp<IServiceManager> sm = defaultServiceManager();
    sm->addService(String16(NativeService::getServiceName()),
                new NativeService());
    IPCThreadState::self()->joinThreadPool();
    return 0;
}

基于 NDK 的 MediaCodec 播放视频并描画到 JAVA 层提供的窗口上

2024-03-28T00:00:00+08:00

通过 JNI 从 JAVA 层获取 Surface

JNIEXPORT void JNICALL Java_com_zeerd_ndk_NativePlayer_createPlayer(
        JNIEnv* env, jclass clazz, jobject surface)
{
    window = ANativeWindow_fromSurface(env, surface);
    return;
}

打开 MP4 文件，并找到视频流。

const char* videoPath = "/sdcard/Download/video.mp4";
int fd = open(videoPath, O_RDONLY);
AMediaExtractor *ex = AMediaExtractor_new();
AMediaExtractor_setDataSourceFd(ex, fd, 0, LONG_MAX);
close(fd);

AMediaCodec *codec;
int i, numTracks = AMediaExtractor_getTrackCount(ex);
for (i = 0; i < numTracks && codec == NULL; i++) {
    const char *mime;
    AMediaFormat *format = AMediaExtractor_getTrackFormat(ex, i);
    AMediaFormat_getString(format, AMEDIAFORMAT_KEY_MIME, &mime);
    if (!strncmp(mime, "video/", 6)) {
        AMediaExtractor_selectTrack(ex, i);
        codec = AMediaCodec_createDecoderByType(mime);
        AMediaCodec_configure(codec, format, window, NULL, 0);
    }
    AMediaFormat_delete(format);
}
AMediaCodec_start(codec);

注意：不要使用AMediaExtractor_setDataSource()。除非你打算播放流媒体。这个接口会尝试开启HTTP服务（并失败），看起来好像仅支持在线的流媒体。

读取并描画每一帧

启动一个独立的线程，循环调用下列处理逻辑。直到sawInputEOS和sawOutputEOS变成true。

ssize_t idxIn = -1;
if (!sawInputEOS) {
    idxIn = AMediaCodec_dequeueInputBuffer(codec, 2000);
    if (idxIn >= 0) {
        size_t bufSize;
        uint8_t* buf = AMediaCodec_getInputBuffer(codec, idxIn, &bufSize);
        ssize_t size = AMediaExtractor_readSampleData(ex, buf, bufSize);
        if (size < 0) {
            size = 0;
            sawInputEOS = true;
        }
        int64_t ptsUS = AMediaExtractor_getSampleTime(ex);
        AMediaCodec_queueInputBuffer(codec, idxIn, 0, size, ptsUS,
                sawInputEOS ? AMEDIACODEC_BUFFER_FLAG_END_OF_STREAM : 0);
        AMediaExtractor_advance(ex);
    }
}

if (!sawOutputEOS) {
    AMediaCodecBufferInfo info;
    ssize_t idx = AMediaCodec_dequeueOutputBuffer(codec, &info, 0);
    if (idx >= 0) {
        if (info.flags & AMEDIACODEC_BUFFER_FLAG_END_OF_STREAM) {
            sawOutputEOS = true;
        }
        AMediaCodec_releaseOutputBuffer(codec, idx, info.size != 0);
    }
}

销毁

AMediaCodec_stop(codec);
AMediaCodec_delete(codec);
AMediaExtractor_delete(ex);
ANativeWindow_release(window);

JAVA 代码和准备窗口

package com.zeerd.ndk;

import android.app.Activity;
import android.os.Bundle;
import android.view.Surface;
import android.view.SurfaceHolder;
import android.view.SurfaceView;

public class NativePlayer extends Activity {
    static final String TAG = "NativePlayer";

    SurfaceView mSurfaceView;
    SurfaceHolder mSurfaceHolder;

    @Override
    public void onCreate(Bundle icicle) {
        super.onCreate(icicle);
        setContentView(R.layout.main);

        mSurfaceView = (SurfaceView) findViewById(R.id.surfaceview);
        mSurfaceHolder = mSurfaceView.getHolder();

        mSurfaceHolder.addCallback(new SurfaceHolder.Callback() {
            @Override
            public void surfaceChanged(SurfaceHolder holder, int format, 
            	                       int width, int height) {
            }

            @Override
            public void surfaceCreated(SurfaceHolder holder) {
                createPlayer(holder.getSurface());
            }

            @Override
            public void surfaceDestroyed(SurfaceHolder holder) {
            }
        });
    }

    @Override
    protected void onDestroy()
    {
        destroyPlayer();
        super.onDestroy();
    }

    public static native void createPlayer(Surface surface);
    public static native void destroyPlayer();

    static {
         System.loadLibrary("jni_ndkplayer");
    }
}

对比：直接使用Java接口播放

public class NativePlayer extends Activity {
    static final String TAG = "NativePlayer";

    SurfaceView mSurfaceView;
    SurfaceHolder mSurfaceHolder;

    MediaPlayer mediaPlayer;

    @Override
    public void onCreate(Bundle icicle) {
        super.onCreate(icicle);
        setContentView(R.layout.main);

        mSurfaceView = (SurfaceView) findViewById(R.id.surfaceview);
        mSurfaceHolder = mSurfaceView.getHolder();

        mSurfaceHolder.addCallback(new SurfaceHolder.Callback() {
            @Override
            public void surfaceChanged(SurfaceHolder holder, 
                                       int format, int width, int height) {
            }
            @Override
            public void surfaceCreated(SurfaceHolder holder) {
                Surface surface = holder.getSurface();
                mediaPlayer.setSurface(surface);
                mediaPlayer.prepareAsync();
            }
            @Override
            public void surfaceDestroyed(SurfaceHolder holder) {
            }
        });

        mediaPlayer = new MediaPlayer();
        try {
            mediaPlayer.setDataSource("/sdcard/Download/video.mp4");
        } catch (IOException e) {
            e.printStackTrace();
        }
        mediaPlayer.setOnPreparedListener(new MediaPlayer.OnPreparedListener() {
            @Override
            public void onPrepared(MediaPlayer mp) {
                mp.start();
            }
        });
    }

    @Override
    protected void onDestroy()
    {
        super.onDestroy();
    }
}

在非编译环境中运行测试程序并获取正确的覆盖率报告

2024-02-05T00:00:00+08:00

本文针对GCOV_PREFIX和GCOV_PREFIX_STRIP的使用进行一些记录。

首先，准备一个简单的 C 语言程序作为测试目标。

#include 
#include 

int foo(int a)
{
    return a * a;
}

int main(int argc, char const *argv[])
{
    printf("%d\n", foo(atoi(argv[1])));
    return 0;
}

在最简单的情况下，我们的情况会类似于下面的脚本。即编译环境和运行环境都在一起。

这种情况下，只要参数设置没有问题，就可以简单的获取对应的覆盖率报告。

#!/bin/bash

gcc main.c -o test -lgcov -coverage
./test 2

lcov -c -d $(pwd) -o test.info
genhtml test.info -o doc

但是，很多情况下，我们都需要将测试程序移动到其他环境中运行。比如下面的脚本模拟了在Docker中运行测试程序的情况。

简单的运行一下，我们会发现，覆盖率报告生成失败了。原因是， lcov 找不到 .gcda 文件。

#!/bin/bash

gcc main.c -o test -lgcov -coverage

docker run -v $(pwd):/home/test \
    ubuntu:20.04 /home/test/test 2

lcov -c -d $(pwd) -o test.info
genhtml test.info -o doc

解决的方法也很简单。在目标环境中设置GCOV_PREFIX和GCOV_PREFIX_STRIP这两个环境变量。其中：

GCOV_PREFIX 是测试程序运行的位置。
GCOV_PREFIX_STRIP 是编译测试程序时，源代码所在路径的深度。

#!/bin/bash

gcc main.c -o test -lgcov -coverage

echo "#!/bin/bash" > startup.sh
echo "export GCOV_PREFIX=/home/test" >> startup.sh
echo "export GCOV_PREFIX_STRIP=\$(echo $(pwd) | awk -F\"/\" '{print NF-1}')" \
     >> startup.sh
echo "/home/test/test 2" >> startup.sh
chmod +x startup.sh
docker run -v $(pwd):/home/test -w /home/test \
    ubuntu:20.04 /home/test/startup.sh

lcov -c -d $(pwd) -o test.info
genhtml test.info -o doc

上述例子其实还不够精准的描述更加复杂的情况。例如，当我们需要在多个Docker中并行运行同一段代码时（这种情况常见于动态链接库），同时运行的程序会竞争.gcda文件。引发写冲突破坏.gcda文件。为了避免类似的问题，我们可能需要将测试程序拷贝多份。

参照下面的脚本，我们将编译出来的测试程序移动到了源代码以外的路径（new），去执行（脚本并没有模拟并行运行的情况，毕竟测试程序太简单了，一瞬间就退出了）。

这种情况下，直接执行测试程序，就会由于缺少信息而无法生成覆盖率报告。这些信息其实是保存在.gcno文件中。

参照下面的脚本，将main.gcno同样复制到新的路径下，然后再次运行测试程序。覆盖率报告可以顺利的生成了。

#!/bin/bash

gcc main.c -o test -lgcov -coverage
install -d new
install test new

echo "#!/bin/bash" > new/startup.sh
echo "export GCOV_PREFIX=/home/test" >> new/startup.sh
echo "export GCOV_PREFIX_STRIP=\$(echo $(pwd) | awk -F\"/\" '{print NF-1}')" \
     >> new/startup.sh
echo "/home/test/test 2" >> new/startup.sh
chmod +x new/startup.sh

cp main.gcno new/
docker run -v $(pwd)/new:/home/test/ -w /home/test \
    ubuntu:20.04 /home/test/startup.sh

lcov -c -d $(pwd)/new -o test.info
genhtml test.info -o doc

简单总结一下。

某工程代码的存放路径为/path/to/proj，其中有一个源文件存放在a/b.c。编译生成的a.out转移到目标系统的/usr/bin下运行。

此时，需要进行如下工作：

将/path/to/proj/a/b.gcno复制到目标环境的/usr/bin/a/b.gcno；
设置环境变量GCOV_PREFIX=/usr/bin；
设置环境变量GCOV_PREFIX_STRIP=3。（/path/to/proj是三层）。

运行时，a.out会根据调试信息去寻找/path/to/proj/a/b.gcno。但是，由于设置了GCOV_PREFIX，这个目标会调整为/usr/bin/path/to/proj/a/b.gcno。然后，由于设置了GCOV_PREFIX_STRIP，将/usr/bin/后面的三级路径删除，变成了 /usr/bin/a/b.gcno。在这里，a.out找到了我们提前复制进去的b.gcno文件。并在同样的位置生成/usr/bin/a/b.gcda文件。

有了.gcno和.gcda文件，就可以生成测试报告了。

筛查二进制文件中是否包涵敏感字符

2024-01-26T00:00:00+08:00

在对外发布的二进制文件中筛查敏感常量信息。比如 LOG 中包涵了设备型号。

find /root/path/to/releases -type f \
    -exec sh -c "file -i '{}' | grep -q 'charset=binary'" \; -print  \
    | xargs -x strings -f | grep -i 

同一脚本内，kill 通过 sudo 启动的进程

2024-01-23T00:00:00+08:00

问题

简单的说，如下脚本中的kill是不会生效的。

#!/bin/bash
set -x
sudo sleep 10 &
PID=$!

sleep 2
sudo kill $PID

sleep 1
ps aux | grep sleep

参考： Why does kill not work from script, but does work from terminal? 。如果我没理解错的话，原因是：

sudo 不能用来 kill 同一个进程组内的其他进程。

解决方案

这里，使用 setsid 来重置 sleep 进程的进程组（注意：不是 sudo sleep ）。

然后，借助曾经在《 Shell脚本中，等待所有子进程/孙进程退出》中使用过的方法，通过查询 sudo sleep 的子进程的方式 kill 由 sudo 启动的 sleep 进程。

接下来，由于子进程退出（被 kill），sudo sleep 进程也会自动退出。

#!/bin/bash
set -x

sudo setsid sleep 10 &
PID=$!

sleep 2
WPIDs=($(ps -eo pid,ppid \
       | awk -v ppid=$PID '{if($2==ppid && $1!=ppid){print $1}}'))
for pid in ${WPIDs[@]} ; do
    if ps -p $pid > /dev/null ; then
        sudo kill $pid
    fi
done

sleep 1
ps aux | grep sleep

AVDECC 简析

2023-12-26T00:00:00+08:00

AVDECC 实体

从更宏观的角度，以设备实体为单位，一个 AVDECC 设备需要包含以下的功能组件。

@startmindmap
    
    * AVDECC End Station
    **_ 具有一到多个 AVDECC 实体的终端设备
    ** 必选
    *** AEM
    ****_ AVDECC Entity Model
    **** ADP
    *****_ AVDECC Discovery Protocol
    *****_ 识别网络上当前可用的所有 AVDECC 实体\n并在它们被添加到网络或从网络移除时更新状态。
    ***** 宣布 AVDECC 实体可用(available)。
    ***** 宣布一个 AVDECC 实体即将离开(departing)。
    ***** 发现(discover)网络上的一个或所有 AVDECC 实体。
    **** AECP
    *****_ AVDECC Enumeration and Control Protocol
    *****_ 为要携带的枚举和控制模型提供一种处理机制。
    **** ACMP
    *****_ AVDECC Connection Management Protocol
    *****_ 在流利用者(Sink)和流源(Source)之间建立和断开连接。
    *** 网络接口
    *** AVTP Control
    ** 可选 <>
    *** 更多 AVDECC 实体/网络接口 对
    *** gPTP
    *** AVTPDU serdes
    *** MAAP
    *** FQTSS
    *** SRP
@endmindmap

ADP

用于使 AVDECC 实体发现其他实体及被其他实体发现的机制。 ADP 报文的发送形式为多播。

@startmindmap
    
    * ADP
    **_ AVDECC Discovery Protocol
    **_ ADP 的目的地址固定为：91-e0-f0-01-00-00
    ** Advertising Entity State machine
    ***_ 用于在终端站上发布 AVDECC 实体的状态机
    ** Advertising Interface State machine
    ***_ 每个被发布的 AVDECC 实体对应的 AVB 接口状态机
    ** Discovery State machine
    ***_ 用于实现 AVDECC 控制器或请求发现其他 AVDECC 实体
    ***_ 可以要求指定 ID 的实体回复 ENTITY_AVAILABLE
    ***_ 可以要求所有实体(指定 ID 为 0 )回复 ENTITY_AVAILABLE
@endmindmap

当足够多的 ADP 报文于网络上流转之后，所有 AVDECC 终端都可以找到自己期望的另一个终端。

ACMP

根据前文所述，每一个 AVDECC 实体中都必然包涵 ACMP 功能。当终端通过 ADP 报文找到期望的、对应的 AVDECC 终端之后，就可以通过 ACMP 报文发起连接。这个连接动作可能是预设的，也可能是用户手动操作而触发的。

@startmindmap
    
    * ACMP
    **_ AVDECC Connection Management Protocol
    ** ACMP Controller \nstate machine
    ***_ 描述了 AVDECC 在 ACMP 会话中的主动参与方式。
    ***_ AVDECC 控制器可以独立于这些状态机来监视所有接收到的 ACMP 消息，\n用于跟踪网络上的连接状态。
    *** Fast connect
    ****_ 启动过程中，Listener 根据预存的状态直接向\n Talker 发起连接
    *** Fast disconnect
    ****_ 关机过程中，Listener 直接向 Talker 通知\n断开连接
    *** Controller connect
    ****_ 由 Controller 通知 Listener 向 Talker\n 发送建立连接请求
    *** Controller disconnect
    ****_ 由 Controller 通知 Listener 向 Talker\n 发送断开连接请求
    ** ACMP Listener \nState Machine
    ** ACMP Talker \nState Machine
@endmindmap

AECP

@startmindmap
    
    * AECP
    **_ 所有 AECPDU 都是通过单播从 Controller 发送到 AVDECC 实体，并通过单播接收答复。
    **_ 枚举(Enumeration)是获取对应的单个 AVDECC 实体的功能、格式和控制方式的过程。
    **_ 控制(Control)是操作功能、格式和控制方式以将 AVDECC 实体配置为可用状态的过程。
    ** AEM format
    ***_ AVDECC 实体模型命令和响应允许 AVDECC 实体暴露 AVDECC 的实体模型。
    *** AEM Commands
    ****_ 用于发送与 AVDECC 实体模型交互的实体模型命令。
    *** AEM Responses
    ****_ 来自 AVDECC 实体，\n指示成功或失败并返回对应请求信息的实体模型响应。
    *** AEM Entity State Machine
    ****_ 接受命令、处理命令并回复
    *** AEM Controller State Machine
    ****_ 发送命令并处理回复
    ** Address Access Entity State Machine
    ***_ 处理地址访问命令的状态机。\n用于读取、写入或处理启动消息中包含的 TLV 数据。
    ***_ 这里的地址可以是寄存器地址，甚至用于固件升级功能。\n或者制定地址指针开始执行程序。
    ***_ 该命令从 AVDECC 控制器发送到目标 AVDECC 实体。
    ** Legacy AV/C Controller State Machine
    ***_ 处理遵循 IEEE 1394 AV/C 语义的传统 AV/C 命令/答复。
    ** Vendor Unique Controller State Machine
    ***_ 处理供应商自定义的 命令/答复。
    ** HDCP APM Entity State Machine
    ***_ 处理 HDCP APM 命令、用于传输 HDCP IIA 认证协议消息\n或 HDCP IIA 认证协议消息的一部分。
    ***_ 该命令从 AVDECC 控制器发送到目标 AVDECC 实体。
@endmindmap

AVDECC 角色

从功能角度， AVDECC 可以分成如下四种功能角色：

@startmindmap
    
    * AVDECC

    ** AVDECC Controller
    ***_ 具有 AVDECC 控制器角色的 AVDECC 实体、\n向其他 AVDECC 实体发起命令并从其接收响应。
    *** 必选
    ****_ AEM format
    ****_ AEM Commands
    ****_ AEM Responses
    ****_ AEM Controller State Machine\n(支持部分指令，详情不在此展开。下同)
    *** 可选 <>
    ****_ ACMP Controller state machine
    ****_ AEM Controller State Machine
    ****_ AEM Entity State Machine
    ****_ Address Access Controller State Machine
    ****_ Legacy AV/C Controller State Machine
    ****_ Vendor Unique Controller State Machine

    ** AVDECC Talker
    ***_ 可以产生一个或多个 AVTP 流的 AVDECC实体。
    *** 必选
    ****_ IEEE 1722 AVTP Talker
    ****_ ACMP Talker State Machine
    ****_ AEM format
    ****_ AEM Commands
    ****_ AEM Responses
    ****_ AEM Entity State Machine
    *** 可选 <>
    ****_ AEM Entity State Machine
    ****_ Address Access Entity State Machine
    ****_ Legacy A/VC Entity State Machine
    ****_ Vendor Unique Entity State Machine

    ** AVDECC Listener
    ***_ 可以接收一个或多个 AVTP 流的 AVDECC 实体。
    *** 必选
    ****_ IEEE 1722 AVTP Listener
    ****_ ACMP Listener State Machine
    ****_ AEM format
    ****_ AEM Commands
    ****_ AEM Responses
    ****_ AEM Entity State Machine
    *** 可选 <>
    ****_ AEM Entity State Machine
    ****_ Address Access Entity State Machine
    ****_ Legacy A/VC Entity State Machine
    ****_ Vendor Unique Entity State Machine

    ** AVDECC Responder
    ***_ 不实现上述三中角色，但仍使用 AVDECC 协议的实体。
    *** 必选
    ****_ AEM format
    ****_ AEM Commands
    ****_ AEM Responses
    ****_ AEM Entity State Machine
    *** 可选 <>
    ****_ AEM Entity State Machine
    ****_ Address Access Entity State Machine
    ****_ Legacy A/VC Entity State Machine
    ****_ Vendor Unique Entity State Machine
@endmindmap

PulseAudio 中的 dev 如何确定

2023-11-19T00:00:00+08:00

使用 Pulse Audio Simple 的 pa_simple_new() 接口时，如果不希望使用默认设备，则需要指定 dev 参数。

官方文档中，对此的描述是“ Sink (resp. source) name, or NULL for default ”。新手很难根据这句话得到足够的启示。

确定这个 dev 字符串的方法如下：

对于播放设备（ playback ）来说， dev 的值可以通过如下命令查找：

pactl list short sinks

对于录音设备（ record ）来说， dev 的值可以通过如下命令查找：

pactl list short sources

上面两个命令结果中的第二列的字符串就是 dev 参数期望的字符串。

如，下列结果中：

alsa_output.pci-0000_00_1f.3.analog-stereo.monitor	module-alsa-card.c	s16le 2ch 44100Hz	SUSPENDED
alsa_output.platform-snd_aloop.0.analog-stereo.monitor	module-alsa-card.c	s16le 2ch 44100Hz	SUSPENDED
alsa_input.platform-snd_aloop.0.analog-stereo	module-alsa-card.c	s16le 2ch 44100Hz	SUSPENDED

如果要使用“ snd-aloop ” 虚拟出来的设备，则 “ alsa_input.platform-snd_aloop.0.analog-stereo ”就是需要赋值给 dev 的字符串。

去掉命令中的“ short ”，可以看到更多信息。便于寻找合适的设备。

使用 Kconfiglib 实现 menuconfig

2023-11-02T00:00:00+08:00

类似 Kernel 、 toybox 、 busybox 等软件的通过 GUI 界面选择性编译的系统。

一个通用性的选择是基于 Python 的 Kconfiglib 。它的源码发布在 GitHub 上。

安装

对于 Ubuntu 系统，可以直接通过 pip install kconfiglib 来安装。

如果网络有问题，也可以手动安装：

$ git clone https://github.com/ulfalizer/Kconfiglib
$ cd Kconfiglib
$ python setup.py build
$ sudo python setup.py install

使用

基本的使用方法可以直接参考上面给出的网址。

关于 Kconfiglib 的作用，简单的说，就是将一系列由用户编写的的Kconfig文件转换成.config或者config.h。前者可以直接被Makefile利用；后者可以作用于使用C/C++系统的软件。

当然，前者可以通过脚本解析的方式应用于更多的其他使用场景。

KConfig

编写

通过合理的组织Kconfig文件，可以实现多级目录。

例如：

menuconfig XXX_YYY
    bool "YYY of XXX"
    default n
if XXX_YYY
    menuconfig XXX_YYY_ZZZ
        bool "ZZZ of YYY"
        default y
endif # XXX_YYY

这样就能生成一个二级目录。当XXX_YYY为选中状态时，可以进入并操作二级目录中的XXX_YYY_ZZZ。这种写法，会生成两个标识符，分别为CONFIG_XXX_YYY和CONFIG_XXX_YYY_ZZZ。

如果不需要一个名叫CONFIG_XXX_YYY的标识符，也可以直接写成：

menu "YYY of XXX"
    menuconfig XXX_YYY_ZZZ
        bool "ZZZ of YYY"
        default y
endmenu

这种写法，只会生成CONFIG_XXX_YYY_ZZZ。

类型

Kconfig支持多种标识符类型。分别是：

“bool” ：布尔型
“tristate” ：三相
“string” ：字符串
“hex” ： 16进制
“int” ：整数

如上面的例子中就使用了bool类型。

其他

更多使用方法可以参考Kernel的 Kconfig Language 。

CMake

我暂时没找到可以让CMake直接利用.config的方法。所以，写了个脚本来解析.config并生成用于运行cmake的命令行参数：

$ OPTs=$(awk 'BEGIN{
            FS="="
        }
        {
            if(NF==2){
                if($2=="y"){
                    v="ON"
                }
                else if($2=="n"){
                    v="OFF"
                }
                else{
                    v=$2
                }
                printf("-D%s=%s ",$1,v)
            }
        }' $KCONFIG_CONFIG)
$ cmake $SRC $OPTs

由于Kconfig的数据类型中不包含“浮点数”，因此，当需要通过命令行参数传入浮点数时，可以考虑传入字符串，然后使用string命令删除引号。

string(REPLACE "\"" "" CONFIG_XXX_PARAM_YYY ${CONFIG_XXX_PARAM_YYY})

在 Ubuntu 下独立编译内核模块

2023-09-01T00:00:00+08:00

参考了《 Linux驱动实践：带你一步一步编译内核驱动程序》和《 Makefile独立编译ko文件》两篇文章。

hello.c也是直接抄的，懒得重写了。

首先建立一个新的目录。

在其中添加一个叫做hello.c 的文件。内容如下：

#include 
#include 

// 当驱动被加载的时候，执行此函数
static int __init hello_init(void)
{
    printk(KERN_ALERT "welcome, hello\n");
    return 0;
}

// 当驱动被卸载的时候，执行此函数
static void __exit hello_exit(void)
{
    printk(KERN_ALERT "bye, hello\n");
}

// 版权声明
MODULE_LICENSE("GPL");

// 以下两个函数属于 Linux 的驱动框架，只要把驱动两个函数地址注册进去即可。
module_init(hello_init);
module_exit(hello_exit);

然后创建Makefile文件，内容如下：

BUILD_KERNEL=$(shell uname -r)
KSRC := /lib/modules/$(BUILD_KERNEL)/build

obj-m += hello.o

default:
	$(MAKE) -C $(KSRC) M=$(shell pwd) modules

clean:
	$(MAKE) -C $(KSRC) M=$(shell pwd) clean

之后敲make就可以了。

然后就是执行sudo insmod hello.ko和sudo rmmod hello并观察dmesg的输出。

这里需要注意的是，如果你是直接使用apt命令安装的linux-headers-x.x.x-x-generic，那么原则上是一定会好用的。

如果不好用，请优先考虑执行一遍sudo apt upgrade，看看是否当前版本的代码有问题或者干脆安装时出现了遗漏。

我就是发现本地/lib/modules/下的最新的代码是82版本的，但是kernel是79版本。于是，我遇到了如下问题：

执行sudo insmod hello.ko之后，提示insmod: ERROR: could not insert module ./mymod.ko: Invalid module format。

执行dmesg可以看到[ 5180.365546] module: x86/modules: Skipping invalid relocation target, existing value is nonzero for type 1, loc 00000000df2a29e3, val ffffffffc14970b6

sudo apt upgrade之后，问题消失。

以上，在5.15.0-82-generic #91~20.04.1-Ubuntu验证成功。