Linux系统 2023 年 3 月 4 日

[Linux] 环境变量介绍：什么是环境变量？C/C++如何获取环境变量？环境变量有什么特性？有什么用？

什么是环境变量？认识环境这两个字, 也知道变量是什么, 把这两个词结合起来的环境变量是什么东西？

Linux系统约4601字 -- 阅读时间≈12分钟

环境变量

环境变量的概念

什么是环境变量？认识环境这两个字, 也知道变量是什么, 把这两个词结合起来的环境变量是什么东西？

环境变量, 稍微正式一点来讲, 其实是 在操作系统中用来指定操作系统运行环境的一些参数

这些运行环境具体指的是什么呢？这个不太容易解释, 但是可以举个例子：

在使用Linux系统且没有图形化界面的情况下, 所有的操作都要用命令行的形式执行, 操作系统会提供许多的相关指令, 像这样：

并且可以使用 cd 指令, 再进入这个目录, 并使用 pwd 显示当前路径：

而这些指令, 其实都是一个个程序指令名即为程序名：

这些指令在用户使用的时候运行成为进程, 完成任务之后再从内存中被释放。运行流程与我们个人编写的程序并没有什么区别。

但是为什么我们自己编写的程序不能直接用程序名运行, 而必须指定路径：

这就与操作系统的环境变量有关系了！

实际上, 操作系统中可以直接在命令行使用、不需要指定路径的这些指令(程序), 他们的路径已经被添加到了操作系统的环境变量中

当在操作系统的命令行不指定路径输入指令的时候, 操作系统会自动地在PATH环境变量 设置的路径中搜索是否存在与指令相匹配的程序。如果可以找到那就执行, 如果找不到, 那就会提示 command not found

操作系统中有很多的环境变量, 这些环境变量中设置的内容都是与操作系统运行环境有关的参数, 使用 env 指令可以查看：

博主使用的这台服务器上, 环境变量其实算很少了

上图中可以看到的环境变量有：USER LOGNAME HOME PAHT MAIL SHELL …… 很多

本篇文章对于这些环境变量的介绍, 只会重点涉及到 PATH, 其他的不做重点说明

PATH

PATH 是一个环境变量, 此环境变量用于 指定命令的搜索路径. 就像上面介绍的那样, 当一个程序在此环境变量中的路径下时, 那么此命令就可以不指定路径直接使用.

使用 echo $PATH 可以查看环境变量PATH的内容：

echo $环境变量名 即可查看环境变量的内容

可以看到, PATH中设置的路径有很多：/usr/local/bin /usr/bin /home/July/bin /usr/local/sbin …… 并且, 每个路径之间用 : 分隔

这些路径下都有什么呢？就以 /usr/bin 路径为例：

当你进入这个路径, 并执行 ls指令的时候, 你会发现这个路径下有非常多的可执行程序：

多到数不过来, 这些全部都是可以不指定路径, 在命令行直接执行的程序

那么如果我将我自己的程序, 也添加到PATH中的某个路径下, 是不是就也可以直接执行了呢？测试一下就能得到答案

使程序可在命令行中直接运行

直接在PATH指定的路径下添加程序(不推荐)

我们随便编写一个程序, 将它添加到 PATH环境变量中的某个路径下, 试验一下能否直接运行：

也就是说, 我们自己的程序只要在PATH指定的路径下可以找到, 就能直接在命令行中运行

但是, 这样直接将程序移动到某个路径下的操作有一定的风险, 毕竟不能保证我们自己的程序不会与某个路径下的程序重名

所以, 是不建议直接将成语移动到PATH指定的某个路径下的. 这只是方法一, 还有另一种方法.

测试完, 使用 sudo rm -f /usr/bin/程序 的指令, 将添加的程序删除

将程序所在路径添加到PATH环境变量中

既然直接将程序添加到PATH环境变量中的某路径下存在风险, 那可以采用另一种方法。

直接将程序当前所在路径添加到PATH环境变量中不就可以了吗？

那么就直接操作：

使用pwd命令查看当前路径
export PATH=当前路径
直接运行一下程序

三个操作执行下来, 可以发现我们自己的程序已经可以直接运行了

但是, 当我们需要执行部分其他命令的时候, 你会发现：

在Linux操作系统中经常使用的命令用不了了, 命令行会提示:command not found, 这是为什么?

当再次执行echo $PATH查看PATH的内容时：

发现 PATH内容只剩下了你设置的那一个路径. 其他命令的路径都没有了, 命令也就用不了了

不用担心, export 设置的环境变量只是临时的, 重启一下, 或者关闭XShell端口再开一个, 就可以恢复了

知道了问题出在哪, 但是原因是什么？

原来是因为在添加PATH内容的时候, 直接 PATH=新路径, 不是添加的操作而是覆盖

想要在PATH环境变量中添加路径, 需要这样 PATH=$PATH:新路径, $PATH可以直接表示PATH原来的内容, :是分隔符, 再加上新路径, 就可以完成在PATH环境变量中添加新路径的操作：

给PATH环境变量添加新路径, 其实就是把新路径下的程序、软件安装到了操作系统中, 让操作系统可以直接搜索到软件及指令

环境变量与本地变量

操作系统中的变量, 分环境变量和本地变量

在命令行中, 直接用类似在C语言中定义变量的方式, 就可以在操作系统中定义一个本地变量：

而环境变量的创建, 就需要用到指令了

export

上面介绍PATH时, 使用过export命令, 修改过PATH环境变量的内容

export其实也可以创建一个环境变量：

unset可以将创建的环境变量删除

其他环境变量

上面介绍环境变量的概念时, 使用env命令将当前系统中的环境变量全都列了出来, 可以看到系统中存在许多的环境变量, 下面就简单的介绍一下其中部分的环境变量都是什么：

USER 从字面意思就可以看出, 此环境变量是指当前系统环境的使用用户
LOGNAME 全称应该是LOGINNAME, 指当前登录主机的用户名
HOME 指当前用户的主工作目录

关于 环境变量HOME, 可以切换用户观察其变化

在非root用户使用su命令, 并输入root密码之后, 在查看 环境变量HOME, 可以发现其值改变了：
MAIL 邮箱全局变量
SHELL 指所使用的SHELL目录
PWD 当前所在目录
OLDPWD 上一次所在目录
HOSTNAME 主机名
LS_COLOR 指, ls 列出的文件的配色
LANG 当前系统语言
……

C/C++ 获取环境变量的方式

在前期使用C/C++写代码的时候, 一般情况下 main()函数是不写参数的. 但这并不意味着, main()函数不能存在参数.

C/C++中, main()函数也是可以存在参数的, main()函数可以存在三个参数

main函数的前两个参数: argc 和 argv

main()函数如果使用参数的话, 那么定义main()函数应该是: int main(int argc, char *argv[])

这两个参数, 一个是整型 argc, 另一个是指针数组 argv. 这两个变量都是用来存储什么内容的呢？又是谁给main()函数传参的呢？

既然一个是整型, 一个是数组, 那么不用猜 argc 这个整型是什么了, argc其实是 argv这个数组的元素个数

那 argv这个数组的内容是什么呢？

数组内容其实可以查看, 只需要遍历输出就能看到数组内容：

#include <iostream>
#include <unistd.h>
using std::cout;
using std::endl;

int main(int argc, char *argv[]) {
	for(int i = 0; i < argc; i++) {
		cout << "argv[" << i << "] : " << argv[i] << endl;
	}
	
	return 0;
}

直接执行./mainTest, 此时 argv数组中只有一个元素, 存储的是 ./mainTest 这句指令.

但是, 在 ./mainTest之后添加任意选项时：

可以非常直观的看到, 程序打印的内容变多了, 也就意味着 argv数组中存储的元素变多了. 再一分析, 可以发现, argv数组中多出来的元素其实就是在执行程序时后面任意添加的选项

也就是说, 我们给main()函数添加的 argc 和 argv参数, 其中 argc表示argv数组中元素的个数, 而argv数组中的元素是由命令行参数提供的, 传入的元素是程序名以及选项

这有什么用呢？argv接收了执行程序时后面添加的选项, 又有什么用呢？

请好好思考一下, 既然argv接收了运行程序时后面添加的选项, 那也就意味着在程序中其实是可以获取argv数组中的内容的, 即程序中是可以获取选项的内容的既然能获取选项的内容, 那么也

就可以在程序中实现一些的功能对应特定的选项, 在用户选择特定的选项时, 程序可以做出不同的应答, 从而实现选择不同的选项 实现不同的功能！

这不就是 Linux操作系统中各种命令以及命令选项的实现方式吗？就像：ls -l -a 或 rm -r -f 等一样

有了 argc 和 argv, 我们也可以实现类似的命令行选项功能

比如, 下面这段代码：

#include <iostream>
#include <unistd.h>
#include <string.h>
using std::cout;
using std::endl;

int main(int argc, char *argv[]) {
	if(argc != 4) {         // 数组将会接收4个元素
         cout << "./myCalc [-a|-s|-m|-d] one_data two_data" << endl;     // a=add, s=sub, m=mul, d=div
         return -1;
     }
 
     int one_data = atoi(argv[2]);       // 后两个元素为计算数据
     int two_data = atoi(argv[3]);
 
     if(strcmp("-a", argv[1]) == 0) {
         cout << one_data << " + " << two_data << " = " << one_data + two_data << endl;
     }
     else if(strcmp("-s", argv[1]) == 0) {
         cout << one_data << " - " << two_data << " = " << one_data - two_data << endl;
     }
     else if(strcmp("-m", argv[1]) == 0) {
         cout << one_data << " * " << two_data << " = " << one_data * two_data << endl;
     }
     else if(strcmp("-d", argv[1]) == 0) {
         if(two_data != 0) {
             cout << one_data << " / " << two_data << " = " << one_data / two_data << endl;
         }
         else {
             cout << "two_data is wrong" << endl;
         }
     }
     else {
         cout << "./myCalc [-a|-s|-m|-d] one_data two_data" << endl;
         return -1;
     }

	return 0;
}

此代码编译链接出来的程序, 是一个简单的命令行版的整数加减乘除计算器：

可以做到以下功能：

使用：./程序 [-a|-s|-m|-d](加减乘除) 数据1 数据2
当输入出错时, 会提醒使用方法： ./myCalc [-a|-s|-m|-d] one_data two_data
简单的整数加减乘除

main()函数第三个参数 env

main()函数的第三个参数为：char *env[], 也是一个指针数组

所以, 把 main()函数的三个参数都明示出来, main()函数就是这样定义的：int main(int argc, char *argv[], char *env[])

看到第三个参数的参数名, 一定就能想到 此参数与环境变量有关, 因为 Linux中env的作用就是将当前系统的环境变量列出来

事实也确实如此, 这 env数组, 其实就是接收环境变量用的, 即env就是一张环境变量表, 数组中每个元素存储的都是环境变量, 且存储顺序与使用env命令时列出的顺序相同, 类似这样：

即env数组中的最后一个元素为NULL, 所以可以直接for循环以遇到到NULL为结束条件进行数组遍历：

C/C++ 获取环境变量

上面使用main()函数的第三个参数, 来获取系统的环境变量是 C/C++ 获取环境变量的第一种方法

C/C++ 获取环境变量一共有三种方法：

environ变量获取环境变量

environ是一个全局变量, 并且此全局变量没有在任何头文件中包含, 所以在使用此全局变量时需要用 extern声明

environ可以看作一个数组指针, 它指向了环境变量表, 即 environ指向了env这个指针数组

使用它的方法, 与使用env数组的方法一致：

#include <iostream>
using std::cout;
using std::endl;

int main() {
	extern char **environ;
	for(int i = 0; environ[i]; i++) {
		cout << environ[i] << endl;
	}
	
	return 0;
}

系统调用getenv()获取环境变量

getenv()是Liunx系统提供的系统调用：

此函数调用的参数传入的是需要查找的函数变量的变量名, 即这部分等号左边的全大写字母的内容：

将变量名字符串传入 getenv系统调用, 就可以获得对应环境变量的内容：

#include <iostream>
#include <stdlib.h>
using std::cout;
using std::endl;

int main() {
	char *Var = getenv("SHELL");
	cout << Var << endl;
	
	return 0;
}

获取环境变量的作用

介绍了三种C/C++获取环境变量的方法, 但是好像并没有什么意义. 好像用不太到.

其实获取环境变量还是很有作用的, 其作用之一就是, 可以限制程序功能的使用对象：

#include <iostream>
#include <stdlib.h>
#include <string.h>
using std::cout;
using std::endl;

int main() {
	char *User = getenv("USER");
	if(strcmp("July", User) == 0) {
		// 程序功能代码：……
		cout << "可以执行" << endl;
	}
	else {
		cout << "用户错误" << endl;
	}
	
	return 0;
}

像这样, 在程序内部设置用户限制, 即使是root用户也无法突破限制

* 为什么环境变量具有全局性

在回答这个问题之前, 先思考另外一个问题, 环境变量是谁给进程的？

当我们运行自己的程序的时候, 我们可以发现此进程的父进程是zsh(bash)这类SHELL进程, 无论怎么运行、重新运行多少次, 进程的父进程永远都是SHELL进程：

无论进程重新运行多少次, 变得永远都是PID, 而不是PPID, 除非SHELL进程也重新运行

其实还有一个细节：当从命令行运行top时：

运行 gdb时：

或者运行其他程序时：

可以发现, 只要是用命令行运行的进程, 其父进程一定是zsh(bash)这样的SHELL进程

而这些子进程都可以读取环境变量, 所以其实, 环境变量可以被子进程继承下去, 也就是说 子进程的环境变量来源于父进程

就我们从命令行运行的进程来说, 这些进程的环境变量的来源都是SHELL进程

而SHELL进程的环境变量也来源于它的父进程, 这样一直往上推, 可以推到 1号进程：

但是暂且不论, 是否来源于1号进程

既然

所有从命令行运行的进程的父进程都是SHELL进程, 而子进程可以从父进程继承环境变量, 意思就是环境变量可以从SHELL进程一直继承下去, 那么是不是就可以说环境变量拥有全局性呢？

环境变量可以被子进程继承下去, 那么对应的本地变量其实就是SHELL进程内部创建的变量, 也就不会被子进程继承下去.

而不会被子进程继承下去, 是否就是env等命令无法查找到本地变量的原因呢？

答案是肯定的。

但如果是这样, 就又出现了另外一个问题：既然本地变量不能被子进程继承, 那么为什么echo、set等命令, 又可以查找到本地变量？

其实, Linux系统中的绝大部分命令都是以SHELL进程的子进程的形式运行的, 但是就是存在那一小部分命令并不通过子进程的方式执行, 而是SHELL自己执行.

SHELL也是会调用自己的相应的函数来完成部分功能的, 我们把这种不通过子进程的形式执行的命令, 称为自建命令

作者：哈米d1ch 发表日期：2023 年 3 月 4 日