Julia 备忘清单
===
本备忘清单旨在快速理解 [Julia](https://julialang.org/) 一份简单而粗略的语言概览,供您参考。
入门
---
### Julia 是什么?
- **`Julia`** 是一种为科学计算而生的,开源、多平台、高性能的高级编程语言
- **`Julia`** 有一个基于 LLVM 的 JIT 编译器,这让使用者无需编写底层的代码也能拥有像 C 与 FORTRAN 那样的性能。因为代码在运行中编译,你可以在 shell 或 REPL 中运行代码,这也是一种推荐的工作流程
- **`Julia`** 是动态类型的。并且提供了为并行计算和分布式运算设计的多重派发机制
- **`Julia`** 自带包管理器
- **`Julia`** 有许多内置的数学函数,包括特殊函数 (例如:Gamma 函数)。并且支持开箱即用的复数运算
- **`Julia`** 允许你通过类似 Lisp 的宏来自动生成代码
- **`Julia`** 诞生于 2012 年
### 赋值语句
```julia
answer = 42
x, y, z = 1, [1:10; ], "A string"
x, y = y, x # 交换 x, y
```
### 常量定义
```julia
const DATE_OF_BIRTH = 2012
```
### 行尾注释
```julia
i = 1 # 这是一行注释
# 多行注释
#= 这是另一行注释 =#
```
### 链式操作
```julia
x = y = z = 1 # 从右向左
0 < x < 3 # true
5 < x != y < 5 # false
```
### 函数定义
```julia
function add_one(i)
return i + 1
end
```
### 插入 LaTeX 符号
```julia
\delta + [Tab] # δ
```
### 运算符
:- | :-
:- | :-
基本算数运算 | `+`,`-`,`*`,`/`
幂运算 | `2^3` => 8
除法 | `3/12` => 0.25
反向除法 | `7\3 == 3/7` => true
取余 | `x % y` 或 `rem(x,y)`
取反 | `!true` => false
等于 | `a == b`
不等于 | `a != b` 或 `a ≠ b`
小于与大于 | `<` 与 `>`
小于等于 | `<=` 或 `≤`
大于等于 | `>=` 或 `≥`
逐元素运算(点运算) | `[1, 2, 3] .+ [1, 2, 3] == [2, 4, 6]` => true
`[1, 2, 3] .* [1, 2, 3] == [1, 4, 9]` => true
检测非数值(NaN) | `isnan(NaN)` => true
而不是 `NaN == NaN` => false
三元运算符 | `a == b ? "Equal" : "Not equal"`
短路 AND 和 OR 表达式 | `a && b` 和 `a \|\| b`
对象等价 | `a === b`
### shell/REPL 环境
:- | :-
:- | :-
上一次运算的结果 | `ans`
中断命令执行 | Ctrl + C
清屏 | Ctrl + L
运行程序文件 | `include("filename.jl")`
查找 func 相关的帮助 | `?func`
查找 func 的所有定义 | `apropos("func")`
命令行模式 | `;`
包管理模式 | `]`
帮助模式 | `?`
查找特殊符号输入方式 | `?☆ # "☆" can be typed by \bigwhitestar`
退出特殊模式,返回到 REPL | 在空行上按 Backspace
退出 REPL | `exit()` 或 Ctrl + D
### 缺失值与空值
:- | :-
:- | :-
空值(Null) | `nothing`
缺失数据 | `missing`
浮点数的非数值 | `NaN`
滤除缺失值 | `collect(skipmissing([1, 2, missing])) == [1,2]`
替换缺失值 | `collect((df[:col], 1))`
检查是否有缺失值 | `ismissing(x)` 而不是 `x == missing`
### 自我检查与反射
:- | :-
:- | :-
类型 | `typeof(name)`
类型检查 | `isa(name, TypeName)`
列出子类型 | `subtypes(TypeName)`
列出超类型 | `supertype(TypeName)`
函数方法 | `methods(func)`
即时编译的字节码 | `code_llvm(expr)`
汇编代码 | `code_native(expr)`
### 随机数
:- | :-
:- | :-
设置随机数种子 | `Random.seed!(seed)`
产生随机数 | `rand()` # 均匀分布 [0,1)
`randn()` # 正态分布 (-Inf, Inf)
产生特定分布的随机数 | `using Distributions`
`my_dist = Bernoulli(0.2)` 举例
`rand(my_dist)`
以概率 p 从 A 中进行伯努利抽样 | `randsubseq(A, p)`
随机重排 A 中的元素 | `shuffle(A)`
许多随机数函数都需要 `using Random`
### 异常处理
```julia
# 抛出异常 SomeExcep
throw(SomeExcep())
# 再次引发当前的异常
rethrow()
```
定义新异常 NewExcep
```julia
struct NewExcep <: Exception
v::String
end
Base.showerror(io::IO, e::NewExcep) = print(io, "A problem with $(e.v)!")
throw(NewExcep("x"))
# 抛出带文本的异常
error(msg)
```
异常处理流程
```julia
try
# 进行一些可能会失败的操作
catch ex
if isa(ex, SomeExcep)
# 处理异常 SomeExcep
elseif isa(ex, AnotherExcep)
# 处理另一个异常 AnotherExcep
else
# 处理其余的异常
end
finally
# 永远执行这些语句
end
```
### 类型
```julia
# 类型注释
var::TypeName
# 类型声明
struct Programmer
name::String
birth_year::UInt16
fave_language::AbstractString
end
# 可变类型声明
将 struct 替换为 mutable struct
# 类型别名
const Nerd = Programmer
# 类型构造器
methods(TypeName)
# 类型实例
me = Programmer("Ian", 1984, "Julia")
me = Nerd("Ian", 1984, "Julia")
# 子类型声明
abstract type Bird end
struct Duck <: Bird
pond::String
end
# 参数化类型
struct Point{T <: Real}
x::T
y::T
end
p = Point{Float64}(1,2)
# 联合类型
Union{Int, String}
# 遍历类型层级
supertype(TypeName) 和 subtypes(TypeName)
# 默认的超类型
Any
# 所有字段
fieldnames(TypeName)
# 所有字段类型
TypeName.types
```
### 标准库
:- | :-
:- | :-
Random | `rand`, `randn`, `randsubseq`
Statistics | `mean`, `std`, `cor`, `median`, `quantile`
LinearAlgebra | `I`, `eigvals`, `eigvecs`, `det`, `cholesky`
SparseArrays | `sparse`, `SparseVector`, `SparseMatrixCSC`
Distributed | `@distributed`, `pmap`, `addprocs`
Dates | `DateTime`, `Date`
### 表达式
使用引用 `:( ... )` 或块引用 `quote ... end` 可以创建一个表达式,就像 `parse(str)`,和 `Expr(:call, ...)`。
```julia
x = 1
line = "1 + $x" # 一些代码
expr = Meta.parse(line) # 生成一个 Expr 对象
typeof(expr) == Expr # true
dump(expr) # 打印生成抽象语法(AST)
eval(expr) == 2 # 对 Expr 对象求值: true
```
Julia 具有同像性:程序被表示为语言本身的数据结构。 实际上 `Julia` 语言里的任何东西都是一个表达式 `Expr`。符号(`Symbols`)即驻留字符串 ,以冒号 `:` 为前缀。相对于其他类型来说,符号效率更高。它也经常用作标识符、字典的键或者数据表里的列名。符号不能进行拼接。
### 输入/输出
读取流
```julia
stream = stdin
for line in eachline(stream)
# 做点啥
end
```
读取文件
```julia
open(filename) do file
for line in eachline(file)
# 做点啥
end
end
```
读取/写入 CSV 文件
```julia
# 读取 CSV 文件
using CSV
data = CSV.File(filename)
# 写入 CSV 文件
[label](koajs.md)CSV.write(filename, data)
```
读取/保存 Julia 对象
```julia
using JLD
# 保存 Julia 对象
save(filename, "object_key", object, ...)
# 读取 Julia 对象
d = load(filename) # 返回对象的字典
```
读取/保存 HDF5
```julia
using HDF5
# 保存 HDF5
h5write(filename, "key", object)
# 读取 HDF5
h5read(filename, "key")
```
### 宏
宏允许你在程序中自动生成代码(如:表达式)
```julia
# 定义
macro macroname(expr)
# 做点啥
end
```
使用
```julia
macroname(ex1, ex2, ...) 或 @macroname ex1, ex2, ...
```
内置的宏
```julia
@assert # assert (单元测试)
@which # 查看对特定参数使用的方法/查找函数所在的模块
@time # 运行时间与内存分配统计
@elapsed # 返回执行用时
@allocated # 查看内存分配
@async # 异步任务
using Test
@test # 精确相等
@test x ≈ y # 近似相等 isapprox(x, y)
using Profile
@profile # 优化
```
创建 卫生宏 (hygienic macros)的规则:
- 在宏的内部只通过 `local` 声明本地变量
- 在宏的内部不使用 `eval`
- 转义插值表达式以避免宏变大:`$(esc(expr))`
### 并行计算
并行计算相关的工具可以在标准库 `Distributed` 里找到
```julia
# 启动带 N 各 worker 的 REPL
julia -p N
# 可用的 worker 数量
nprocs()
# 添加 N 个 worker
addprocs(N)
# 查看所有 worker 的 pid
for pid in workers()
println(pid)
end
# 获得正在执行的 worker 的 id
myid()
# 移除 worker
rmprocs(pid)
# 在特定 pid 的 worker 上运行 f(args)
r = remotecall(f, pid, args...)
# 或:
r = @spawnat pid f(args)
...
fetch(r)
# 在特定 pid 的 worker 上运行 f(args) (更高效)
remotecall_fetch(f, pid, args...)
# 在任意 worker 上运行 f(args)
r = @spawn f(args) ... fetch(r)
# 在所有 worker 上运行 f(args)
r = [@spawnat w f(args) for w in workers()] ... fetch(r)
# 让表达式 expr 在所有 worker 上执行
@everywhere expr
# 并行化带规约函数 red 的循环
sum = @distributed (red) for i in 1:10^6
# 进行并行任务
end
# 将 f 用用到集合 coll 中的所有元素上
pmap(f, coll)
```
### 数组
:- | :-
:- | :-
声明数组 | `arr = Float64[]`
预分配内存 | `sizehint!(arr, 10^4)`
访问与赋值 | `arr = Any[1,2]`
`arr[1] = "Some text"`
从 m 到 n 的子数组 | `arr[m:n]`
n 个 `0.0` 填充的数组 | `zeros(n)`
n 个 `1.0` 填充的数组 | `ones(n)`
n 个随机 Int8 填充的数组 | `rand(Int8, n)`
用值 val 填充数组 | `fill!(arr, val)`
弹出最后一个元素 | `pop!(arr)`
弹出第一个元素 | `popfirst!(a)`
n 个 `#undef` 填充的数组 | `Vector{Type}(undef,n)`
n 个从 `start` 到 `stop` 的等间距数 | `range(start,stop=stop,length=n)`
将值 `val` 作为最后一个元素压入数组 | `push!(arr, val)`
将值 `val` 作为第一个元素压入数组 | `pushfirst!(arr, val)`
删除指定索引值的元素 | `deleteat!(arr, idx)`
数组排序 | `sort!(arr)`
将 `b` 连接到 `a` 后 | `append!(a,b)`
转化为字符串,并以 delim 分隔 | `join(arr, delim)`
---
```julia
# 数组比较
a = [1:10;]
b = a # b 指向 a
a[1] = -99
a == b # true
# 复制元素(而不是地址)/深拷贝
b = copy(a)
b = deepcopy(a)
# 检查值 val 是否在数组 arr 中
in(val, arr) # 或
val in arr
# 改变维数
reshape(1:6, 3, 2)' == [1 2 3; 4 5 6]
```
### 线性代数
:- | :-
:- | :-
单位矩阵 | `I`
定义矩阵 | `M = [1 0; 0 1]`
矩阵维数 | `size(M)`
选出第 i 行 | `M[i, :]`
选出第 j 列 | `M[:, j]`
水平拼接 | `M = [a b] 或 M = hcat(a, b)`
竖直拼接 | `M = [a ; b]` 或 `M = vcat(a, b)`
矩阵转置 | `transpose(M)`
共轭转置 | `M'` 或 `adjoint(M)`
迹(trace) | `tr(M)`
行列式 | `det(M)`
秩(rank) | `rank(M)`
特征值 | `eigvals(M)`
特征向量 | `eigvecs(M)`
矩阵求逆 | `inv(M)`
解矩阵方程 `M*x == v` | `M\v` 比 `inv(M)*v` 更好
求 Moore-Penrose 伪逆 | `pinv(M)`
控制流与循环
---
### 条件语句
```julia
if x < y
println("x is less than y")
elseif x > y
println("x is greater than y")
else
println("x is equal to y")
end
```
### for 循环
```julia
for i in 1:10
println(i)
end
```
### 嵌套循环
```julia
for i in 1:10, j = 1:5
println(i*j)
end
```
### 枚举
```julia
for (idx, val) in enumerate(arr)
println("the $idx-th element is $val")
end
```
### while 循环
```julia
while bool_expr
# 做点啥
end
```
### 退出循环
```julia {4}
julia> i = 0
julia> while true
global i += 1
i > 5 && break
println(i)
end
```
### 退出本次循环
```julia {2}
for i = 1:6
iseven(i) && continue
println(i)
end
```
数字相关
---
### 整数类型
`IntN` 和 `UIntN`, 且 `N ∈ {8, 16, 32, 64, 128}`, `BigInt`
### 浮点类型
`FloatN` 且 `N ∈ {16, 32, 64}`
`BigFloat`
### 类型的最大和最小值
```julia
typemin(Int8)
typemax(Int64)
```
### 复数类型
```julia
Complex{T<:Real}
```
### 虚数单位
```julia
im
```
### 机器精度
```julia
eps() # 等价于 eps(Float64)
```
### 圆整
```julia
round() # 浮点数圆整
round(Int, x) # 整数圆整
```
### 类型转换
```julia
# 尝试进行转换/可能会报错
convert(TypeName, val)
# 调用类型构造器转换
TypeName(val)
```
### 全局常量
```julia
pi # 3.1415...
π # 3.1415...
im # real(im * im) == -1
```
### 更多常量
```julia
using Base.MathConstants
```
模块
---
### 定义
```julia
module PackageName
# 添加模块定义
# 使用 export 让定义对外可见
end
```
### 包含文件 filename.jl
```julia
include("filename.jl")
```
### 加载
```julia
using ModuleName # 导出所有名称
# 仅导出 x, y
using ModuleName: x, y
# 仅导出 x, y
using ModuleName.x, ModuleName.y:
# 仅导出 ModuleName
import ModuleName
# 仅导出 x, y
import ModuleName: x, y
# 仅导出 x, y
import ModuleName.x, ModuleName.y
```
`using` 和 `import` 只有一点区别:使用 `using` 时,你需要写 `function Foo.bar(..` 来给 `Foo` 模块的函数 `bar` 增添一个新方法; 而使用 `import Foo.bar` 时,只需写 `function bar(...` 就能达到同样的效果
### 导出
```julia
# 得到模块导出名称的数组
names(ModuleName)
# 包含未导出的、弃用的
# 和编译器产生的名称
names(ModuleName, all::Bool)
# 也显示从其他模块显式导入的名称
names(ModuleName, all::Bool, imported::Bool)
```
包管理
---
### 介绍
一个程序包必须先[注册](https://github.com/JuliaRegistries/General),然后才能在包管理器中看到它。在 Julia 1.0 中,有两种使用包管理器的方法:
- 一是通过 `using Pkg` 导入 `Pkg` 模块,然后用它的函数管理其他包;
- 或者在 REPL 中输入 `]`,然后按回车。进入特殊的交互式包管理模式。 (要从包管理模式返回 REPL,只需要在空行上按退格键 `BACKSPACE` 就行了)
注意新的工具总是先添加到交互式模式中,然后才会加入 `Pkg` 模块
### 在 Julia 会话中使用 Pkg 管理包
:- | :-
:- | :-
列出已安装的包 | `Pkg.status()`
更新所有包 | `Pkg.update()`
安装包 | `Pkg.add("PackageName")`
重新构建包 | `Pkg.build("PackageName")`
使用包 | `using PackageName`
删除包 | `Pkg.rm("PackageName")`
### 交互式包管理模式
:- | :-
:- | :-
添加包 | `add PackageName`
删除包 | `rm PackageName`
更新包 | `update PackageName`
使用开发版本 | `dev PackageName` 或 `dev GitRepoUrl`
返回普通发行版 | `free PackageName`
另见
---
- [Julia 官方网站](https://julialang.org/) _(julialang.org)_
- [快速入门一份简单而粗略的语言概览](https://cheatsheet.juliadocs.org/zh-cn/) _(juliadocs.org)_