7月13号的时候,突然翻不了墙了。但是同时http服务或者SSH服务却全都正常。我以为是我前一天升级了服务器导致的。于是选择了重装。结果还是不行。
经过了一天的调试,最终发现,原来是墙封了我的VPS的IP的433端口。没办法,之后重新又开了一台VPS。
又过了快一周的时间,我在推上看到有人说是因为开会的缘故。
记录一下,下一次就不用浪费这么多时间了。
7月13号的时候,突然翻不了墙了。但是同时http服务或者SSH服务却全都正常。我以为是我前一天升级了服务器导致的。于是选择了重装。结果还是不行。
经过了一天的调试,最终发现,原来是墙封了我的VPS的IP的433端口。没办法,之后重新又开了一台VPS。
又过了快一周的时间,我在推上看到有人说是因为开会的缘故。
记录一下,下一次就不用浪费这么多时间了。
使用Ollama也有一些时间。从小白阶段,只懂按照命令行运行。到现在会自己从抱抱脸选择官方没有的模型自己进行导入。甚至创建局域网内部的服务器,使用应用调用Ollama的API。是时候总结一下Ollama本地运行大模型的一些技巧了。
新手一般会使用
ollama serve
启动Ollama,并使用ctrl+c结束运行。
我们还可以使用服务的方式运行Ollama。这样Ollama在系统启动之后就会在后台调用,可以随时调用。
brew services start ollama
需要注意的是,如果你是了此种方式。那么每次ollama升级之后,需要使用
brew services restart ollama
重新启动Ollama服务。
默认情况下,Ollama只会关注localhost的11434端口,因此只能从本机访问。局域网的其它电脑无法使用。我们可以修改设置,然后重启Ollama服务。这样局域网内的其它电脑就都可以使用Ollama了。
launchctl setenv OLLAMA_HOST "0.0.0.0"
brew services restart ollama
我们可以这个命令,查看Ollama运行的状态
lsof -i -P | grep ollama
如果你看到的是这个,就证明成功了
ollama 602 zhaoxin 3u IPv6 0xb435894e8a5320f 0t0 TCP *:11434 (LISTEN)
如果你想固定上面的设置。那么就需要修改/opt/homebrew/opt/ollama/homebrew.mxcl.ollama.plist文件,为它添加:
<key>EnvironmentVariables</key>
<dict>
<key>OLLAMA_HOST</key>
<string>0.0.0.0</string>
</dict>
然后停止Ollama服务,并重新开启。注意,我发现用restart不行。必须先stop,然后重新start。不然重启之后,就还是只有localhost。
brew services stop ollama
brew services start ollama
https://github.com/ollama/ollama/blob/main/docs/faq.md
https://github.com/ollama/ollama/issues/3581
模型的选择首选是基于功能。不同的模型擅长的领域不同。比如某些模型不支持特定的语言,某些模型具备识别图片的能力,有些模型更擅长编程等。
其次就是版本的选择。总的来说,就是越小的模型,运行时的反应越快,但是同一个模型,越大的模型的输出结果越好。因此,我们需要要在结果准确性和推理速度中作出权衡。一般来说,如果你的电脑只有8GB内存。那么你也就只能选择7B以下的模型,默认模型能跑就不错了。而如果你有16GB内存,那么你最高可以运行13B的模型。而7B模型,也可以选择参数更高的版本比如7B-4bit-K_M之类的。它会标准的标准的4bit性能要好一些。
Ollama是llama.cpp的。它支持所有gguf格式模型文件。因此我们在抱抱脸上搜索模型名+gguf,就能下载Ollama官网没有的模型。然后可以通过创建Modefile文件的方式进行导入。格式就是:
FROM gguf文件地址
然后执行
ollama create 模型名 -f Modefile
等一会,这个模型就被导入Ollama了并能使用了。
下面这段只有程序员需要。
Ollama支持OpenAI的API的兼容调用方式。这样可以更好复用代码。不过这种方式调用目前只支持chat api的调用。并且不支持Vision。
因此如果你使用下面这两个API的时候,还是需要Ollam的自有API。
https://github.com/ollama/ollama/blob/main/docs/api.md#list-local-models
https://github.com/ollama/ollama/blob/main/docs/api.md#generate-a-chat-completion
最近SSR实在太不稳定了。断断续续的十分难受。于是,趁着还能上的时间,查询新的翻墙方法。经过测试,决定使用Trojan的方式。

Trojan服务器获得HTTP请求,如果请求的格式正确,就返回代理的数据,否则就返回HTTP网页,这样在第三方看来Trojan就和一台HTTP服务器没区别。
虽然Trojan可以伪装为HTTP服务器,但是它的服务很基本,比如根本不支持虚拟多站点,只能伪装成一个站点。
因此,(为了省钱,)我们还需要另外搭配Nginx来使用。

HTTP访问Nginx,开启了预读模块的Nginx,会对数据流进行分析,如果访问的域名是Trojan预先定义的域名,就访问内部的Trojan端口。否则则访问Nginx的端口。有以下几点需要注意:
sudo apt remove apache2
sudo apt autoremove
删除apache2,之后删除掉不再需要的依赖。
Ubuntu 18.04自带的Nginx本身没有开启ngx_stream_ssl_preread_module。我们安装Nginx官方提供的版本,这个版本开启了所有的可开启扩展。
sudo vi /etc/apt/sources.list
在文件最下面添加并保存
# for latest nginx
deb http://nginx.org/packages/mainline/ubuntu/ bionic nginx
deb-src http://nginx.org/packages/mainline/ubuntu/ bionic nginx
添加服务器签名,签名在这里nginx_signing.key。点开前面的网页,复制里面的文本内容,保存到nginx_signing.key。不要直接下载。因为是网页,不是纯文本。
sudo apt-key add nginx_signing.key
安装Nginx并开启防火墙端口
sudo apt update
sudo apt install nginx
sudo ufw allow 'Nginx Full'
你现在可以打开浏览器,然后输入vps的ip地址,如果看到了nginx的欢迎界面,就代表nginx配置成功了。
假设你有一个网站叫example.com,网页位置在/var/www/html/example.com/html。新建一个配置文件。
sudo vi /etc/nginx/sites-available/example.com
内容如下
server {
listen 80;
listen [::]:80;
server_name example.com www.example.com;
root `/var/www/html/example.com/html;
index index.html;
location / {
try_files ``uri ``uri/ =404;
}
}
我们不用添加443端口,因为等下添加证书的时候,Certbot会帮我们自动生成新的配置文件。
将网站配置生效
sudo ln -s /etc/nginx/sites-available/example.com /etc/nginx/sites-enable
sudo systemctl reload nginx
参考上面的步骤,添加你所有的站点。之后,再额外添加一个站点,用于Trojan的识别。
最后添加的站点,一定要是一个不需要用的二级域名,而不要使用一级域名。因为我发现Nginx的预读有bug。如果你使用了一级域名,那么它的二级域名也都会匹配。这将导致错误。
一级域名指的是example.com这种,二级指的是mail.example.com这种。
这里我们假设额外配置一个叫tro.example.com的二级域名站点。
通过浏览器访问网站https://certbot.eff.org,选择Nginx和Ubuntu 18.04,安照网站的提示安装certbot。
sudo apt-get update
sudo apt-get install software-properties-common
sudo add-apt-repository universe
sudo add-apt-repository ppa:certbot/certbot
sudo apt-get update
sudo apt-get install certbot python3-certbot-nginx
申请证书
sudo certbot --nginx
按照提示进行操作。完成之后,你再通过浏览器访问网站,你会发现已经是https的了。
sudo bash -c "$(curl -fsSL https://raw.githubusercontent.com/trojan-gfw/trojan-quickstart/master/trojan-quickstart.sh)"
sudo vi /usr/local/etc/trojan/config.json
找到"local_port",将443,改成4433或者你希望的端口。
找到"password",修改为你想要设置的密码。
找到"ssl",将"cert"设置为“/etc/letsencrypt/live/example.com/fullchain.pem"。将"key"设置为"/etc/letsencrypt/live/example.com/privkey.pem"。
保存并退出。运行Trojan。设置为开机启动。
sudo systemctl start trojan
sudo systemctl enable trojan
sudo vi /etc/nginx/nginx.conf
在events和http两段之间,插入
stream {
map ``ssl_preread_server_name ``name {
tro.example.com trojan;
default nginx;
}
upstream trojan {
server 127.0.0.1:4433;
}
upstream nginx {
server 127.0.0.1:4443;
}
server {
listen 443;
listen [::]:443;
proxy_pass $name;
ssl_preread on;
}
}
保存,修改之前设置的所有网站的设置。打开/etc/nginx/sites-enable/中所有的网站的配置,将所有的443端口,改成4443端口,然后保存。
sudo systemctl reload nginx
在好多支持Trojan的客户端中,域名是可选的。但是由于我们需要使用域名来进行跳转,所以在设置客户端时,域名是必填的,必须填写为
tro.example.com。
Module ngx_stream_ssl_preread_module
sudo echo "net.core.default_qdisc=fq" >> /etc/sysctl.conf
sudo echo "net.ipv4.tcp_congestion_control=bbr" >> /etc/sysctl.conf
sysctl -p
Ubuntu 18.04/18.10快速开启Google BBR的方法
19.04开始,BBR是默认开启的,不用单独开。