Use fused softmax kernel in llama attention layer #3584

	name: CI
	on:
	pull_request:

	jobs:
	test:
	name: Test candle-book
	runs-on: ubuntu-latest
	permissions:
	contents: write # To push a branch
	pull-requests: write # To create a PR from that branch
	steps:
	- uses: actions/checkout@master
	- name: Install Rust
	run: \|
	rustup set profile minimal
	rustup toolchain install stable
	rustup default stable
	- name: Install latest mdbook
	run: \|
	tag=$(curl 'https://github.com/repos/rust-lang/mdbook/releases/latest' \| jq -r '.tag_name')
	url="https://github.com/rust-lang/mdbook/releases/download/${tag}/mdbook-${tag}-x86_64-unknown-linux-gnu.tar.gz"
	mkdir bin
	curl -sSL $url \| tar -xz --directory=bin
	echo "$(pwd)/bin" >> $GITHUB_PATH
	- name: Run tests
	run: cd candle-book && cargo build && mdbook test -L ../target/debug/deps/

Provide feedback