Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks
Paper
• 1908.10084 • Published
• 12
This is a sentence-transformers model finetuned from BAAI/bge-m3. It maps sentences & paragraphs to a 1024-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more.
SentenceTransformer(
(0): Transformer({'max_seq_length': 512, 'do_lower_case': False}) with Transformer model: XLMRobertaModel
(1): Pooling({'word_embedding_dimension': 1024, 'pooling_mode_cls_token': True, 'pooling_mode_mean_tokens': False, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True})
(2): Normalize()
)
First install the Sentence Transformers library:
pip install -U sentence-transformers
Then you can load this model and run inference.
from sentence_transformers import SentenceTransformer
# Download from the 🤗 Hub
model = SentenceTransformer("comet24082002/ft_bge_newLaw_SoftmaxLoss_V1_5epochs")
# Run inference
sentences = [
'Quy định cụ thể về ngân hàng đất nông nghiệp như thế nào?',
'Ngân hàng đất nông nghiệp\n1. Ngân hàng đất nông nghiệp là doanh nghiệp nhà nước do Chính phủ thành lập theo quy định của pháp luật về doanh nghiệp.\n2. Ngân hàng đất nông nghiệp có chức năng tạo lập quỹ đất nông nghiệp thông qua việc thuê quyền sử dụng đất, nhận chuyển nhượng quyền sử dụng đất, nhận ký gửi quyền sử dụng đất nông nghiệp; cho nhà đầu tư có nhu cầu thuê, thuê lại đất để sản xuất nông nghiệp.\n3. Hoạt động của Ngân hàng đất nông nghiệp không vì mục đích lợi nhuận, được Nhà nước bảo đảm khả năng thanh toán, được miễn thuế và các khoản phải nộp ngân sách nhà nước.\n4. Kinh phí hoạt động của Ngân hàng đất nông nghiệp được cấp từ ngân sách nhà nước; ứng từ Quỹ phát triển đất hoặc Quỹ đầu tư phát triển, quỹ tài chính khác được ủy thác; vay từ các tổ chức tín dụng được phép hoạt động tại Việt Nam; huy động vốn của các tổ chức, cá nhân và các nguồn khác theo quy định của pháp luật để thực hiện việc tạo lập quỹ đất quy định tại khoản 2 Điều này.\n5. Chính phủ quy định chi tiết Điều này.',
'Thời điểm lập hóa đơn\n1. Thời điểm lập hóa đơn đối với bán hàng hóa (bao gồm cả bán tài sản nhà nước, tài sản tịch thu, sung quỹ nhà nước và bán hàng dự trữ quốc gia) là thời điểm chuyển giao quyền sở hữu hoặc quyền sử dụng hàng hóa cho người mua, không phân biệt đã thu được tiền hay chưa thu được tiền.\n2. Thời điểm lập hóa đơn đối với cung cấp dịch vụ là thời điểm hoàn thành việc cung cấp dịch vụ không phân biệt đã thu được tiền hay chưa thu được tiền. Trường hợp người cung cấp dịch vụ có thu tiền trước hoặc trong khi cung cấp dịch vụ thì thời điểm lập hóa đơn là thời điểm thu tiền (không bao gồm trường hợp thu tiền đặt cọc hoặc tạm ứng để đảm bảo thực hiện hợp đồng cung cấp các dịch vụ: kế toán, kiểm toán, tư vấn tài chính, thuế; thẩm định giá; khảo sát, thiết kế kỹ thuật; tư vấn giám sát; lập dự án đầu tư xây dựng).\n3. Trường hợp giao hàng nhiều lần hoặc bàn giao từng hạng mục, công đoạn dịch vụ thì mỗi lần giao hàng hoặc bàn giao đều phải lập hóa đơn cho khối lượng, giá trị hàng hóa, dịch vụ được giao tương ứng.\n...\nThời điểm xác định thuế GTGT\n1. Đối với bán hàng hóa là thời điểm chuyển giao quyền sở hữu hoặc quyền sử dụng hàng hóa cho người mua, không phân biệt đã thu được tiền hay chưa thu được tiền.\n...',
]
embeddings = model.encode(sentences)
print(embeddings.shape)
# [3, 1024]
# Get the similarity scores for the embeddings
similarities = model.similarity(embeddings, embeddings)
print(similarities.shape)
# [3, 3]
sentence1, sentence2, and label| sentence1 | sentence2 | label | |
|---|---|---|---|
| type | string | string | int |
| details |
|
|
|
| sentence1 | sentence2 | label |
|---|---|---|
Nguyên tắc để lựa chọn người thực hiện giám định tư pháp về hải quan trong lĩnh vực tài chính ra sao? |
Nguyên tắc lựa chọn, phân công người, tổ chức thực hiện giám định tư pháp trong lĩnh vực tài chính |
1 |
Tổ trưởng Tổ kiểm toán nhà nước cần đáp ứng những tiêu chuẩn gì? |
IV. THỐNG KÊ VIÊN TRÌNH ĐỘ CAO ĐẲNG |
0 |
Phụ cấp ưu đãi đối với viên chức chuyên môn làm việc tại Trạm Thú y nơi có phụ cấp khu vực là 0,7 được chi trả khi nào? |
CÁCH TÍNH VÀ NGUỒN KINH PHÍ CHI TRẢ PHỤ CẤP |
1 |
SoftmaxLossper_device_train_batch_size: 4learning_rate: 2e-05num_train_epochs: 5warmup_ratio: 0.1overwrite_output_dir: Falsedo_predict: Falseprediction_loss_only: Trueper_device_train_batch_size: 4per_device_eval_batch_size: 8per_gpu_train_batch_size: Noneper_gpu_eval_batch_size: Nonegradient_accumulation_steps: 1eval_accumulation_steps: Nonelearning_rate: 2e-05weight_decay: 0.0adam_beta1: 0.9adam_beta2: 0.999adam_epsilon: 1e-08max_grad_norm: 1.0num_train_epochs: 5max_steps: -1lr_scheduler_type: linearlr_scheduler_kwargs: {}warmup_ratio: 0.1warmup_steps: 0log_level: passivelog_level_replica: warninglog_on_each_node: Truelogging_nan_inf_filter: Truesave_safetensors: Truesave_on_each_node: Falsesave_only_model: Falseno_cuda: Falseuse_cpu: Falseuse_mps_device: Falseseed: 42data_seed: Nonejit_mode_eval: Falseuse_ipex: Falsebf16: Falsefp16: Falsefp16_opt_level: O1half_precision_backend: autobf16_full_eval: Falsefp16_full_eval: Falsetf32: Nonelocal_rank: 0ddp_backend: Nonetpu_num_cores: Nonetpu_metrics_debug: Falsedebug: []dataloader_drop_last: Falsedataloader_num_workers: 0dataloader_prefetch_factor: Nonepast_index: -1disable_tqdm: Falseremove_unused_columns: Truelabel_names: Noneload_best_model_at_end: Falseignore_data_skip: Falsefsdp: []fsdp_min_num_params: 0fsdp_config: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False}fsdp_transformer_layer_cls_to_wrap: Noneaccelerator_config: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True}deepspeed: Nonelabel_smoothing_factor: 0.0optim: adamw_torchoptim_args: Noneadafactor: Falsegroup_by_length: Falselength_column_name: lengthddp_find_unused_parameters: Noneddp_bucket_cap_mb: Noneddp_broadcast_buffers: Falsedataloader_pin_memory: Truedataloader_persistent_workers: Falseskip_memory_metrics: Trueuse_legacy_prediction_loop: Falsepush_to_hub: Falseresume_from_checkpoint: Nonehub_model_id: Nonehub_strategy: every_savehub_private_repo: Falsehub_always_push: Falsegradient_checkpointing: Falsegradient_checkpointing_kwargs: Noneinclude_inputs_for_metrics: Falsefp16_backend: autopush_to_hub_model_id: Nonepush_to_hub_organization: Nonemp_parameters: auto_find_batch_size: Falsefull_determinism: Falsetorchdynamo: Noneray_scope: lastddp_timeout: 1800torch_compile: Falsetorch_compile_backend: Nonetorch_compile_mode: Nonedispatch_batches: Nonesplit_batches: Noneinclude_tokens_per_second: Falseinclude_num_input_tokens_seen: Falseneftune_noise_alpha: Noneoptim_target_modules: Nonebatch_sampler: batch_samplermulti_dataset_batch_sampler: proportional| Epoch | Step | Training Loss |
|---|---|---|
| 0.0190 | 50 | 0.6915 |
| 0.0380 | 100 | 0.691 |
| 0.0570 | 150 | 0.6923 |
| 0.0760 | 200 | 0.6911 |
| 0.0950 | 250 | 0.6912 |
| 0.1140 | 300 | 0.6906 |
| 0.1330 | 350 | 0.6865 |
| 0.1520 | 400 | 0.6889 |
| 0.1710 | 450 | 0.6847 |
| 0.1900 | 500 | 0.6831 |
| 0.2090 | 550 | 0.6755 |
| 0.2281 | 600 | 0.6871 |
| 0.2471 | 650 | 0.6858 |
| 0.2661 | 700 | 0.691 |
| 0.2851 | 750 | 0.6864 |
| 0.3041 | 800 | 0.6864 |
| 0.3231 | 850 | 0.6904 |
| 0.3421 | 900 | 0.6758 |
| 0.3611 | 950 | 0.679 |
| 0.3801 | 1000 | 0.6823 |
| 0.3991 | 1050 | 0.6835 |
| 0.4181 | 1100 | 0.6963 |
| 0.4371 | 1150 | 0.7012 |
| 0.4561 | 1200 | 0.6917 |
| 0.4751 | 1250 | 0.6969 |
| 0.4941 | 1300 | 0.6971 |
| 0.5131 | 1350 | 0.6989 |
| 0.5321 | 1400 | 0.6947 |
| 0.5511 | 1450 | 0.6943 |
| 0.5701 | 1500 | 0.6942 |
| 0.5891 | 1550 | 0.6955 |
| 0.6081 | 1600 | 0.6934 |
| 0.6271 | 1650 | 0.6883 |
| 0.6461 | 1700 | 0.6991 |
| 0.6651 | 1750 | 0.6915 |
| 0.6842 | 1800 | 0.6962 |
| 0.7032 | 1850 | 0.6938 |
| 0.7222 | 1900 | 0.6935 |
| 0.7412 | 1950 | 0.6928 |
| 0.7602 | 2000 | 0.6938 |
| 0.7792 | 2050 | 0.6915 |
| 0.7982 | 2100 | 0.6968 |
| 0.8172 | 2150 | 0.691 |
| 0.8362 | 2200 | 0.693 |
| 0.8552 | 2250 | 0.6956 |
| 0.8742 | 2300 | 0.6943 |
| 0.8932 | 2350 | 0.6929 |
| 0.9122 | 2400 | 0.6944 |
| 0.9312 | 2450 | 0.6943 |
| 0.9502 | 2500 | 0.6924 |
| 0.9692 | 2550 | 0.6936 |
| 0.9882 | 2600 | 0.6928 |
| 1.0072 | 2650 | 0.694 |
| 1.0262 | 2700 | 0.6935 |
| 1.0452 | 2750 | 0.6954 |
| 1.0642 | 2800 | 0.6928 |
| 1.0832 | 2850 | 0.6945 |
| 1.1022 | 2900 | 0.6931 |
| 1.1212 | 2950 | 0.694 |
| 1.1403 | 3000 | 0.6936 |
| 1.1593 | 3050 | 0.6939 |
| 1.1783 | 3100 | 0.6942 |
| 1.1973 | 3150 | 0.6937 |
| 1.2163 | 3200 | 0.6931 |
| 1.2353 | 3250 | 0.6933 |
| 1.2543 | 3300 | 0.6951 |
| 1.2733 | 3350 | 0.6935 |
| 1.2923 | 3400 | 0.6932 |
| 1.3113 | 3450 | 0.6942 |
| 1.3303 | 3500 | 0.6943 |
| 1.3493 | 3550 | 0.6942 |
| 1.3683 | 3600 | 0.6939 |
| 1.3873 | 3650 | 0.693 |
| 1.4063 | 3700 | 0.6916 |
| 1.4253 | 3750 | 0.6927 |
| 1.4443 | 3800 | 0.6944 |
| 1.4633 | 3850 | 0.6893 |
| 1.4823 | 3900 | 0.6971 |
| 1.5013 | 3950 | 0.6952 |
| 1.5203 | 4000 | 0.6929 |
| 1.5393 | 4050 | 0.6948 |
| 1.5583 | 4100 | 0.6934 |
| 1.5773 | 4150 | 0.6922 |
| 1.5964 | 4200 | 0.6944 |
| 1.6154 | 4250 | 0.692 |
| 1.6344 | 4300 | 0.6947 |
| 1.6534 | 4350 | 0.6944 |
| 1.6724 | 4400 | 0.6932 |
| 1.6914 | 4450 | 0.6935 |
| 1.7104 | 4500 | 0.6935 |
| 1.7294 | 4550 | 0.6924 |
| 1.7484 | 4600 | 0.6915 |
| 1.7674 | 4650 | 0.692 |
| 1.7864 | 4700 | 0.695 |
| 1.8054 | 4750 | 0.6948 |
| 1.8244 | 4800 | 0.6942 |
| 1.8434 | 4850 | 0.6916 |
| 1.8624 | 4900 | 0.6928 |
| 1.8814 | 4950 | 0.694 |
| 1.9004 | 5000 | 0.6938 |
| 1.9194 | 5050 | 0.6934 |
| 1.9384 | 5100 | 0.6934 |
| 1.9574 | 5150 | 0.695 |
| 1.9764 | 5200 | 0.6935 |
| 1.9954 | 5250 | 0.694 |
| 2.0144 | 5300 | 0.6928 |
| 2.0334 | 5350 | 0.6971 |
| 2.0525 | 5400 | 0.6939 |
| 2.0715 | 5450 | 0.6926 |
| 2.0905 | 5500 | 0.6922 |
| 2.1095 | 5550 | 0.6936 |
| 2.1285 | 5600 | 0.6903 |
| 2.1475 | 5650 | 0.6982 |
| 2.1665 | 5700 | 0.6919 |
| 2.1855 | 5750 | 0.6928 |
| 2.2045 | 5800 | 0.6921 |
| 2.2235 | 5850 | 0.6948 |
| 2.2425 | 5900 | 0.6932 |
| 2.2615 | 5950 | 0.6946 |
| 2.2805 | 6000 | 0.691 |
| 2.2995 | 6050 | 0.6928 |
| 2.3185 | 6100 | 0.6956 |
| 2.3375 | 6150 | 0.6934 |
| 2.3565 | 6200 | 0.6924 |
| 2.3755 | 6250 | 0.691 |
| 2.3945 | 6300 | 0.6898 |
| 2.4135 | 6350 | 0.6925 |
| 2.4325 | 6400 | 0.694 |
| 2.4515 | 6450 | 0.6944 |
| 2.4705 | 6500 | 0.6943 |
| 2.4895 | 6550 | 0.6939 |
| 2.5086 | 6600 | 0.6936 |
| 2.5276 | 6650 | 0.6939 |
| 2.5466 | 6700 | 0.6927 |
| 2.5656 | 6750 | 0.6927 |
| 2.5846 | 6800 | 0.6942 |
| 2.6036 | 6850 | 0.6937 |
| 2.6226 | 6900 | 0.6922 |
| 2.6416 | 6950 | 0.6941 |
| 2.6606 | 7000 | 0.6938 |
| 2.6796 | 7050 | 0.6941 |
| 2.6986 | 7100 | 0.6941 |
| 2.7176 | 7150 | 0.6936 |
| 2.7366 | 7200 | 0.6942 |
| 2.7556 | 7250 | 0.6923 |
| 2.7746 | 7300 | 0.6923 |
| 2.7936 | 7350 | 0.6922 |
| 2.8126 | 7400 | 0.6944 |
| 2.8316 | 7450 | 0.6933 |
| 2.8506 | 7500 | 0.6914 |
| 2.8696 | 7550 | 0.6939 |
| 2.8886 | 7600 | 0.6942 |
| 2.9076 | 7650 | 0.6935 |
| 2.9266 | 7700 | 0.6917 |
| 2.9456 | 7750 | 0.6918 |
| 2.9647 | 7800 | 0.6934 |
| 2.9837 | 7850 | 0.6937 |
| 3.0027 | 7900 | 0.6925 |
| 3.0217 | 7950 | 0.6938 |
| 3.0407 | 8000 | 0.691 |
| 3.0597 | 8050 | 0.6918 |
| 3.0787 | 8100 | 0.6923 |
| 3.0977 | 8150 | 0.6899 |
| 3.1167 | 8200 | 0.6946 |
| 3.1357 | 8250 | 0.6904 |
| 3.1547 | 8300 | 0.6967 |
| 3.1737 | 8350 | 0.6944 |
| 3.1927 | 8400 | 0.6937 |
| 3.2117 | 8450 | 0.6934 |
| 3.2307 | 8500 | 0.6937 |
| 3.2497 | 8550 | 0.6927 |
| 3.2687 | 8600 | 0.6932 |
| 3.2877 | 8650 | 0.6925 |
| 3.3067 | 8700 | 0.6944 |
| 3.3257 | 8750 | 0.6937 |
| 3.3447 | 8800 | 0.6936 |
| 3.3637 | 8850 | 0.6925 |
| 3.3827 | 8900 | 0.6942 |
| 3.4017 | 8950 | 0.6926 |
| 3.4208 | 9000 | 0.693 |
| 3.4398 | 9050 | 0.6941 |
| 3.4588 | 9100 | 0.6908 |
| 3.4778 | 9150 | 0.6929 |
| 3.4968 | 9200 | 0.6955 |
| 3.5158 | 9250 | 0.6935 |
| 3.5348 | 9300 | 0.6938 |
| 3.5538 | 9350 | 0.6932 |
| 3.5728 | 9400 | 0.6932 |
| 3.5918 | 9450 | 0.6928 |
| 3.6108 | 9500 | 0.6936 |
| 3.6298 | 9550 | 0.6934 |
| 3.6488 | 9600 | 0.6942 |
| 3.6678 | 9650 | 0.6931 |
| 3.6868 | 9700 | 0.6935 |
| 3.7058 | 9750 | 0.6931 |
| 3.7248 | 9800 | 0.6926 |
| 3.7438 | 9850 | 0.694 |
| 3.7628 | 9900 | 0.6932 |
| 3.7818 | 9950 | 0.6923 |
| 3.8008 | 10000 | 0.6937 |
| 3.8198 | 10050 | 0.6929 |
| 3.8388 | 10100 | 0.6917 |
| 3.8578 | 10150 | 0.6936 |
| 3.8769 | 10200 | 0.6938 |
| 3.8959 | 10250 | 0.6932 |
| 3.9149 | 10300 | 0.6917 |
| 3.9339 | 10350 | 0.696 |
| 3.9529 | 10400 | 0.6942 |
| 3.9719 | 10450 | 0.6935 |
| 3.9909 | 10500 | 0.6928 |
| 4.0099 | 10550 | 0.6929 |
| 4.0289 | 10600 | 0.6935 |
| 4.0479 | 10650 | 0.6934 |
| 4.0669 | 10700 | 0.6937 |
| 4.0859 | 10750 | 0.6929 |
| 4.1049 | 10800 | 0.6934 |
| 4.1239 | 10850 | 0.6936 |
| 4.1429 | 10900 | 0.6932 |
| 4.1619 | 10950 | 0.6931 |
| 4.1809 | 11000 | 0.6925 |
| 4.1999 | 11050 | 0.6928 |
| 4.2189 | 11100 | 0.6913 |
| 4.2379 | 11150 | 0.696 |
| 4.2569 | 11200 | 0.6921 |
| 4.2759 | 11250 | 0.6934 |
| 4.2949 | 11300 | 0.6937 |
| 4.3139 | 11350 | 0.6917 |
| 4.3330 | 11400 | 0.6949 |
| 4.3520 | 11450 | 0.6929 |
| 4.3710 | 11500 | 0.6938 |
| 4.3900 | 11550 | 0.6944 |
| 4.4090 | 11600 | 0.6935 |
| 4.4280 | 11650 | 0.6932 |
| 4.4470 | 11700 | 0.6937 |
| 4.4660 | 11750 | 0.693 |
| 4.4850 | 11800 | 0.6934 |
| 4.5040 | 11850 | 0.6932 |
| 4.5230 | 11900 | 0.6926 |
| 4.5420 | 11950 | 0.6928 |
| 4.5610 | 12000 | 0.6938 |
| 4.5800 | 12050 | 0.6925 |
| 4.5990 | 12100 | 0.6946 |
| 4.6180 | 12150 | 0.6937 |
| 4.6370 | 12200 | 0.6938 |
| 4.6560 | 12250 | 0.6931 |
| 4.6750 | 12300 | 0.6929 |
| 4.6940 | 12350 | 0.6932 |
| 4.7130 | 12400 | 0.694 |
| 4.7320 | 12450 | 0.6932 |
| 4.7510 | 12500 | 0.6933 |
| 4.7700 | 12550 | 0.6935 |
| 4.7891 | 12600 | 0.6931 |
| 4.8081 | 12650 | 0.6923 |
| 4.8271 | 12700 | 0.6936 |
| 4.8461 | 12750 | 0.6939 |
| 4.8651 | 12800 | 0.6935 |
| 4.8841 | 12850 | 0.693 |
| 4.9031 | 12900 | 0.6935 |
| 4.9221 | 12950 | 0.6934 |
| 4.9411 | 13000 | 0.6922 |
| 4.9601 | 13050 | 0.6932 |
| 4.9791 | 13100 | 0.6932 |
| 4.9981 | 13150 | 0.6935 |
@inproceedings{reimers-2019-sentence-bert,
title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks",
author = "Reimers, Nils and Gurevych, Iryna",
booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing",
month = "11",
year = "2019",
publisher = "Association for Computational Linguistics",
url = "https://arxiv.org/abs/1908.10084",
}
Base model
BAAI/bge-m3