openai
/

whisper-medium

ArthurZ HF Staff

sanchit-gandhi commited on Nov 3, 2022

Commit

1cdb8bb

1 Parent(s): 6014a2d

Fix imports in multilingual examples (#3)

- Fix imports in multilingual examples (278e5c7449a693b7bf442675016dd7c1d7527242)

Co-authored-by: Sanchit Gandhi <[email protected]>

Files changed (1) hide show

README.md CHANGED Viewed

@@ -226,7 +226,7 @@ transcription.
 ```python
 >>> from transformers import WhisperProcessor, WhisperForConditionalGeneration
->>> from datasets import load_dataset
 >>> import torch
 >>> # load model and processor
@@ -235,7 +235,7 @@ transcription.
 >>> # load dummy dataset and read soundfiles
 >>> ds = load_dataset("common_voice", "fr", split="test", streaming=True)
->>> ds = ds.cast_column("audio", datasets.Audio(sampling_rate=16_000))
 >>> input_speech = next(iter(ds))["audio"]["array"]
 >>> model.config.forced_decoder_ids = processor.get_decoder_prompt_ids(language = "fr", task = "transcribe")
 >>> input_features = processor(input_speech, return_tensors="pt").input_features
@@ -254,7 +254,7 @@ The "<|translate|>" is used as the first decoder input token to specify the tran
 ```python
 >>> from transformers import WhisperProcessor, WhisperForConditionalGeneration
->>> from datasets import load_dataset
 >>> import torch
 >>> # load model and processor
@@ -263,7 +263,7 @@ The "<|translate|>" is used as the first decoder input token to specify the tran
 >>> # load dummy dataset and read soundfiles
 >>> ds = load_dataset("common_voice", "fr", split="test", streaming=True)
->>> ds = ds.cast_column("audio", datasets.Audio(sampling_rate=16_000))
 >>> input_speech = next(iter(ds))["audio"]["array"]
 >>> # tokenize
 >>> input_features = processor(input_speech, return_tensors="pt").input_features

 ```python
 >>> from transformers import WhisperProcessor, WhisperForConditionalGeneration
+>>> from datasets import Audio, load_dataset
 >>> import torch
 >>> # load model and processor
 >>> # load dummy dataset and read soundfiles
 >>> ds = load_dataset("common_voice", "fr", split="test", streaming=True)
+>>> ds = ds.cast_column("audio", Audio(sampling_rate=16_000))
 >>> input_speech = next(iter(ds))["audio"]["array"]
 >>> model.config.forced_decoder_ids = processor.get_decoder_prompt_ids(language = "fr", task = "transcribe")
 >>> input_features = processor(input_speech, return_tensors="pt").input_features
 ```python
 >>> from transformers import WhisperProcessor, WhisperForConditionalGeneration
+>>> from datasets import Audio, load_dataset
 >>> import torch
 >>> # load model and processor
 >>> # load dummy dataset and read soundfiles
 >>> ds = load_dataset("common_voice", "fr", split="test", streaming=True)
+>>> ds = ds.cast_column("audio", Audio(sampling_rate=16_000))
 >>> input_speech = next(iter(ds))["audio"]["array"]
 >>> # tokenize
 >>> input_features = processor(input_speech, return_tensors="pt").input_features