Gene DvMF_1971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_1971
Symbol
ID	7173890
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	2436553
End bp	2438775
Gene Length	2223 bp
Protein Length	740 aa
Translation table	11
GC content	68%
IMG OID	643540488
Product	CRISPR-associated helicase Cas3
Protein accession	YP_002436382
Protein GI	218887061
COG category	[R] General function prediction only
COG ID	[COG1203] Predicted helicases
TIGRFAM ID	[TIGR01587] CRISPR-associated helicase Cas3

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	92
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATATG CGCACACCCT CGCAAATCGA CCGGAATCGG ACTGGGAGCC GCTCTCCCGG 
CATCTTGAAG AGGTGGCAGA CCTCGCGGCG CACTTCGCTT CCGCCTTCGG AGCCGGTGAA 
TGGGGCCTGG CGGCAGGCCT GCTGCACGAC GTCGGCAAGC AGTCGACGGC CTTTCAGGCC 
TACCTGCGAG CTTCGACCGC AGGCAAGGGG CCCGGTCGCG GGCCGGACCA TTCCACCGCC 
GGGGCGCAGT GGGCGCACGG GCATTACAAT GCGAAGCTCG GCAAACTGCT GGCCTATGCC 
CTGGCCGGGC ACCACGCTGG GTTGCCCGAC GGCATAGAGT CGCTGGCCCC CCGCCTGAAG 
CGTGCGGTGG AGCCATGGCA CAGTCCCGGC GACGACATCG CCGCCCGCGT ACCCGAGATC 
ACGGGCTTGC CGCTGGCCGG GCGCATGCCA TCGCTCGGGT TCCAGCTCAT GCTCTTCGTG 
CGCATGGTGT TCTCGTGCCT TGTGGATGCG GACTCCCTGT GCACCGAAGC CTTCACCACG 
CCGGACAAGG CCGCATGGCG GCGCGGCTAC CTTCCGCTTT CGGAACTGAA AGTTCGGCTG 
GACCGTCATC TGGACCACCT TGCCACCCAC GCCCCGGCCA CCCCGGTGAA CAGTCTGCGC 
GCGGGCATCC TTGCCGCCTG CCGCAATGCA GCCCCAAACG TCCCCGGCCT GTTCTCGCTG 
ACCGTGCCCA CCGGAGGCGG CAAGACGCTT TCCTCACTCG CCTTCGCGCT GGACCATGCG 
CAGGCCCACG GCCTGCGGCG CGTAATCTAC GCCATCCCCT ACACCAGCAT CATCGAACAG 
ACCGCCAGGG TCTTCCGCGA GGCATTGAAC GATACTGATG ACCAGGCCGT GCTGGAGCAT 
CACTCCAACT TCGTGCCCCT GCGCGCCGAC GGCACGCCGG TCACTCCCAG ACGAGAGGGA 
CAAGACGACG ACGCGGGCGA AGGCCGCCGC TCTGTACTGG CCGCGGAAAA CTGGGATGCA 
CCCGTGGTGG TGACCACCAA CGTGCAGTTC CTCGAATCCC TGTTTGCCGC CCGGCGGTCC 
CCCTGTCGCA AACTGCACAA CATCGCCCGC AGTGTGGTGA TTCTGGACGA GGCGCAGATG 
CTTCCCCCGG AACACCTGCT GCCCTGCCTG GAAGCTCTGC GCGCCCTTGT GCTGGACTAC 
GGGTGCAGCG TGGTGCTGTG CACGGCCACG CAGCCCGCCC TTGGCAAGCG CGAAGGCTTT 
GACCGGGGCC TGGAACAGGT ACGGGAAATC ACCCCGAATC CGGAACAGCT TGCCACCGCG 
CTGCGTCGGG TGGAGGTGAC CGATGCGGGC ACTCTGGACG ATGCGCAACT GGCCGCCAGG 
CTGGCCGGGC AGCCACAGGT GCTGTGCGTG GTCAACACCC GGCCCCACGC TCGCGCCCTG 
TACGAACTGC TGGCACCGCA GGGGGATGCG GTACACCTTT CCGCCGCCAT GTGCCCGGCG 
CACCGCACGG AAGTGCTGCG CGGCGTCCGT CAGCGCCTGC TTCAGGGTCA ACCCTGCCGG 
GTGGTGGCCA CCCAACTGGT GGAGGCCGGG GTGGATATCG ACTTTCCCGT GGTCTACCGC 
GCCATGGCGG GGGTGGATTC GCTTGCGCAG GCCGCCGGGC GCTGCAACCG CGAGGGCAAT 
CTGGAGCGGG GGCAGGTGTA TCTGTTCACG CCGCAGGACA GCCCGCCGCC GTTCGTCCGG 
CAAGCCGCAC AGGCCGCGCG CACGGCGCTG CGCCGCAACC CGGACCCGCT GGCCCTCGAC 
ACCGTGGAGG CCTATTTCCG CGAACTCTAC TGGCAGAAAG GGGACAGGCT GGACAGCGCC 
AACCTGTTGC CCCTGATGCG GGACAGCGCG CCGCGCCTGG ACTTTCCCTT TCCGGAAGTG 
GCGCACCTCT TTCGGCTGAT CCCCGACGAC ACCATTCCGC TCCTCATTCC TTATGACGAC 
GACGCGCGCG CCCTGATTGC GGAGTTGCCG TACACACCGG CCCCGGCCCG CCTGCTGCGC 
CGCGCCCAGC GCTACACGGT GGGGGTGTAC CCCAGGGTGC TGGCCGCGCT GGTGCAGGCC 
GGAGCAGCGC ACCTGGCTAC AGAAGAATGC GCGGTGCTGA TAAACGAAGA CCTGTACGAT 
GATCGGCTGG GACTGTGCGC GGACAACCCT ACGTACCGGA ATCCGGAAAG CCTGTTGGGG 
TAA

Protein sequence

MKYAHTLANR PESDWEPLSR HLEEVADLAA HFASAFGAGE WGLAAGLLHD VGKQSTAFQA 
YLRASTAGKG PGRGPDHSTA GAQWAHGHYN AKLGKLLAYA LAGHHAGLPD GIESLAPRLK 
RAVEPWHSPG DDIAARVPEI TGLPLAGRMP SLGFQLMLFV RMVFSCLVDA DSLCTEAFTT 
PDKAAWRRGY LPLSELKVRL DRHLDHLATH APATPVNSLR AGILAACRNA APNVPGLFSL 
TVPTGGGKTL SSLAFALDHA QAHGLRRVIY AIPYTSIIEQ TARVFREALN DTDDQAVLEH 
HSNFVPLRAD GTPVTPRREG QDDDAGEGRR SVLAAENWDA PVVVTTNVQF LESLFAARRS 
PCRKLHNIAR SVVILDEAQM LPPEHLLPCL EALRALVLDY GCSVVLCTAT QPALGKREGF 
DRGLEQVREI TPNPEQLATA LRRVEVTDAG TLDDAQLAAR LAGQPQVLCV VNTRPHARAL 
YELLAPQGDA VHLSAAMCPA HRTEVLRGVR QRLLQGQPCR VVATQLVEAG VDIDFPVVYR 
AMAGVDSLAQ AAGRCNREGN LERGQVYLFT PQDSPPPFVR QAAQAARTAL RRNPDPLALD 
TVEAYFRELY WQKGDRLDSA NLLPLMRDSA PRLDFPFPEV AHLFRLIPDD TIPLLIPYDD 
DARALIAELP YTPAPARLLR RAQRYTVGVY PRVLAALVQA GAAHLATEEC AVLINEDLYD 
DRLGLCADNP TYRNPESLLG