Gene Dvul_1904 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1904
Symbol
ID	4664032
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	2219199
End bp	2220305
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	65%
IMG OID	639820145
Product	thiamine biosynthesis protein
Protein accession	YP_967347
Protein GI	120602947
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0482] Predicted tRNA(5-methylaminomethyl-2-thiouridylate) methyltransferase, contains the PP-loop ATPase domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.661194
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAAACGC AACACTACCA TGCCGTAGCG CTGCTCTCGG GTGGGCTGGA CAGCATCCTC 
GCCGTCAAGC TCGTCGAAGA GCAGGGACTG CGCGTCAAAT GCCTGCACTT CGTCTCTCCC 
TTCTTCGGCA AGCCTTCACA GGTGCGCCGC TGGCGTTCGA TATATGCCCT GGACATCACC 
ACGGTCGACG TGAGCGACGA TTTCGCCCGT ATGCTCGCCG AACGCCCGCA GCACGGGTTC 
GGCAAGGTCA TGAACCCGTG CGTCGACTGC AAGATTCTCA TGCTGCGCCG TGCGCGTGAA 
CTGATGACCG AATACGGTGC CACGTTCATC ATCACGGGCG AGGTGCTCGG ACAGCGCCCC 
ATGTCGCAGC GGCGTGACAC GCTCAACGTC ATCAGGCGCG ATGCCGAGGT GCGCGACCTG 
TTGCTGCGCC CCCTCAGCGC AAAGCTGCTC GACCCCACCC CCTTCGAGCT TTCCGGGATG 
GTCGACCGCG AACGTCTGCT TGCCATCTCC GGGCGGGGAC GCAAGGAACA GATGGCACTC 
GCCGAGCGTT TCGCACTTGA GGAGATTCCG ACCCCCGCAG GTGGCTGCAA GCTCGCCGAA 
CGCGAGAATG CCCGCCGCTA CTGGCCTGTG CTCGTTCATG CACCGGTCGT CACCGCCGCC 
GAGTTCCGGC TTTCGAACAT CGGAAGGCAA TACTGGCAGG GGGCGCACTG GCTCTCCATC 
GGGCGCCATC AGAAGGACAA CGAGGCGCTG GAGCGCTTCG CCTTTCCGGG CGACCTGCGT 
TTCAAGGTCG TGGGGTACCC GGGCCCCTTG GCCGTGGGAC GTCAGTTTGA CGGACAACCG 
TGGTCGGAAG AGGTCGTGTG CGACGCCGCG TCGTTCGTGG CGTCGTTCTC ACCCAAGGCC 
GTGCGGGACG GCATCGCTGT CGCAGTTCGC GTGACGTGCG GCGAGACGGT GCGCGAGGTG 
CAGGTGATGC CCGCCCGAGC AACGGTTCTC GGCTGGGCCG AGGATGAGTG GCCTGTGGTA 
CGGGAGGCCA TCAGGGCCGA TGCGCGAGCG CGCGCCCTGC CCGTACATGC GACCCCGGAC 
GATGGTCGCG ACGGCGAGGC GGAATAG

Protein sequence

METQHYHAVA LLSGGLDSIL AVKLVEEQGL RVKCLHFVSP FFGKPSQVRR WRSIYALDIT 
TVDVSDDFAR MLAERPQHGF GKVMNPCVDC KILMLRRARE LMTEYGATFI ITGEVLGQRP 
MSQRRDTLNV IRRDAEVRDL LLRPLSAKLL DPTPFELSGM VDRERLLAIS GRGRKEQMAL 
AERFALEEIP TPAGGCKLAE RENARRYWPV LVHAPVVTAA EFRLSNIGRQ YWQGAHWLSI 
GRHQKDNEAL ERFAFPGDLR FKVVGYPGPL AVGRQFDGQP WSEEVVCDAA SFVASFSPKA 
VRDGIAVAVR VTCGETVREV QVMPARATVL GWAEDEWPVV REAIRADARA RALPVHATPD 
DGRDGEAE