Gene DvMF_2019 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_2019
Symbol
ID	7173938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	2500863
End bp	2501918
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	71%
IMG OID	643540536
Product	dihydrouridine synthase DuS
Protein accession	YP_002436430
Protein GI	218887109
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	99
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACA CCGCATCCGC CGCCCCCCAC CTTTCCCTGG CCCCGCCCCT GCGGACCGAC 
GCCCCGTGGC TGGCCCCCCT GGCCGGGTAT TCCGACCTGC CCTTCCGCCT GCTGTGCCGC 
GAGCACGGCG CGGCGGCCTG CTGCACAGAA ATGGTCAGCG CCAAGGGGTT GCTGTACCAC 
AGCCCCGGCA CCCGCGACCT GCTGGCCTCC ACGCCTGAAG ACGCGCCACT TGTCCTGCAA 
CTGTTCGGAG CCGACGCGGA CATCATGCGC ACGGTCATGC CGGGGCTGCT GGAGCAGGGC 
TTTCGCTGGT TCGACCTGAA CATGGGATGT TCGGTGCCCA AGGTGGTCAA GACGGGTTGC 
GGCTCGGCCA TGTCGCGCGA CATGGACAAC GCCCTGTCCG TTGCCCGCGC CATGGTGGAG 
GTGGCCGGTG AAGGCCGGGT GGGCTTCAAG ATGCGGCTGG GCTGGCAGGC GGGCGAGGAA 
ACCTGGCGCG AAATGGCCCT GCGGCTGCAA GACGCGGGCG CGGGGTGGAT CACCCTGCAC 
CCCCGCTTCG CGCGGCAGGG CTTTGGCGGC GAAGCGCGCT GGAGTGCCCT GCGCGAGCTT 
GCGGCCACGC TGACCATCCC GGTCATTGCC AGCGGCGACC TGTTCACGGC GGCGGACGCG 
GTGCGCTGCG TGCGCGAGAC GGGCGTGGCC ACGGTGATGT TCGCGCGCGG GGCCATGAAC 
AACCCCGCCG TCTTCGACGA ATACCGGGTG CTGCTGGCCG GGGGCCAGCC CCCGCCGCCC 
GACGCGGACC GGCTGAAGGC GCTCATCCGC CGCCATCTTG AACTGGCCCT GGCCCACTCC 
GGCGAACGCA CCGCCCTGCT CAAGATGCGC ACCTTCGTGC CGCGCTACGT GCGCCACATT 
CCCGGCGTGC GGGCGCTGCG CAACCGGCTG GCCTCGTGCC TGGACCGCGA CCTGCTGGAA 
GAACTGCTTG AAACCCACCT GACCCCGCAA GCGTTCGCGG AAGACGGCGG CGCCGACCAA 
GCCACCACCA ACACCGATGG AGAGGCCCGG CCATGA

Protein sequence

MTDTASAAPH LSLAPPLRTD APWLAPLAGY SDLPFRLLCR EHGAAACCTE MVSAKGLLYH 
SPGTRDLLAS TPEDAPLVLQ LFGADADIMR TVMPGLLEQG FRWFDLNMGC SVPKVVKTGC 
GSAMSRDMDN ALSVARAMVE VAGEGRVGFK MRLGWQAGEE TWREMALRLQ DAGAGWITLH 
PRFARQGFGG EARWSALREL AATLTIPVIA SGDLFTAADA VRCVRETGVA TVMFARGAMN 
NPAVFDEYRV LLAGGQPPPP DADRLKALIR RHLELALAHS GERTALLKMR TFVPRYVRHI 
PGVRALRNRL ASCLDRDLLE ELLETHLTPQ AFAEDGGADQ ATTNTDGEAR P