Gene DvMF_1749 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_1749
Symbol
ID	7173664
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	-
Start bp	2137049
End bp	2138305
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	67%
IMG OID	643540264
Product	prephenate dehydratase
Protein accession	YP_002436162
Protein GI	218886841
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	113
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCTCA CCGACGACAA GGAACCCCAC TGGCGGGGGG ATCACGTTGC CGCCAGCGCC 
CCCAAGGTCA CGGACGACGG CGCGCCCCAG CCTGCGCATT CCGCAGTCAC ATCCGCAGTC 
ACATCCGCAG TCACATCCGG GGGCGCAGCC GACCCGGAAG CGGCGCTGGC CGGGCGGCTT 
GGCCAGATCC GCCACGAGAT CGACGGGCTG GATTCCGACC TGCTGAACCT GCTGAACCGC 
CGCGCCTCGC TGAGTCTGGA GGTGGGGCGC ATCAAGGCCG ACGACGCGGG CATCGTGTTC 
AAGCCCTTTC GCGAGCGCGA GGTGCTGGAA AATCTCATGG CCGCCAATGG CGGGCCGCTG 
CCCAACGAGC ACCTGCGTTC CATCTGGCGC GAGATTCTTT CGTCATCGCG CAGCCTGCAA 
CGGCCCCAGA AGGTGGCCTA CCTTGGGCCG GAGGGCACCT TTTCGTACTT CGCGGGCGTG 
GAATTTCTCG GCAAGGCCGT GGAATACATG CCGCAAAAGG ATCTGGACGG GGTGTTCCGC 
GCCGTGCACG ACAGGCAGTG CGAGCTTGGC GTGGTGCCGC TGGAAAATTC GCTGCACGGC 
ACCGTGGGCC AGAGTTTGGA CCTGTTTCTG TCGCATGAGG TATTCATCCA GTCCGAGCTG 
TTCTGCCGCA TCAGCCATTG CCTGCTGACC ACGGAAACCA GCCTGGCCGA CGTGACCACG 
GTGTATTCGC ATCCGCAGCC GCTGGCCCAG TGCGGCGGCT GGCTGCGCCA GGCCCTGCCC 
GGGGCGCGGA TCATCCCGGC GGATTCCACC GCCTCCGCCG CGCGCCGCGT GGGGGGCGAA 
AAGGGCGCGG CGGCCATCGG GCACCGCAGT CTGGCCGCGC TGCTGGGGCT GAACATCCTG 
GCGCGCGGCA TAGAGGACCA GCCGGACAAC TGGACGCGCT TCGTGGTCAT CGGCCCCGCC 
CCGGCGGGCC AGCCCGGCAC GGACAAGACC TCCATGCTGT TCTCTGTGCC GGACAGGCCC 
GGCGCGCTGG CAGAGGTGCT GAACCTGCTG GCCCGCGAGG GCATCAACAT GAAGAAGCTG 
GAGTCGCGGC CCCTGCGCGG CGAAAAGTGG AAATACGTGT TTTTCGTGGA CGTGGAATGC 
GACCTTGGCA ACGAGGACTA TGGCCGGGTG GTGCATGAAC TGCGCAGGCT GTGTCATACG 
TTGCGCATCC TCGGGAGCTA CCCCGCCGGG CCGCAGTTGG ACATGAGTCG AGATTGA

Protein sequence

MSLTDDKEPH WRGDHVAASA PKVTDDGAPQ PAHSAVTSAV TSAVTSGGAA DPEAALAGRL 
GQIRHEIDGL DSDLLNLLNR RASLSLEVGR IKADDAGIVF KPFREREVLE NLMAANGGPL 
PNEHLRSIWR EILSSSRSLQ RPQKVAYLGP EGTFSYFAGV EFLGKAVEYM PQKDLDGVFR 
AVHDRQCELG VVPLENSLHG TVGQSLDLFL SHEVFIQSEL FCRISHCLLT TETSLADVTT 
VYSHPQPLAQ CGGWLRQALP GARIIPADST ASAARRVGGE KGAAAIGHRS LAALLGLNIL 
ARGIEDQPDN WTRFVVIGPA PAGQPGTDKT SMLFSVPDRP GALAEVLNLL AREGINMKKL 
ESRPLRGEKW KYVFFVDVEC DLGNEDYGRV VHELRRLCHT LRILGSYPAG PQLDMSRD