Gene Dole_2583 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2583
Symbol
ID	5695434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3124273
End bp	3125391
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	63%
IMG OID	641265191
Product	prephenate dehydratase
Protein accession	YP_001530463
Protein GI	158522593
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACCGTT CCGCATCCAC GGATGTTGTA TCCATGCCTT CCGGCCTTGA CGACCTAAGG 
CGGGAGATCA CCCGCACCGA CAGGGAGCTT CTGGCCCTGC TCAACCATCG TGCCCGGCTC 
TGCCGCCAGG TGGGCCGGGT CAAGTCGGCC GCCGACCAGG CGGTGTTCAA GCCCTTTCGG 
GAAAAGGAGG TGCTTGAAGG GCTGGTGGCG GAAAACCCCG GAGACCTTCC CGACGACCAC 
CTGCGCACCA TCTACCGGGA GATCCTTTCA TCCTCCCGGC GCTTGCAGCA ACCCCAGAAG 
GCGGTCTACC TGGGGCCGGA AGGCACCTTT TCCTATTTTG CCGGCCGGGA GCTGCTGGGC 
AGCAGCACCG ACTTTGAACC CTGCCCCAGC CTGGAGACGG TGTTTGCCGC GGTTGCCGGC 
AAAAAGGCCG ACCTGGGCAT CGTGCCCCTG GAAAACTCCC TTTCCGGCAG CGCCGGCCAG 
AACCTGGATC TTTTTCTCCG CTACGGTGTG CATATTCAGG CTGAAATCTA CCTGCGTATC 
AGCTATCACC TGGTAGGGGC CGGCACCGGA CTTGCCGGTA TTCAGACCGT TTACTCACAC 
CCCCGGGCCA TTGACCAGTG CGCGGCCTGG CTTTCGAGCC ATCTGCCCGA GGCCCATGTG 
GTGTTTGTGG GCAGCACGGC CGCCGCGGCC CGTGAGGCGG CGGGCCGGCC TGACTGCGTC 
GCCGTGGGCC ACCGCCAGCT GGCCGCCATG TTTTCCCTCA ACCTGCTGGC CGGGCCCGTC 
GAAGACGCGC CGGACAACTG GACCCGATTC ATCGTCATCG GTCACCAGGC CCCTGCCGGC 
GGCAGCCGGG ACAAGACATC AATTCTGTTC ACCCTGCCGG ACAAGTCCGG GGCCCTGGTC 
AGTGTGCTTT CCGTTCTGGC CAGAGGGGGC ATCAACATGA AAAAACTTGA ATCCCGGCCC 
ATGCGGTCTG AAAAATGGCA GTACCTGTTC TTCGCGGACC TGGAGTGCGA CCTCTCCGAT 
GACGAGTATG CCGACCTTCA GGCCGAACTG GTTGAAAACT GCCAGACCCT GCGGGTGCTG 
GGGAGCTATC CTGCGGGGCT GCATCTGAAC GACTGCTGA

Protein sequence

MNRSASTDVV SMPSGLDDLR REITRTDREL LALLNHRARL CRQVGRVKSA ADQAVFKPFR 
EKEVLEGLVA ENPGDLPDDH LRTIYREILS SSRRLQQPQK AVYLGPEGTF SYFAGRELLG 
SSTDFEPCPS LETVFAAVAG KKADLGIVPL ENSLSGSAGQ NLDLFLRYGV HIQAEIYLRI 
SYHLVGAGTG LAGIQTVYSH PRAIDQCAAW LSSHLPEAHV VFVGSTAAAA REAAGRPDCV 
AVGHRQLAAM FSLNLLAGPV EDAPDNWTRF IVIGHQAPAG GSRDKTSILF TLPDKSGALV 
SVLSVLARGG INMKKLESRP MRSEKWQYLF FADLECDLSD DEYADLQAEL VENCQTLRVL 
GSYPAGLHLN DC