Gene Dole_1950 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1950
Symbol
ID	5694790
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2360036
End bp	2361136
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	61%
IMG OID	641264548
Product	prephenate dehydratase
Protein accession	YP_001529831
Protein GI	158521961
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0077] Prephenate dehydratase [COG1605] Chorismate mutase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGCTG AAAGCAGCGG CCAGGATGAA AAGATAGCGA ACCTGCGCCG GTCCATTGAT 
GAAATTGATG ACACCATCCT GGACCTGCTC AACCGGCGGG TCTCTCTGGC CGAAGCGATC 
GGGACGCTGA AGACGCAGAC CGGCAACCGG GTCATGGACA AGGCCAGGGA AGAATCGATC 
CTGCAGCGGC TGGCCGGGCT CAACCCCGGC CCCTTGTCCT CTGAGATGCT GCGGCGGATA 
TTTGTCGACA TCATTGCGGC CTCGCGTCAG GCCCAGGAAC CCAAGCGGAT CTCCTTTCTG 
GGGCCGGAGG CCACCTTCAC CCATGTCGCG GCCCTGGCTT TTTTTAATGA GCTGGATACC 
TTTGTCCCCC ACCCGAGTAT TCGGGACGTG TTTGATGACG TGGAAAAGGG GACCAGCCGG 
TACGGCGTGG TGCCGGTGGA AAATTCCATT GAGGGCGCGG TCAACCACAC CCTTGATCTT 
TTCCTGGAAT CCGAGCTTCA CATCTGCGCC GAGTCCTACC TGGCCATTTC CCATGACCTG 
CTTTCAAAAA GCGGTGACCT GGAAAAGATT CATACCATCT ATTCCCACCC CCAGCCCTTT 
GCCCAGTGCC GGACGTGGCT CAAGACCCAT CTGCCCCATG CCGAACTGGT GGAGTGCGGC 
AGCACCTCCC AGGCGGCCCA GAAAGCCCTA CTGGCCGACG ATGCCGCGGC CATTGCCGGC 
AGCGCCGCGG CCCGGCTGTA TGACCTGAAG GTGGCGGCGC CGGCCATTCA GGATGCCGTG 
CGCAACACCA CCCGGTTTCT GGTCATCGGC CGGGACGCGC CCCGGCCCAC AGGCAACGAC 
AAGACATCCA TCCTGTTTGT GACGGCCCAT ATTCCCGGGG CGCTGTTCAA GGCACTGGAG 
CCCATTGCCG CGTCCGGCCT CAACATGCTT AAACTGGAGT CCCGGCCGGC CCGGCACAAG 
AACTGGAGCT ACGTGTTTTT CGTGGACCTG GAGGGCCATG TCGAAAACGA GAAGGTGAAA 
CAGTGCCTGG CAAAAATGGA GGCCTTCTGC CAGTTCATCA AAATCCTGGG CGCTTACCCG 
GTAGCCCTGT CGGACGCATG A

Protein sequence

MSAESSGQDE KIANLRRSID EIDDTILDLL NRRVSLAEAI GTLKTQTGNR VMDKAREESI 
LQRLAGLNPG PLSSEMLRRI FVDIIAASRQ AQEPKRISFL GPEATFTHVA ALAFFNELDT 
FVPHPSIRDV FDDVEKGTSR YGVVPVENSI EGAVNHTLDL FLESELHICA ESYLAISHDL 
LSKSGDLEKI HTIYSHPQPF AQCRTWLKTH LPHAELVECG STSQAAQKAL LADDAAAIAG 
SAAARLYDLK VAAPAIQDAV RNTTRFLVIG RDAPRPTGND KTSILFVTAH IPGALFKALE 
PIAASGLNML KLESRPARHK NWSYVFFVDL EGHVENEKVK QCLAKMEAFC QFIKILGAYP 
VALSDA