Gene Gura_3789 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gura_3789
Symbol
ID	5166111
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Geobacter uraniireducens Rf4
Kingdom	Bacteria
Replicon accession	NC_009483
Strand	-
Start bp	4428326
End bp	4429411
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	60%
IMG OID	640551272
Product	CDP-glucose 4,6-dehydratase
Protein accession	YP_001232513
Protein GI	148265807
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR02622] CDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	46
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGATA TGGAGTTCTG GAAAGGCAAA AAAATCTTCC TCACCGGCCA TACAGGTTTC 
AAGGGTTCGT GGCTTTCTTT GTGGCTCCAT TCCCTCGGGG CAGAGGTGAC TGGCTATGCG 
CTGGCGCCGC CGACGGAGCC GAGCCTGTTT GAGTTGTGCG GCATCAACGA TCTTGTTGCC 
TCGACCATTG CCGATGTGCG GGACGGTGAC CGGCTGAAGT CGGAGATGGT CAAGGCCTCT 
CCCGATATCG TCATCCACAT GGCGGCCCAA CCTCTTGTGC GGGACTCGTA CAAAATCCCG 
GTGGAGACCT ACGCCGTCAA CGTCATGGGG ACCGTTCACC TGCTGGAAGC GGTGCGCAGC 
TGCCCCCGCG TAAAGGCGGT GGTCAACGTG ACCACCGACA AGTGCTACGA AAACCGTGAA 
TGGATCTGGG GGTACCGGGA AAACGAGCCG ATGGGGGGGT ATGACCCCTA CTCCAACAGC 
AAGGGGTGTT CGGAGTTGGT GACAGCCGCC TATCGCTCGT CGTATTTTGT CAATCAACAA 
CTCAACAGTT CAGCCACTCA ACGCCACGGC GCAGCCGTGG CAACTGCCCG GGCCGGCAAT 
GTCATCGGCG GCGGCGACTG GGCAGTTGAC CGGCTCATTC CAGACTGCGT CAAGTCGCTG 
TTGAGTGGCG AAAAGATTCT GATCAGGAAT CCGCACGCCA TCCGCCCCTG GCAGCATGTC 
CTTGAACCCC TTTCCGGCTA CCTGCTCCTG GCGCAGCGGC TCTATGAGGA AGGTCCTGCT 
TTTGCTTCCG GGTGGAACTT CGGCCCCCAT GACGAAGACG CCAGGCCTGT TGAGTGGATT 
GTGGAGAGGC TCTGCGCCCG GTGGGGTGAA GGCGCAGCAT ATGAGCTGGA CATGGGCGAC 
CATCCCCACG AGGCCCACTT CCTGAAGCTC GACTGCTCCA AGGCAAGGGC TGAACTGGGG 
TGGCGGCAGC GATGGGGCCT TGAGCGGTCG CTGGACAGCA TCGTTGAGTG GACGGAGGCC 
TATCGGGAAA AACGGGACCT GCGGGAGGCC TGTCTCAAGC AGATGGAGGA ATACCTGACG 
GTATAG

Protein sequence

MNDMEFWKGK KIFLTGHTGF KGSWLSLWLH SLGAEVTGYA LAPPTEPSLF ELCGINDLVA 
STIADVRDGD RLKSEMVKAS PDIVIHMAAQ PLVRDSYKIP VETYAVNVMG TVHLLEAVRS 
CPRVKAVVNV TTDKCYENRE WIWGYRENEP MGGYDPYSNS KGCSELVTAA YRSSYFVNQQ 
LNSSATQRHG AAVATARAGN VIGGGDWAVD RLIPDCVKSL LSGEKILIRN PHAIRPWQHV 
LEPLSGYLLL AQRLYEEGPA FASGWNFGPH DEDARPVEWI VERLCARWGE GAAYELDMGD 
HPHEAHFLKL DCSKARAELG WRQRWGLERS LDSIVEWTEA YREKRDLREA CLKQMEEYLT 
V