Gene Ent638_3240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_3240
Symbol
ID	5112954
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	3531631
End bp	3532971
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	57%
IMG OID	640493444
Product	D-glucarate dehydratase
Protein accession	YP_001177955
Protein GI	146312881
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID	[TIGR03247] glucarate dehydratase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0783146
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGAGCA CTTTCTCTAC CCCTGTTGTG ACGTCAATGC AGATTGTCCC GGTGGCGGGC 
CACGACAGCA TGCTGATGAA TCTAAGCGGC GCACATGCCC CGTTCTTTAC CCGCAACATC 
GTCATCATCA AAGACAACTC AGGCCATACC GGCGTGGGCG AAATTCCGGG CGGCGAGAAG 
ATCCGCAAAA CTCTGGAAGA CGCGATCCCA TTAGTGGTGG GTAAAACGCT TGGCGAATAC 
AAAAACGTCT TAAACGTGGT GCGTAACACC TTTGCCGATC GTGATGCGGG CGGTCGAGGG 
CTACAAACAT TTGACCTGCG CACCACCATT CATGTGGTGA CGGGGATCGA AGCGGCGATG 
CTGGATCTGC TGGGGCAGCA TCTCGGCGTT AACGTCGCCT CATTGCTGGG CGAAGGCCAG 
CAACGGAGCG AAGTCGAAAT GCTCGGCTAT CTGTTCTTCG TGGGCGATCG CACACTGACG 
CCGCTGGAAT ACCAAAGCCA GCCGGACGAA AAATGCGACT GGTATCGTCT GCGTCACGAC 
GAAGCCATGA CGCCGGATGC GGTGGTACGA CTGGCTGAAG CCGCCTACGA AAAATATGGC 
TTTAACGATT TCAAACTGAA AGGCGGCGTT CTGGCTGGGG AGGAAGAGGC TGAGTCGATT 
GAAGCCCTGG CGAAGCGCTT CCCGCAGGCG CGCGTCACGC TCGATCCCAA CGGTGCCTGG 
TCGCTCAATG AAGCCATCAG TATTGGTAAG CGGCTGAAAG GCGTGCTGGC CTATGCCGAA 
GATCCGTGTG GCGCTGAGCA AGGGTTTTCC GGTCGTGAAG TGATGGCCGA ATTCCGCCGG 
GCGACGGGTC TACCAACGGC GACAAATATG ATTGCCACCG ACTGGCGTCA GATGGGGCAC 
ACCCTTTCGC TGCAATCGGT TGATATTCCG CTGGCCGATC CGCATTTCTG GACCATGCAA 
GGCTCGGTTC GCGTGGCGCA AATGTGCCAC GAATTCGGGC TGACCTGGGG CTCGCACTCG 
AACAACCACT TTGATATCTC GCTGGCGATG TTTACCCATG TAGCTGCTGC TGCGCCAGGG 
AAAATCACCG CTATCGACAC CCACTGGATC TGGCAGGAGG GCAACCAGCG CCTGACCAAA 
CAGCCGTTCG AGATCAAAGG CGGAATGGTA AAAGTACCCA CCGCGCCAGG CTTAGGCGTC 
GAACTCGATA TGGATCAGCT AATGAAAGCG CACGAGCTGT ATCAGAAGCA TGGCCTGGGC 
GCACGTGATG ATGCGATGGC GATGCAGTAT TTAATCCCGG ACTGGACCTT TAATAATAAG 
CGTCCTTGCA TGGTGCGTTA G

Protein sequence

MMSTFSTPVV TSMQIVPVAG HDSMLMNLSG AHAPFFTRNI VIIKDNSGHT GVGEIPGGEK 
IRKTLEDAIP LVVGKTLGEY KNVLNVVRNT FADRDAGGRG LQTFDLRTTI HVVTGIEAAM 
LDLLGQHLGV NVASLLGEGQ QRSEVEMLGY LFFVGDRTLT PLEYQSQPDE KCDWYRLRHD 
EAMTPDAVVR LAEAAYEKYG FNDFKLKGGV LAGEEEAESI EALAKRFPQA RVTLDPNGAW 
SLNEAISIGK RLKGVLAYAE DPCGAEQGFS GREVMAEFRR ATGLPTATNM IATDWRQMGH 
TLSLQSVDIP LADPHFWTMQ GSVRVAQMCH EFGLTWGSHS NNHFDISLAM FTHVAAAAPG 
KITAIDTHWI WQEGNQRLTK QPFEIKGGMV KVPTAPGLGV ELDMDQLMKA HELYQKHGLG 
ARDDAMAMQY LIPDWTFNNK RPCMVR