Gene Ent638_4012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ent638_4012
Symbol
ID	5110477
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Enterobacter sp. 638
Kingdom	Bacteria
Replicon accession	NC_009436
Strand	-
Start bp	4351956
End bp	4353806
Gene Length	1851 bp
Protein Length	616 aa
Translation table	11
GC content	58%
IMG OID	640494230
Product	dihydroxy-acid dehydratase
Protein accession	YP_001178718
Protein GI	146313644
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism
COG ID	[COG0129] Dihydroxyacid dehydratase/phosphogluconate dehydratase
TIGRFAM ID	[TIGR00110] dihydroxy-acid dehydratase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0176086
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTAAGT ATCGTTCTGC CACCACCACT CACGGCCGCA ATATGGCCGG TGCCCGCGCG 
CTGTGGCGCG CAACCGGGAT GACCGACGAC GACTTCGGTA AGCCGATTAT CGCCGTGGTG 
AACTCCTTCA CCCAGTTTGT GCCGGGCCAT GTGCACTTGC GCGATCTCGG CAAACTGGTC 
GCTGAGCAAA TCGAAGCGTC CGGCGGCGTG GCAAAAGAGT TCAACACCAT CGCGGTGGAC 
GACGGTATCG CCATGGGCCA CGGAGGCATG CTTTATTCCC TGCCGTCGCG CGAACTGATC 
GCCGACTCCG TGGAATACAT GGTGAACGCC CACTGCGCCG ACGCCATGGT CTGTATCTCC 
AACTGCGACA AAATCACCCC AGGGATGCTG ATGGCGTCCT TGCGTCTGAA CATTCCGGTG 
ATCTTTGTTT CCGGCGGTCC GATGGAAGCC GGTAAAACCA AGCTCTCTGA CCAAATTATC 
AAGCTCGATC TCGTCGATGC GATGATTCAG GGCGCGGATC CAAAAGTCTC CGATGCACAA 
AGCGATCAGG TGGAACGTTC CGCGTGTCCA ACCTGCGGAT CCTGTTCCGG TATGTTCACC 
GCCAACTCCA TGAACTGTCT GACCGAAGCG CTGGGTCTTT CTCAGCCGGG CAACGGTTCA 
CTGCTGGCGA CGCACGCCGA TCGCGAGCAG CTGTTCCTGA GTGCCGGGAC GCGCATCGTT 
GAGCTGACCA AACGCTATTA CGAGCAAGAC GATGCCAGCG CTCTTCCGCG TAACATCGCC 
AACAAAGCCG CATTCGAAAA CGCCATGACG CTGGATATCG CTATGGGCGG TTCAACCAAT 
ACCGTTCTGC ACCTGCTGGC GGCGGCGCAG GAAGCCGAAA TCGACTTCAC GATGAGTGAT 
ATCGACAAGC TCTCCCGCAA AGTGCCGCAG CTGTGTAAAG TCGCGCCGAG CACGCCAAAA 
TATCACATGG AAGATGTTCA CCGTGCCGGT GGCGTTCTGG GGATTTTGGG TGAGTTGGAT 
CGTGCCGGGC TGTTGAACCG TGAAGTGAAA AACATTCTCG GGCTGACGCT GCCGCAGTCG 
CTTGAGCAGT ACGACATCAT GCTCACCAAA GACGATGCGG TGAAAAGCAT GTTCCGCGCG 
GGCCCTGCCG GGATTCGTAC CACCAAAGCA TTCTCGCAAA ACTGCCGTTG GGATACTTTG 
GATGATGACC GCGCCGAAGG CTGCATTCGC TCGCTGGAGC ATGCTTACAG CCAGGAGGGC 
GGCCTGGCGG TTCTGTACGG TAACTTTGCC GAAAACGGCT GTATCGTTAA AACCGCAGGC 
GTCGACGACA GTATTCTGAA ATTCACTGGT CCGGCGAAAG TGTATGAAAG CCAGGACGAT 
GCCGTTGAGG CGATTCTGGG CGGTAAAGTG GTTGCAGGTG ACGTGGTGGT GATTCGCTAC 
GAAGGGCCAA AAGGCGGACC GGGCATGCAG GAAATGCTTT ACCCAACGAC CTTCCTGAAG 
TCGATGGGCC TGGGCAAAGC CTGTGCGCTG ATTACCGACG GCCGATTCTC GGGCGGCACT 
TCTGGACTCT CTATCGGTCA CGTTTCACCG GAAGCGGCGA GCGGCGGGAA TATCGCGATT 
ATCGAAGACG GCGATCTGAT TGAAATCGAC ATTCCAAACC GTGGCATTCA GCTCCAGTTG 
AGCGATCAAG AAATTGCAGC GCGCCGCGAA GCGCAAGACG CTCGCGGTGA TAAAGCCTGG 
ACGCCGAAAG ATCGCCAGCG TGAGGTTTCT TACGCATTGC GTGCCTACGC CACGCTTGCC 
ACCAGTGCTG ACAAAGGCGC GGTGCGCGAT AAATCCAAAC TTGGGGGCTA A

Protein sequence

MPKYRSATTT HGRNMAGARA LWRATGMTDD DFGKPIIAVV NSFTQFVPGH VHLRDLGKLV 
AEQIEASGGV AKEFNTIAVD DGIAMGHGGM LYSLPSRELI ADSVEYMVNA HCADAMVCIS 
NCDKITPGML MASLRLNIPV IFVSGGPMEA GKTKLSDQII KLDLVDAMIQ GADPKVSDAQ 
SDQVERSACP TCGSCSGMFT ANSMNCLTEA LGLSQPGNGS LLATHADREQ LFLSAGTRIV 
ELTKRYYEQD DASALPRNIA NKAAFENAMT LDIAMGGSTN TVLHLLAAAQ EAEIDFTMSD 
IDKLSRKVPQ LCKVAPSTPK YHMEDVHRAG GVLGILGELD RAGLLNREVK NILGLTLPQS 
LEQYDIMLTK DDAVKSMFRA GPAGIRTTKA FSQNCRWDTL DDDRAEGCIR SLEHAYSQEG 
GLAVLYGNFA ENGCIVKTAG VDDSILKFTG PAKVYESQDD AVEAILGGKV VAGDVVVIRY 
EGPKGGPGMQ EMLYPTTFLK SMGLGKACAL ITDGRFSGGT SGLSIGHVSP EAASGGNIAI 
IEDGDLIEID IPNRGIQLQL SDQEIAARRE AQDARGDKAW TPKDRQREVS YALRAYATLA 
TSADKGAVRD KSKLGG