Gene EcE24377A_3685 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcE24377A_3685
Symbol	kdsD
ID	5587199
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli E24377A
Kingdom	Bacteria
Replicon accession	NC_009801
Strand	+
Start bp	3678423
End bp	3679409
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	52%
IMG OID	640927308
Product	D-arabinose 5-phosphate isomerase
Protein accession	YP_001464675
Protein GI	157158811
COG category	[M] Cell wall/membrane/envelope biogenesis [T] Signal transduction mechanisms
COG ID	[COG0794] Predicted sugar phosphate isomerase involved in capsule formation [COG2905] Predicted signal-transduction protein containing cAMP-binding and CBS domains
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCACG TAGAGTTACA ACCGGGTTTT GACTTTCAGC AAGCAGGTAA AGAAGTCCTG 
GCGATTGAAC GTGAATGCCT GGCGGAGCTT GATCAATACA TCAATCAGAA TTTCACGCTT 
GCCTGTGAAA AGATGTTCTG GTGTAAAGGG AAAGTTGTCG TCATGGGGAT GGGGAAATCG 
GGGCACATCG GGCGCAAAAT GGCCGCAACG TTTGCCAGCA CCGGTACACC TTCATTTTTC 
GTCCATCCTG GTGAAGCCGC GCATGGTGAT TTAGGCATGG TCACCCCACA GGATGTGGTG 
ATTGCTATCT CTAACTCAGG TGAATCCAGC GAAATCACGG CCTTAATTCC AGTGCTTAAG 
CGTCTTCACG TACCGTTAAT CTGCATCACC GGTCGCCCGG AGAGCAGCAT GGCGCGCGCC 
GCAGATGTGC ATCTGTGTGT TAAAGTAGCG AAAGAAGCCT GTCCGTTAGG GCTGGCACCG 
ACCAGCAGCA CCACCGCCAC GCTGGTTATG GGCGATGCCC TCGCTGTCGC GCTGTTAAAA 
GCACGCGGCT TTACTGCTGA AGATTTTGCG CTCTCACACC CAGGCGGCGC ACTGGGTCGT 
AAACTTCTGC TGCGCGTAAA CGATATTATG CATACGGGCG ATGAGATCCC GCATGTTAAG 
AAAACGGCCA GTCTGCGTGA CGCATTGCTG GAAGTTACCC GCAAAAATCT TGGTATGACT 
GTCATTTGCG ATGACAATAT GATGATTGAA GGCATCTTTA CCGACGGTGA TTTACGCCGT 
GTCTTCGATA TGGGCGTGGA TGTTCGTCAG TTAAGTATTG CCGATGTGAT GACGCCGGGG 
GGAATACGTG TGCGCCCTGG CATTCTGGCC GTTGAGGCAC TGAACTTAAT GCAGTCCCGC 
CATATCACCT CCGTGATGGT TGCCGATGGC GACCATTTAC TCGGTGTGTT ACATATGCAT 
GATTTACTGC GTGCAGGCGT AGTGTAA

Protein sequence

MSHVELQPGF DFQQAGKEVL AIERECLAEL DQYINQNFTL ACEKMFWCKG KVVVMGMGKS 
GHIGRKMAAT FASTGTPSFF VHPGEAAHGD LGMVTPQDVV IAISNSGESS EITALIPVLK 
RLHVPLICIT GRPESSMARA ADVHLCVKVA KEACPLGLAP TSSTTATLVM GDALAVALLK 
ARGFTAEDFA LSHPGGALGR KLLLRVNDIM HTGDEIPHVK KTASLRDALL EVTRKNLGMT 
VICDDNMMIE GIFTDGDLRR VFDMGVDVRQ LSIADVMTPG GIRVRPGILA VEALNLMQSR 
HITSVMVADG DHLLGVLHMH DLLRAGVV