Gene EcolC_4006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcolC_4006
Symbol
ID	6064559
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli ATCC 8739
Kingdom	Bacteria
Replicon accession	NC_010468
Strand	+
Start bp	4400690
End bp	4402039
Gene Length	1350 bp
Protein Length	449 aa
Translation table	11
GC content	54%
IMG OID	641603417
Product	aspartate kinase III
Protein accession	YP_001726932
Protein GI	170021978
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0527] Aspartokinases
TIGRFAM ID	[TIGR00656] aspartate kinase, monofunctional class [TIGR00657] aspartate kinase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.193511
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTGAAA TTGTTGTCTC CAAATTTGGC GGTACCAGCG TAGCTGATTT TGACGCCATG 
AACCGCAGCG CTGATATTGT GCTTTCTGAT GCCAACGTGC GTTTAGTAGT CCTCTCGGCT 
TCTGCTGGTA TCACTAATCT GCTGGTCGCT TTAGCGGAAG GGCTGGAACC TGGCGAGCGA 
TTCGAAAAAC TCGACGCTAT TCGCAACATC CAGTTTGCCA TTCTGGAACG TCTGCGTTAC 
CCGAACGTTA TCCGTGAAGA GATTGAACGT CTGCTGGAGA ACATTACTGT TCTGGCAGAA 
GCGGCGGCGC TGGCAACGTC TCCGGCGCTG ACAGATGAGC TGGTCAGCCA CGGCGAGCTG 
ATGTCGACCC TGCTGTTTGT TGAGATCCTG CGCGAACGCG ATGTTCAGGC ACAGTGGTTT 
GATGTACGTA AAGTGATGCG TACCAACGAC CGATTTGGTC GTGCAGAGCC AGATGTAGCC 
GCGCTGGCGG AACTGGCCGC GCTGCAGCTG CTCCCACGCC TCAATGACGG CTTAGTGATC 
ACCCAGGGAT TTATCGGTAG CGAAAATAAA GGTCGTACAA CGACGCTTGG CCGTGGAGGC 
AGCGATTATA CGGCAGCCTT GCTGGCGGAG GCTTTACACG CATCTCGTGT TGATATCTGG 
ACCGACGTCC CGGGCATCTA CACCACCGAT CCACGCGTGG TTTCCGCAGC AAAACGCATT 
GATGAAATCG CGTTTGCCGA AGCGGCAGAG ATGGCAACTT TTGGTGCAAA AGTACTGCAT 
CCAGCAACGT TGCTCCCCGC AGTACGCAGC GATATCCCGG TCTTTGTCGG CTCCAGCAAA 
GACTCACGCG CAGGTGGTAC GCTGGTGTGC AATAAAACTG AAAATCCGCC GCTGTTCCGC 
GCGCTGGCGC TTCGTCGCAA TCAGACTCTA CTCACTTTGC ACAGCCTGAA TATGCTGCAT 
TCTCGCGGTT TCCTCGCGGA AGTTTTCGGC ATCCTCGCGC GGCATAATAT TTCGGTAGAC 
TTAATCACCA CGTCAGAAGT GAGCGTGGCA TTAACCCTTG ATACCACCGG TTCAACCTCC 
ACTGGCGATA CGTTGCTGAC GCAATCTCTG CTGATGGAGC TTTCCGCACT GTGTCGGGTG 
GAGGTGGAAG AAGGTCTGGC GCTGGTCGCG TTGATTGGCA ATGACCTGTC AAAAGCCTGC 
GGCGTTGGCA AAGAGGTATT CGGCGTACTG GAACCGTTCA ACATTCGCAT GATTTGTTAT 
GGCGCATCCA GCCATAACCT GTGCTTCCTG GTGCCCGGCG AAGATGCCGA GCAGGTGGTG 
CAAAAACTGC ATAGTAATTT GTTTGAGTAA

Protein sequence

MSEIVVSKFG GTSVADFDAM NRSADIVLSD ANVRLVVLSA SAGITNLLVA LAEGLEPGER 
FEKLDAIRNI QFAILERLRY PNVIREEIER LLENITVLAE AAALATSPAL TDELVSHGEL 
MSTLLFVEIL RERDVQAQWF DVRKVMRTND RFGRAEPDVA ALAELAALQL LPRLNDGLVI 
TQGFIGSENK GRTTTLGRGG SDYTAALLAE ALHASRVDIW TDVPGIYTTD PRVVSAAKRI 
DEIAFAEAAE MATFGAKVLH PATLLPAVRS DIPVFVGSSK DSRAGGTLVC NKTENPPLFR 
ALALRRNQTL LTLHSLNMLH SRGFLAEVFG ILARHNISVD LITTSEVSVA LTLDTTGSTS 
TGDTLLTQSL LMELSALCRV EVEEGLALVA LIGNDLSKAC GVGKEVFGVL EPFNIRMICY 
GASSHNLCFL VPGEDAEQVV QKLHSNLFE