Gene EcSMS35_4469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_4469
Symbol	aceA
ID	6142638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	+
Start bp	4562478
End bp	4563782
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	55%
IMG OID	641619285
Product	isocitrate lyase
Protein accession	YP_001746397
Protein GI	170682682
COG category	[C] Energy production and conversion
COG ID	[COG2224] Isocitrate lyase
TIGRFAM ID	[TIGR01346] isocitrate lyase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0668028
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.0385997
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAACCC GTACACAACA AATTGAAGAA TTACAGAAAG AGTGGACTCA ACCGCGTTGG 
GAAGGCATTA CTCGGCCATA CAGCGCGGAA GATGTGGTGA AATTACGCGG TTCAGTCAAT 
CCTGAATGCA CGCTGGCGCA ACTGGGCGCG GCGAAAATGT GGCGTCTGCT GCACGGCGAG 
TCGAAAAAAG GCTACATCAA CAGCCTCGGT GCACTGACTG GCGGTCAGGC GCTGCAACAG 
GCGAAAGCGG GTATTGAAGC GGTCTATCTG TCGGGATGGC AGGTAGCGGC GGACGCTAAC 
CTGGCGGCCA GCATGTATCC GGATCAGTCG CTCTATCCGG CAAACTCGGT GCCAGCTGTG 
GTGGAGCGGA TCAACAACAC CTTCCGCCGT GCGGATCAGA TCCAATGGTC CGCGGGCATT 
GAGCCGGGCG ATCCGCGCTA TGTCGATTAC TTCCTGCCGA TCGTTGCTGA TGCGGAAGCC 
GGTTTTGGCG GTGTCCTGAA TGCCTTTGAA CTGATGAAAG CGATGATTGA AGCCGGTGCA 
GCGGCAGTTC ACTTCGAAGA TCAGCTGGCA TCAGTGAAGA AATGCGGTCA CATGGGCGGC 
AAAGTTTTAG TGCCAACTCA GGAAGCTATT CAGAAACTGG TCGCGGCGCG TCTGGCAGCT 
GACGTGACGG GCGTTCCAAC CCTTCTGGTT GCCCGTACCG ATGCTGATGC GGCGGATCTG 
ATTACCTCCG ATTGCGACCC GTATGACAGC GAATTTATTA CCGGCGAGCG TACCAGTGAA 
GGCTTCTTCC GTACTCATGC AGGTATTGAA CAAGCGATCA GCCGTGGCCT GGCGTATGCG 
CCATATGCTG ACCTGGTATG GTGTGAAACC TCCACGCCGG ATCTGGAACT GGCGCGTCGC 
TTTGCACAAG CCATCCACGC GAAATATCCG GGCAAACTGC TGGCTTATAA CTGCTCGCCT 
TCGTTCAACT GGCAGAAAAA CCTCGACGAC AAAACTATTG CCAGCTTCCA GCAGCAGCTG 
TCGGATATGG GCTACAAGTT CCAGTTCATC ACCCTGGCAG GTATCCACAG CATGTGGTTC 
AACATGTTTG ACCTGGCAAA CGCCTATGCC CAGGGCGAGG GTATGAAGCA CTATGTTGAG 
AAAGTGCAGC AGCCGGAATT TGCCGCCGCG AAAGATGGCT ATACCTTCGT ATCTCACCAG 
CAGGAAGTGG GTACAGGTTA CTTCGATAAA GTGACGACCA TTATTCAGGG CGGCACGTCG 
TCGGTTACCG CACTGACTGG CTCCACTGAA GAATCGCAGT TCTAA

Protein sequence

MKTRTQQIEE LQKEWTQPRW EGITRPYSAE DVVKLRGSVN PECTLAQLGA AKMWRLLHGE 
SKKGYINSLG ALTGGQALQQ AKAGIEAVYL SGWQVAADAN LAASMYPDQS LYPANSVPAV 
VERINNTFRR ADQIQWSAGI EPGDPRYVDY FLPIVADAEA GFGGVLNAFE LMKAMIEAGA 
AAVHFEDQLA SVKKCGHMGG KVLVPTQEAI QKLVAARLAA DVTGVPTLLV ARTDADAADL 
ITSDCDPYDS EFITGERTSE GFFRTHAGIE QAISRGLAYA PYADLVWCET STPDLELARR 
FAQAIHAKYP GKLLAYNCSP SFNWQKNLDD KTIASFQQQL SDMGYKFQFI TLAGIHSMWF 
NMFDLANAYA QGEGMKHYVE KVQQPEFAAA KDGYTFVSHQ QEVGTGYFDK VTTIIQGGTS 
SVTALTGSTE ESQF