Gene EcSMS35_2486 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	EcSMS35_2486
Symbol	aroC
ID	6144165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Escherichia coli SMS-3-5
Kingdom	Bacteria
Replicon accession	NC_010498
Strand	-
Start bp	2533155
End bp	2534240
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	56%
IMG OID	641617358
Product	chorismate synthase
Protein accession	YP_001744530
Protein GI	170680943
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.519758
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGGAA ACACAATTGG ACAACTCTTT CGCGTAACCA CCTTCGGCGA ATCGCACGGG 
CTGGCGCTCG GCTGCATCGT CGATGGTGTT CCGCCAGGCA TTCCGCTGAC GGAAGCGGAC 
CTGCAACATG ACCTCGACCG TCGTCGCCCT GGGACATCGC GCTATACCAC CCAGCGTCGT 
GAGCCGGATC AGGTCAAAAT TCTCTCCGGT GTTTTTGAAG GCGTTACTAC CGGCACCAGC 
ATCGGATTGT TGATCGAAAA TACCGACCAG CGTTCTCAGG ATTATAGTGC GATTAAGGAC 
GTTTTCCGTC CAGGTCATGC CGATTACACT TACGAACAAA AATACGGCCT GCGCGATTAT 
CGCGGCGGCG GGCGCTCTTC CGCCCGAGAA ACCGCCATGC GCGTGGCGGC AGGGGCGATT 
GCCAAAAAAT ATCTCGCCGA GAAATTTGGT ATTGAAATCC GCGGCTGCCT GACCCAGATG 
GGTGACATTC CGCTGGAAAT CAAAGACTGG TCGCAGGTCG AGCAAAATCC GTTTTTCTGC 
CCGGACCCGG ACAAAATCGA CGCGTTAGAT GAACTGATGC GCGCGCTGAA AAAAGAGGGC 
GACTCCATCG GCGCGAAAGT CACCGTTGTT GCCAGTGGCG TCCCCGCCGG ACTTGGCGAG 
CCGGTCTTTG ATCGCCTGGA TGCCGACATC GCCCATGCGC TGATGAGCAT CAACGCGGTG 
AAAGGCGTAG AAATTGGTGA TGGTTTTGAC GTGGTAGCGC TGCGTGGCAG CCAGAACCGC 
GACGAAATCA CCAAAGACGG ATTCCAGAGC AACCATGCGG GCGGCATTCT TGGCGGTATC 
AGCAGCGGGC AGCAAATCAT TGCCCATATG GCGCTGAAGC CAACCTCCAG TATTACCGTG 
CCGGGGCGCA CCATTAACCG CTTTGGCGAA GAAGTTGAGA TGATCACCAA AGGTCGTCAC 
GATCCTTGTG TTGGGATCCG CGCGGTGCCG ATCGCGGAAG CGATGCTAGC GATCGTTTTA 
ATGGATCACC TGTTACGGCA ACGGGCGCAA AATGCCGATG TGAAGACTGA TATTCCACGC 
TGGTAA

Protein sequence

MAGNTIGQLF RVTTFGESHG LALGCIVDGV PPGIPLTEAD LQHDLDRRRP GTSRYTTQRR 
EPDQVKILSG VFEGVTTGTS IGLLIENTDQ RSQDYSAIKD VFRPGHADYT YEQKYGLRDY 
RGGGRSSARE TAMRVAAGAI AKKYLAEKFG IEIRGCLTQM GDIPLEIKDW SQVEQNPFFC 
PDPDKIDALD ELMRALKKEG DSIGAKVTVV ASGVPAGLGE PVFDRLDADI AHALMSINAV 
KGVEIGDGFD VVALRGSQNR DEITKDGFQS NHAGGILGGI SSGQQIIAHM ALKPTSSITV 
PGRTINRFGE EVEMITKGRH DPCVGIRAVP IAEAMLAIVL MDHLLRQRAQ NADVKTDIPR 
W