Gene BCZK2677 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BCZK2677
Symbol	aroA
ID	3025316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cereus E33L
Kingdom	Bacteria
Replicon accession	NC_006274
Strand	-
Start bp	2791329
End bp	2792405
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	38%
IMG OID	637546898
Product	bifunctional 3-deoxy-7-phosphoheptulonate synthase/chorismate mutase
Protein accession	YP_084264
Protein GI	52142565
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1605] Chorismate mutase [COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase [TIGR01801] chorismate mutase domain of gram positive AroA protein

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.907033
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAATC ATGAATTAGA TCAATTACGT AAACAGGTAG ATGAAATTAA CTTACAACTA 
TTACACCTTT TAAACAAACG CGGTGAAATC GTTCAAAAAA TTGGGGAACA AAAGCAAGTA 
CAAGGTACAA AACGTTTTGA TCCAGTACGT GAGCGTGAAG TGCTTGATAT GATTGCAGAG 
AATAACGAAG GACCATTCGA AACATCAACA GTTCAACATA TTTTCAAAAC AATCTTCAAA 
GCTAGCTTAG AATTACAAGA AGATGATAAC CGTAAAGCAT TACTAGTATC ACGTAAAAAG 
AAACAAGAAA ATACAATCGT TGATGTAAAA GGTGAATTGA TTGGTAACGG CACACAAACG 
TTCATCATGG GACCTTGTGC GGTAGAAAGC TTAGAGCAAG TTCGCCAAGT AGGGCAAGCG 
ATGAAAGACC AAGGCTTAAA ATTAATGCGC GGTGGTGCTT TCAAACCGAG AACATCTCCA 
TACGATTTCC AAGGTTTAGG AGTAGAAGGG CTACAAATTT TACGCCAAGT AGCAGATGAG 
TTCGACTTAG CGATCATCAG TGAGATTTTA AATCCAAACG ATGTTGAAAT GGCATTAGAC 
TACGTTGATG TAATTCAAGT TGGTGCACGT AACATGCAAA ACTTCGATTT ACTACGAGCT 
GTAGGTAAAG TTAACAAGCC AGTATTATTA AAACGTGGAT TAGCAGCAAC AATTGATGAG 
TTCATTAACG CAGCTGAATA CATCATTGCA CAAGGTAACG ACCAAATTAT TCTATGTGAG 
CGTGGTATCC GCACATACGA AAGAGCAACA CGTAACACAT TAGACATTTC TGCTGTACCG 
ATTTTAAAGA AAGAAACACA TTTACCAGTT ATCGTTGACG TAACGCATTC AACTGGACGT 
AGAGATTTAT TATTACCAAC GGCGAAAGCA GCACTTGCAA TTGGTGCAGA TGCAGTAATG 
GCTGAAGTAC ACCCAGACCC AGCAGTGGCA CTATCTGATT CTGCACAACA AATGGATATT 
CCAGAATTCC ATAGATTCAT GGATGAGTTA AAAGGTTTCA AAAATAAATT ATCTTAA

Protein sequence

MANHELDQLR KQVDEINLQL LHLLNKRGEI VQKIGEQKQV QGTKRFDPVR EREVLDMIAE 
NNEGPFETST VQHIFKTIFK ASLELQEDDN RKALLVSRKK KQENTIVDVK GELIGNGTQT 
FIMGPCAVES LEQVRQVGQA MKDQGLKLMR GGAFKPRTSP YDFQGLGVEG LQILRQVADE 
FDLAIISEIL NPNDVEMALD YVDVIQVGAR NMQNFDLLRA VGKVNKPVLL KRGLAATIDE 
FINAAEYIIA QGNDQIILCE RGIRTYERAT RNTLDISAVP ILKKETHLPV IVDVTHSTGR 
RDLLLPTAKA ALAIGADAVM AEVHPDPAVA LSDSAQQMDI PEFHRFMDEL KGFKNKLS