Gene BAS2748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS2748
Symbol
ID	2852601
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	2727743
End bp	2728819
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	38%
IMG OID	637505993
Product	bifunctional 3-deoxy-7-phosphoheptulonate synthase/chorismate mutase
Protein accession	YP_029006
Protein GI	49185754
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1605] Chorismate mutase [COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase [TIGR01801] chorismate mutase domain of gram positive AroA protein

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.531887
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAATC ATGAATTAGA TCAATTACGT AAACAGGTAG ATGAAATTAA CTTACAACTA 
TTACACCTTT TAAACAAACG CGGTGAAATC GTTCAAAAAA TTGGGGAACA AAAGCAAGTA 
CAAGGTACAA AACGTTTTGA TCCAGTACGT GAGCGTGAAG TGCTTGATAT GATTGCAGAG 
AATAACGAAG GACCATTCGA AACATCAACA GTTCAACATA TTTTCAAAAC AATCTTCAAA 
GCTAGCTTAG AATTACAAGA AGATGATAAC CGTAAAGCAT TACTAGTATC ACGTAAAAAG 
AAACAAGAAA ACACAATCGT TGATGTAAAA GGTGAATTGA TTGGTAACGG CACACAAACG 
TTCATCATGG GACCTTGCGC GGTAGAAAGC TTAGAGCAAG TTCGCCAAGT AGGGCAAGCG 
ATGAAAGACC AAGGCTTAAA ATTAATGCGC GGTGGTGCTT TCAAACCGAG AACATCTCCA 
TACGATTTCC AAGGTTTAGG AGTAGAAGGG CTACAAATTT TACGTCAAGT AGCAGATGAG 
TTCGACTTAG CGATCATTAG TGAGATTTTA AATCCAAACG ATGTTGAAAT GGCATTAGAC 
TACGTTGATG TAATTCAAGT TGGTGCACGT AACATGCAAA ACTTCGATTT ACTACGAGCT 
GTAGGTAAAG TTAACAAGCC AGTATTATTA AAACGTGGAT TAGCAGCAAC AATTGATGAG 
TTCATTAATG CAGCGGAATA CATCATTGCA CAAGGTAATG ACCAAATTAT TCTATGTGAG 
CGCGGTATTC GCACATACGA AAGAGCAACA CGTAACACAT TAGACATTTC AGCAGTACCG 
ATCTTAAAGA AAGAAACACA TTTACCAGTT GTTGTTGACG TAACGCATTC AACTGGACGT 
AGAGATTTAT TATTACCAAC AGCGAAAGCG GCTCTTGCAA TTGGTGCAGA TGCAGTAATG 
GCTGAAGTAC ATCCAGACCC AGCAGTTGCA TTATCAGATT CTGCACAACA AATGGATATT 
CCGGAATTCC ATAGATTCAT GGAAGAGTTA AAAGGTTTCA AAAATAAATT ATCTTAA

Protein sequence

MANHELDQLR KQVDEINLQL LHLLNKRGEI VQKIGEQKQV QGTKRFDPVR EREVLDMIAE 
NNEGPFETST VQHIFKTIFK ASLELQEDDN RKALLVSRKK KQENTIVDVK GELIGNGTQT 
FIMGPCAVES LEQVRQVGQA MKDQGLKLMR GGAFKPRTSP YDFQGLGVEG LQILRQVADE 
FDLAIISEIL NPNDVEMALD YVDVIQVGAR NMQNFDLLRA VGKVNKPVLL KRGLAATIDE 
FINAAEYIIA QGNDQIILCE RGIRTYERAT RNTLDISAVP ILKKETHLPV VVDVTHSTGR 
RDLLLPTAKA ALAIGADAVM AEVHPDPAVA LSDSAQQMDI PEFHRFMEEL KGFKNKLS