Gene GBAA_2958 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GBAA_2958
Symbol
ID	2819977
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. 'Ames Ancestor'
Kingdom	Bacteria
Replicon accession	NC_007530
Strand	-
Start bp	2727408
End bp	2728484
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	38%
IMG OID	637789764
Product	bifunctional 3-deoxy-7-phosphoheptulonate synthase/chorismate mutase
Protein accession	YP_019601
Protein GI	47528252
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1605] Chorismate mutase [COG2876] 3-deoxy-D-arabino-heptulosonate 7-phosphate (DAHP) synthase
TIGRFAM ID	[TIGR01361] phospho-2-dehydro-3-deoxyheptonate aldolase [TIGR01801] chorismate mutase domain of gram positive AroA protein

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0331892
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAATC ATGAATTAGA TCAATTACGT AAACAGGTAG ATGAAATTAA CTTACAACTA 
TTACACCTTT TAAACAAACG CGGTGAAATC GTTCAAAAAA TTGGGGAACA AAAGCAAGTA 
CAAGGTACAA AACGTTTTGA TCCAGTACGT GAGCGTGAAG TGCTTGATAT GATTGCAGAG 
AATAACGAAG GACCATTCGA AACATCAACA GTTCAACATA TTTTCAAAAC AATCTTCAAA 
GCTAGCTTAG AATTACAAGA AGATGATAAC CGTAAAGCAT TACTAGTATC ACGTAAAAAG 
AAACAAGAAA ACACAATCGT TGATGTAAAA GGTGAATTGA TTGGTAACGG CACACAAACG 
TTCATCATGG GACCTTGCGC GGTAGAAAGC TTAGAGCAAG TTCGCCAAGT AGGGCAAGCG 
ATGAAAGACC AAGGCTTAAA ATTAATGCGC GGTGGTGCTT TCAAACCGAG AACATCTCCA 
TACGATTTCC AAGGTTTAGG AGTAGAAGGG CTACAAATTT TACGTCAAGT AGCAGATGAG 
TTCGACTTAG CGATCATTAG TGAGATTTTA AATCCAAACG ATGTTGAAAT GGCATTAGAC 
TACGTTGATG TAATTCAAGT TGGTGCACGT AACATGCAAA ACTTCGATTT ACTACGAGCT 
GTAGGTAAAG TTAACAAGCC AGTATTATTA AAACGTGGAT TAGCAGCAAC AATTGATGAG 
TTCATTAATG CAGCGGAATA CATCATTGCA CAAGGTAATG ACCAAATTAT TCTATGTGAG 
CGCGGTATTC GCACATACGA AAGAGCAACA CGTAACACAT TAGACATTTC AGCAGTACCG 
ATCTTAAAGA AAGAAACACA TTTACCAGTT GTTGTTGACG TAACGCATTC AACTGGACGT 
AGAGATTTAT TATTACCAAC AGCGAAAGCG GCTCTTGCAA TTGGTGCAGA TGCAGTAATG 
GCTGAAGTAC ATCCAGACCC AGCAGTTGCA TTATCAGATT CTGCACAACA AATGGATATT 
CCGGAATTCC ATAGATTCAT GGAAGAGTTA AAAGGTTTCA AAAATAAATT ATCTTAA

Protein sequence

MANHELDQLR KQVDEINLQL LHLLNKRGEI VQKIGEQKQV QGTKRFDPVR EREVLDMIAE 
NNEGPFETST VQHIFKTIFK ASLELQEDDN RKALLVSRKK KQENTIVDVK GELIGNGTQT 
FIMGPCAVES LEQVRQVGQA MKDQGLKLMR GGAFKPRTSP YDFQGLGVEG LQILRQVADE 
FDLAIISEIL NPNDVEMALD YVDVIQVGAR NMQNFDLLRA VGKVNKPVLL KRGLAATIDE 
FINAAEYIIA QGNDQIILCE RGIRTYERAT RNTLDISAVP ILKKETHLPV VVDVTHSTGR 
RDLLLPTAKA ALAIGADAVM AEVHPDPAVA LSDSAQQMDI PEFHRFMEEL KGFKNKLS