Gene BAS1427 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1427
Symbol	aroB
ID	2849905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1452853
End bp	1453944
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	37%
IMG OID	637504683
Product	3-dehydroquinate synthase
Protein accession	YP_027696
Protein GI	49184444
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAACA TACATATTCA AACGAAATCA AAAGAATATG ATGTATATGT AGGAAAAGAA 
TCGTTGTCAC ATTTGACAAC AATCGTTCAA AACATGCAGC CATCTGTATC AAATATTATG 
ATCATTTCAG ATGAAGCTGT TGCATCTTTA CATTTACAGA CAGTTGTAGA CGCGTTGCAA 
ATAGATCAAA AAGTATTTTC ATTCGTTGTA CCGAGTGGTG AAAAAGAGAA GTCCTTTGAA 
AATTTCTATG CGGCTCATAC GTCAGCTCTT GAAAATAAAT TAGATAGAAA TTCTTTAATT 
ATTGCACTTG GAGGTGGGAT GATTGGAGAT TTAGCTGGTT TTGTTGCTGC GTCGTTTATG 
CGTGGAATTC GCTTTGTTCA AGTTCCGACG ACTTTATTAG CTCACGATAG CGCGGTAGGT 
GGGAAAGTAG CAATCAATCA TCCGTTAGGT AAAAATATGA TAGGTGCATT CCATCAACCG 
GAAGCAGTTG TATATCATAC GCCATTTTTA CAGTCTCTTC CTGAAAAAGA GTGGCGCTCA 
GGTTATGCAG AAGTGATAAA ACATGCTCTA ATTGGTGATG TAAAGCTATA TCATTGGCTA 
AAAGAAGAAG TGCAAACATT AGCAGATCTT CGTGATGAGA AATTAATCCA TATATTAATG 
AAGGCAATTC CTGTAAAGGC AAACATTGTA GCACAAGATG AAACAGAAAA AGGTGTACGT 
GCTCATTTGA ACTTTGGACA TACGTTAGGC CATGCTCTTG AAAAAGAACT AGGATATGGA 
AATATTACTC ACGGTGACGG AGTAGCGGTT GGAATGTTAT TTGCTATATT CTTAAGTGAA 
CAAGTGTATA AGGTGAATCT TGCTTATGAA GAGATGAAGC AGTGGTTCTT GAATTACGGC 
TATCCAAAAA TGCCAAGTGA TTTAAGTGTA GAACGCCTCG TCGGGTTGAT GAAACAAGAT 
AAGAAAGCGA ATGCAGGGAC AATTCATATG GTACTTATGC AGGAATATGG GGTAGTGAAT 
GTCGTATCTA TTCCTGATGA GACTGTTCAT ATTGCGTTAG AGGCATTTCA AAAGGATATG 
GTTGAAAAAT AA

Protein sequence

MGNIHIQTKS KEYDVYVGKE SLSHLTTIVQ NMQPSVSNIM IISDEAVASL HLQTVVDALQ 
IDQKVFSFVV PSGEKEKSFE NFYAAHTSAL ENKLDRNSLI IALGGGMIGD LAGFVAASFM 
RGIRFVQVPT TLLAHDSAVG GKVAINHPLG KNMIGAFHQP EAVVYHTPFL QSLPEKEWRS 
GYAEVIKHAL IGDVKLYHWL KEEVQTLADL RDEKLIHILM KAIPVKANIV AQDETEKGVR 
AHLNFGHTLG HALEKELGYG NITHGDGVAV GMLFAIFLSE QVYKVNLAYE EMKQWFLNYG 
YPKMPSDLSV ERLVGLMKQD KKANAGTIHM VLMQEYGVVN VVSIPDETVH IALEAFQKDM 
VEK