Gene Bcer98_1240 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bcer98_1240
Symbol	aroB
ID	5345175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus cytotoxicus NVH 391-98
Kingdom	Bacteria
Replicon accession	NC_009674
Strand	+
Start bp	1350061
End bp	1351170
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	38%
IMG OID	640838830
Product	3-dehydroquinate synthase
Protein accession	YP_001374557
Protein GI	152975040
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0337] 3-dehydroquinate synthetase
TIGRFAM ID	[TIGR01357] 3-dehydroquinate synthase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAGTA TACACATTCA AACAACATCC AAAAAATATG ATGTATATGT TGGCAAACAT 
GTCCTATCCT CTTTAACAGA GGTTGTTCAA CGTATGAAAC CAGCTGTTTC AAATGTTATG 
ATCATTTCTG ATGAATCTGT TGCAACCTTG CATTTACAAA AAGTAAAAGA GGCTTTGCAA 
ATAAAGCAAG ATGTGTTTTC ATTTGTTATT CCAAGTGGAG AAAAAGAAAA GTCATTTGAA 
AATTTCTATG CAGTCCATAC AGCGGCACTT GAGAACAAGC TCGATCGTAA TTCATTAATA 
ATTGCACTAG GTGGCGGAAT GATTGGCGAT TTAGCAGGAT TTGTAGCAGC TACATTTATG 
CGGGGGATTC GCTTTGTTCA AGTACCCACA ACACTGTTGG CACATGATAG TGCAGTGGGC 
GGGAAGGTGG CCATTAACCA TCCTTTAGGG AAAAACATGA TCGGGGCGTT TCATCAGCCA 
GAAGCGGTGT TATACCATAC GCCATTTCTA GATTCATTAC CTGAAAAAGA ATGGCGCTCT 
GGCTTTGCTG AAGTAATCAA ACACGCTTTA ATCGGAGATG TAGAATTATA TCATTGGTTA 
AAAAACAATG TGACAACATT GGCGGATTTA CGAGATGATA AATTAGTTTA TGTATTAAAA 
CGTGCAATCC CTGTCAAAGC GAAGATTGTA GCGCAAGATG AGACAGAAAA AGGGGTGCGT 
GCACATTTGA ACTTTGGGCA TACATTAGGA CATGCCTTAG AAAAAGAATC GGGATATGGC 
AATATCACGC ATGGTGACGG TGTTGCAATC GGCATGTTAT TTGCCATATT TTTAAGTGAA 
CAAATGTATA AGATTGACCT CAGGTATAAA GAATTAAAAC AGTGGTTTTT GCAGTATGGT 
TACCCGAGCA TACCAAGGCA TTTGAAGGTG GATCGTCTTG TAAATGTTAT GAAACAAGAT 
AAAAAAGCAA ATGCTGGAAC AATTCGTATG GTACTTATGC AGGAATATGG GGGCGTACAT 
GTCGTATCTA TTTCAGATAA GACCGTTCAC ACTTCATTAG AAGCATTTCA AAAAGATATG 
GTACTAGGTG AAGAAATGAA TTTTGAATGA

Protein sequence

MESIHIQTTS KKYDVYVGKH VLSSLTEVVQ RMKPAVSNVM IISDESVATL HLQKVKEALQ 
IKQDVFSFVI PSGEKEKSFE NFYAVHTAAL ENKLDRNSLI IALGGGMIGD LAGFVAATFM 
RGIRFVQVPT TLLAHDSAVG GKVAINHPLG KNMIGAFHQP EAVLYHTPFL DSLPEKEWRS 
GFAEVIKHAL IGDVELYHWL KNNVTTLADL RDDKLVYVLK RAIPVKAKIV AQDETEKGVR 
AHLNFGHTLG HALEKESGYG NITHGDGVAI GMLFAIFLSE QMYKIDLRYK ELKQWFLQYG 
YPSIPRHLKV DRLVNVMKQD KKANAGTIRM VLMQEYGGVH VVSISDKTVH TSLEAFQKDM 
VLGEEMNFE