Gene BAS1079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1079
Symbol
ID	2847988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1132237
End bp	1133538
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	33%
IMG OID	637504337
Product	alpha-amylase family protein
Protein accession	YP_027351
Protein GI	49184099
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0366] Glycosidases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000334423
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTGTGG GGAAAATACA TACTAGGAAA CTATTCATTT GTTTTTGTTT AGCTGTCGTT 
TTGTTTGTAC CAATACATAC ATTTGCAGAC GAAAAAAGAG AGTGGCGAGA TGAAGTTATA 
TATTCCATTA TGATTGATCG TTTCAATAAT GGGGAACCGA AAAATGACAA ACAGTTAGAA 
GTTGGTAATT TAGAAGGATA TCAGGGCGGA GATATAAGAG GCATTATAAA AAGACTGGAT 
TACATAAAAG AAATAGGATT TACCACTGTT ATGCTTTCGC CGCTGTTTGA AAGTGTAAAA 
TACGATGGAG TAGACGTGCG CAATTTTCAG AAGGTAAATG AACATTTCGG AACAGAAAAT 
GATGTAAAAG AACTTGTGCA AGAAGCTCAT ACAAAAGGAA TGAAAGTTAT ACTTCAATTT 
CCGCTTGGAG AAAACGAACA ACAAGTAATC GACTCGATGA AATGGTGGGT CAAAGAAGTT 
GATTTAGATG CAAGTTATGT AATGCATAGT GAAAAAAAGT CTCCTGCTTT TTGGGATGAT 
GTGCAAAAAG ATATGCAAGT GATAAAAAAA GATTTTCGAG TTATGACAAA AGAAGATAGT 
GAATACAACG AAAAAATAGT AGAATCGTTT TCTAAAGCGG ACGTATCGGT AAAATCTTTA 
TATGATGTGA GTAAAAAAGA CGAGGAATTC ATTACATTTT TAGATAATCA AGATACAAAA 
AGATTTGCTC GTATTGCAAA GGAAAATATG AATTATCCGC CATCGCGTTT GAAACTAGCT 
CTTACATATT TATTGACATC ACCAGGCATT CCGAATTTTT ATTACGGGAC TGAAATTGCA 
TTAGATGGAG GGGATACTCC AGATAATAGA CGATTAATGG ATTTCAAATC GGATGAAAAG 
TTTATGCAGC ATATAACAAA ACTTGGTGAA CTTAGACAAA TGAGACCATC TTTACGACGC 
GGTACATTTG AACTCTTATA CGATAAAAAT GGAATGAGTG TACTAAAACG AAAGTATAAA 
GGTGAAGTCA CATTAGTAGC GATTAATAAT ACGAAAGAGA CGCAAAAAGT TGCTTTACCT 
GCAAGTACGA TTGGTGAAAA ACAAGAGTTA AGAGGATTGT TAGAAGATGA AATTATAAGA 
GAAGAAAATG GAAAGTTTTA TCTCGTTTTA AAGCGTGAAG AATCAAATGT GTATAAAGTT 
AATAGAGAAA CAGGTGTGAA TTGGTTATTT ATCTCCTTAA TAGTTGGTGT GAACGTATTA 
TTTATTACTT TTTTAATTGC GGTTAAAAAG AGACGGAAAT GA

Protein sequence

MRVGKIHTRK LFICFCLAVV LFVPIHTFAD EKREWRDEVI YSIMIDRFNN GEPKNDKQLE 
VGNLEGYQGG DIRGIIKRLD YIKEIGFTTV MLSPLFESVK YDGVDVRNFQ KVNEHFGTEN 
DVKELVQEAH TKGMKVILQF PLGENEQQVI DSMKWWVKEV DLDASYVMHS EKKSPAFWDD 
VQKDMQVIKK DFRVMTKEDS EYNEKIVESF SKADVSVKSL YDVSKKDEEF ITFLDNQDTK 
RFARIAKENM NYPPSRLKLA LTYLLTSPGI PNFYYGTEIA LDGGDTPDNR RLMDFKSDEK 
FMQHITKLGE LRQMRPSLRR GTFELLYDKN GMSVLKRKYK GEVTLVAINN TKETQKVALP 
ASTIGEKQEL RGLLEDEIIR EENGKFYLVL KREESNVYKV NRETGVNWLF ISLIVGVNVL 
FITFLIAVKK RRK