Gene BAS1021 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1021
Symbol
ID	2848728
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1073860
End bp	1074900
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	34%
IMG OID	637504280
Product	S-layer protein
Protein accession	YP_027294
Protein GI	49184042
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5386] Cell surface protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.347514
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATAATGA TTAAGAAAAA ATATATGAAT GCATTCGTTA TAGCAGCAAC TTTAGCAGTT 
CCATTTAGTA GTATTATGGC ACCGATTGCG AAGGCAGAAG CGGCGGTTGA AATGAAAGCA 
GCTAGCAAAT TAGCAGATGG CACTTATGAC GTTATTTTAA AGACTTATAA AGATAAAACG 
AATGATACAT CAGTTGCGTC TACATATTTA AAAAATCTAA AAGTAACCAT TCAAGGTGAT 
AAAAAAATCG TTACGTTAAC AGTTCAAGAT AGTAGCTATT TCCAGTATCT TAGAGTAGAA 
GATACGAATA AAGTAGGGAC ATTCCATGAT GTAAAAGTAA TTTCCGAAGA TAAAGCAAAT 
AACGGTACGA AAGTTGTTCA ATTTGAAATT GATGAGTTTT CGAAAAAATA TAATATGCAA 
ATGCATATAT TAATTCCAGC AATTAAATAT GATCATAAAT ATCAAGTACA GTTTGAAATC 
GACGCGAGTG CAATTGAACA GAAGCCTAAA TTCTCAGATG TACCAACTTG GGCACAAGAG 
TCAGTTCAAT ATTTAGTAGA TAAAGAAGCA GTGCACGGTA AACCAGATGG TACATTTGCT 
CCGGCTGAAA GTATCGATCG TAGTTCAGCT GCAAAAATAT TAGCAACTGT TTTACGGTTA 
GAAATTAAGA AAGATGCAAA GCCATCATTC CCTGATGCAC AAAACCACTG GGCAACTCCA 
TATATTGCTG CTGTTGAAAA AGCAGGTATT GTAAAAGGTG ATGAGAAGGG AAACTTTAAT 
CCAAGCGGGT TAATTAACCG TGCATCAATG GCTTCTATGT TAGTAAATGC ATATAAATTA 
GAAAGAAATG AAAATATAAA ACTACCGAAA GAATTTGCTG ACTTAAACAA TCATTGGGGT 
GCGAAGTATG CCAATATTTT AATCCAAGAA AAGATTTCAA TTGGAACAGA TAATGGCTGG 
GCTCCAAATA AAGCAGTAAG TCGTGCGGAA GCAGCACAAT TTATTGCGAA GGCGGATAAA 
TTGAAGAAAG AAATGAAATA G

Protein sequence

MIMIKKKYMN AFVIAATLAV PFSSIMAPIA KAEAAVEMKA ASKLADGTYD VILKTYKDKT 
NDTSVASTYL KNLKVTIQGD KKIVTLTVQD SSYFQYLRVE DTNKVGTFHD VKVISEDKAN 
NGTKVVQFEI DEFSKKYNMQ MHILIPAIKY DHKYQVQFEI DASAIEQKPK FSDVPTWAQE 
SVQYLVDKEA VHGKPDGTFA PAESIDRSSA AKILATVLRL EIKKDAKPSF PDAQNHWATP 
YIAAVEKAGI VKGDEKGNFN PSGLINRASM ASMLVNAYKL ERNENIKLPK EFADLNNHWG 
AKYANILIQE KISIGTDNGW APNKAVSRAE AAQFIAKADK LKKEMK