Gene BAS4591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4591
Symbol
ID	2850431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4492721
End bp	4493794
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	41%
IMG OID	637507827
Product	M42 family peptidase
Protein accession	YP_030837
Protein GI	49187584
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1363] Cellulase M and related proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAATAAAG AGACATTACA ATTATTTCGT ACGTTAACAG AATTACAAGG TGCATCAGGT 
TTTGAACATG ATGTGCGCCG TTTTATGAAG CAAGAATTAA GCAAATATGC AGATGAAATT 
GTACAAGACG GTTTAGGTAG CGTATTTGGT CTGAAAAAAG GGGACGAAAC TGGCCCGCGT 
GTTCTTGTAG CAGGTCATAT GGATGAAGTA GGTTTCATGA TTACGCAAAT TACGAAAAAC 
GGAATGCTTC GTTTTCAACC GTTAGGCGGC TGGTGGAGCC AAGTACTATT AGCGCAACGC 
GTACAAGTGA TGACGAAGAA TGGTCCTGTT ATTGGGGTTG TTGGTTCTAT CCCTCCTCAT 
TTATTAAGTG ACGCGCAACG TGCAAAACCG ATGGATATAA AAAACATGTT AATTGATATA 
GGTGCAGATA GCTATGAAGA TGCGATTGAA ATTGGTGTAA AACCAGGACA ACAAATCGTA 
CCAATCTGCC CGTTTACGCC GATGGCAAAC GAAAAGAAAA TTATGGCGAA AGCTTGGGAC 
AACCGTTACG GATGTGGTCT TGCAATCGAA TTACTAAAAG AATTAAAAGA CGAAACATTA 
CCAAACACAT TATACTCTGG TGCGACTGTA CAAGAAGAAG TTGGTCTTCG CGGTGCACAA 
ACTGCTGCAA ATATGATCCA ACCAGACATT TTCTATGCGC TTGATGCAAG TCCAGCAAAC 
GATGCATCTG GTGACAAAAC ACAGTTCGGT CAATTAGGAA AAGGTGCTCT TCTTCGTATT 
TACGATCGTA CGATGGTAAC ACATAGAGGA ATGCGTGAAT TCATTTTAGA TACAGCAGAA 
ACAAACAACA TTCCGTACCA ATACTTTATT TCACAAGGTG GTACAGATGC GGGCCGTGTA 
CATACAAGTA ACTCAGGTAT CCCATCAGCA GTAATTGGTG TTTGCGCACG TTACATTCAT 
ACACATGCTT CTATTTTACA TGTTGATGAT TATGCAGCAG CGAAAGAGCT AATTACGAAG 
CTTGTAAGAG CAACAGATAA AACGACGTTA GAGACAATTA AGAATAACGC GTAA

Protein sequence

MNKETLQLFR TLTELQGASG FEHDVRRFMK QELSKYADEI VQDGLGSVFG LKKGDETGPR 
VLVAGHMDEV GFMITQITKN GMLRFQPLGG WWSQVLLAQR VQVMTKNGPV IGVVGSIPPH 
LLSDAQRAKP MDIKNMLIDI GADSYEDAIE IGVKPGQQIV PICPFTPMAN EKKIMAKAWD 
NRYGCGLAIE LLKELKDETL PNTLYSGATV QEEVGLRGAQ TAANMIQPDI FYALDASPAN 
DASGDKTQFG QLGKGALLRI YDRTMVTHRG MREFILDTAE TNNIPYQYFI SQGGTDAGRV 
HTSNSGIPSA VIGVCARYIH THASILHVDD YAAAKELITK LVRATDKTTL ETIKNNA