Gene BAS4220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4220
Symbol
ID	2847942
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4135815
End bp	4136921
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	38%
IMG OID	637507456
Product	germination protease
Protein accession	YP_030468
Protein GI	49187216
COG category
COG ID
TIGRFAM ID	[TIGR01441] GPR endopeptidase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0681612
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAGAAC CATTAGATTT AAGTAAATAT AGCGTTAGAA CTGACCTTGC TGTAGAGGCA 
CATCAAATGT TGCAAGAGCG TCAAGAAGAG CAACAACAAG GGATACAAGG AGTTATTGTA 
AAAGAGAGGG AAGAAGAAGG TATTATCATT ACGAAAGTAA CGATTGATGA AGTTGCCTCT 
GAATCGATGG GTAAAAAACC TGGAAATTAT TTAACACTTG AAGTACAAGG TATACGTCAA 
CAAGATACGG AATTGCAACA AAAAGTAGAG CGCATTTTTG CAAAAGAATT TTCTTATTTC 
TTAGAAGAGG TTGGCGTTAC GAAAGAAGCG AGTTGTTTAA TTGTTGGTCT TGGAAATTGG 
AATGTAACCC CTGATGCGCT TGGACCGATA GTGGTAGAAA ATGTATTGGT AACGAGACAT 
TTGTTTCAAT TGCAGCCTGA AAGTGTAGAA GAAGGCTTTA GGCCTGTTAG TGCAATTCGG 
CCGGGGGTAA TGGGGATTAC AGGAATTGAA ACGAGCGATG TCATTTATGG AATCATTGAG 
AAGACAAAAC CAGACTTTGT CATTGCAATT GATGCATTAG CTGCTCGTTC TATTGAAAGG 
GTAAATAGTA CGATACAAAT TTCTGATACA GGAATTCATC CTGGATCGGG TGTTGGGAAT 
AAACGTAAGG AACTGAGTAA AGAAACATTA GGTATTCCTG TTATCGCAAT TGGTGTTCCG 
ACTGTGGTGG ATGCCGTTTC AATTACAAGC GATACAATTG ATTTTATTTT GAAACATTTT 
GGCCGGGAGA TGAAAGAAGG AAACAAACCT TCTCGCTCTT TGTTACCAGC TGGTTTTACA 
TTTGGAGAAA AGAAAAAATT AACAGAAGAG GATATGCCGG ATGAAAAGAG CCGAAATATG 
TTTTTAGGTG CTGTAGGTAC ACTGGAAGAT GAAGAGAAGA GAAAATTAAT TTATGAAGTG 
TTATCTCCTC TAGGTCATAA TTTAATGGTG ACTCCGAAAG AAGTGGATGC TTTCATAGAA 
GATATGGCAA ATGTAATCGC AAGTGGTTTA AATGCAGCGC TGCATCATCA AATTGACCAA 
GATAATACAG GAGCGTATAC ACATTGA

Protein sequence

MKEPLDLSKY SVRTDLAVEA HQMLQERQEE QQQGIQGVIV KEREEEGIII TKVTIDEVAS 
ESMGKKPGNY LTLEVQGIRQ QDTELQQKVE RIFAKEFSYF LEEVGVTKEA SCLIVGLGNW 
NVTPDALGPI VVENVLVTRH LFQLQPESVE EGFRPVSAIR PGVMGITGIE TSDVIYGIIE 
KTKPDFVIAI DALAARSIER VNSTIQISDT GIHPGSGVGN KRKELSKETL GIPVIAIGVP 
TVVDAVSITS DTIDFILKHF GREMKEGNKP SRSLLPAGFT FGEKKKLTEE DMPDEKSRNM 
FLGAVGTLED EEKRKLIYEV LSPLGHNLMV TPKEVDAFIE DMANVIASGL NAALHHQIDQ 
DNTGAYTH