Gene BAS1001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1001
Symbol
ID	2849110
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1053083
End bp	1054504
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	42%
IMG OID	637504260
Product	protoporphyrinogen oxidase
Protein accession	YP_027274
Protein GI	49184022
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1232] Protoporphyrinogen oxidase
TIGRFAM ID	[TIGR00562] protoporphyrinogen oxidase

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.00000915854
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAGGAAAA AAGTTGTAAT CATCGGCGGT GGCATCACAG GATTAACAAC AATGTATCAC 
TTACAAAAAG ATATTCGTGA CAAGAACTTG CCGATCGATA CATTACTGAT AGAAGCATCG 
GGTAAACTTG GCGGGAAAAT TCAAACCGTT CGAAAAGATG GATTTACAAT TGAACGCGGA 
CCGGATTCTT TCTTAGCACG AAAAGAAAGT GCAGCTAGAT TAGTGAAAGA ATTAGGTCTT 
GGCGATGAGC TTGTAAATAA TCAGGCCGGT CAATCATTTA TCCTCGTAAA CAATCGGTTA 
CATAAAATGC CGAGCGGATC AATGATGGGA ATTCCAACGC AAATTACGCC GTTTCTATTT 
TCTGGGCTGT TCTCCCCAAT TGGGAAACTA AGAGCTGGTT TTGATCTATT AATGCCAAGA 
TCAAAACCAG TATCTGACCA ATCACTCGGG CACTTTTTCA GACATCGCCT CGGAAATGAA 
GTGGTTGAAA ATTTAATAGA ACCATTACTA TCTGGTATTT ATGCAGGGGA TATTGATGAA 
ATGAGCTTAA TGTCAACATT CCCGCAAATG TATCAAATTG AGCAGAAACA TCGCAGTATT 
TCACTCGGTA TGCGTACGCT CGCCCCGAAA GCAGAGAAAG CTGAACCGAA AAAGGGAATC 
TTCCAAACAG TGAAAACCGG TTTAGAATCT ATCGTAGAAT CTCTCGAATT AAAGATGCAT 
GAAGGTACGA TAATAAAGGG AACTCGCATA GAAAAAGTTG CAAAACAGGG TGATGGCTAT 
GCGATTACTC TTAGTAACGG AAAAGAAATA GAAGCGGACG CGGTCGTAGT GGCAAGCTCA 
CATAAAGTAT TGCCATCTAT GTTTGCGCAG TACAAGCAAT TTCGTTTCTT CCGCAACATT 
CCATCCACAT CAGTTGCGAA TGTGGCAATG GCTTTCCCGA AATCAGCCAT TCAGCGGGAT 
ATTGATGGTA CAGGATTTGT TGTCTCTCGA AATAGTGATT ACACAATTAC AGCATGTACG 
TGGACGCATA AAAAGTGGCC ACATACAACG CCAGAAGGAA AAACGCTTCT TCGATGTTAC 
GTTGGACGAC CTGGTGATGA AGCGGTTGTA GAACAAACAG AAGAGGAACT CGTTCAGCTC 
GTACTAGAAG ACTTACGAAA GACGATGGAT ATTACAGAGG ATCCAGAGTT TACAGTCGTA 
AGTCGCTGGA AAGAAGCAAT GCCCCAATAT ACAGTAGGCC ATAACGAGCG AATGAAGAAA 
CTCACAACAT TTATGGAGAA AGAGTTGCCA GGTATATACT TGGCAGGTAG TTCTTACGCT 
GGTTCTGGTC TTCCGGACTG TATTGATCAA GGTGAGAAGG CTGCAAAACG TGTACTCTCT 
CATTTGGAGA AAGTAATGAA TACGGAATTA ATCGCACAAT AA

Protein sequence

MRKKVVIIGG GITGLTTMYH LQKDIRDKNL PIDTLLIEAS GKLGGKIQTV RKDGFTIERG 
PDSFLARKES AARLVKELGL GDELVNNQAG QSFILVNNRL HKMPSGSMMG IPTQITPFLF 
SGLFSPIGKL RAGFDLLMPR SKPVSDQSLG HFFRHRLGNE VVENLIEPLL SGIYAGDIDE 
MSLMSTFPQM YQIEQKHRSI SLGMRTLAPK AEKAEPKKGI FQTVKTGLES IVESLELKMH 
EGTIIKGTRI EKVAKQGDGY AITLSNGKEI EADAVVVASS HKVLPSMFAQ YKQFRFFRNI 
PSTSVANVAM AFPKSAIQRD IDGTGFVVSR NSDYTITACT WTHKKWPHTT PEGKTLLRCY 
VGRPGDEAVV EQTEEELVQL VLEDLRKTMD ITEDPEFTVV SRWKEAMPQY TVGHNERMKK 
LTTFMEKELP GIYLAGSSYA GSGLPDCIDQ GEKAAKRVLS HLEKVMNTEL IAQ