Gene BAS1921 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1921
Symbol
ID	2852339
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1937019
End bp	1938173
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	36%
IMG OID	637505171
Product	stage II sporulation protein P
Protein accession	YP_028184
Protein GI	49184932
COG category
COG ID
TIGRFAM ID	[TIGR02867] stage II sporulation protein P

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0118573
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCGAG GCTTTTTTTA TGTGAAGTTC ACGAGTGTTC GTAAGTTAGT ATTATTTATT 
ATTGCTACAG TACTAGCGAC TTTTTTTCTT ATTAGTATGA TGGTAACCTC TATGAAAGAG 
ACAAAGTCAA CGTATTTATA TAATTGGTTA AATGAGTTAT CAATGAATGG TTACATGTAC 
GTTCTTGGAA AAGAGAATCA TTATTTTACA CAGGAATATC GAAATTTAAA TCAAGATTTT 
TCAATATCTT CGTTTCTCTT TTCTATGGCT ACGAATATTC GTTTTAACGA TGTACGCAGT 
TTTGTCGGCA AAGAGCTACC GGGTTTCGGT AAGTACGATA CAGAAATTGT TATTGCGGGT 
GAAGGAACAA ATTATTCTAA CTTGCCTATA GAGTCGAGCG TTCCACTTGA AGAAGTAGTA 
AAAGAACGGA CTGGAGAAGG TGGACAGGCT CCAAAGCCGG ATACGAATAA AGAGAAAAAG 
CAACCAGCTC AAACGACAGG AAAACGACAA GTTGCATTTA TTTATCATTC GCATAGTTGG 
GAATCTTATT TGCCGTTATT GAATTTAACA AATGATCCAA ATCCGAATAA AGCAACAAGT 
TCCGTCACGA ATATTTCAAT AGTCGGTGAC CGATTTCGTG AACAATTAGC AAATGAAGGG 
ATCGGAGCAA CTAACGACAA GACTGATGTT GGGCAAAAGT TGATTAGTAA AGGATTAAAT 
AGCAATAGTT CTTATAAAAT GTCACGAGAA ATTGTACAAG AAGCAATGAC TAGCAATAAG 
GAATTGCAGT ATTTTTTTGA TTTACATCGT GATAGTGCTC GGAAAAATGT AACGACAAAA 
GCAATTGGAG ATAAATCATA TGCAAAGCTT GCTTTCGTAA TAGGGAAAGG TAATAAAAAT 
TATGAAAAGA ATTTACAATT AGCAACGGCT TTACATGAGA CAATTAATAA GAAGTATCCA 
GGAGTTAGCC GCGGTGTCAT TCAAAAAGGG TTCCAAACAG GCAATGGAGT CTATAATCAA 
GATCTGTCAG GGCAAGCAAT ATTAATTGAA GTTGGTGGCG TAGATAATAC AGAGGAAGAA 
CTAAATCGAT CGATTGATGT ACTTGCTAAA GCGTTTGGGG AATATTTCTG GCAGGCAGAA 
AAGGTGAATG GATAA

Protein sequence

MNRGFFYVKF TSVRKLVLFI IATVLATFFL ISMMVTSMKE TKSTYLYNWL NELSMNGYMY 
VLGKENHYFT QEYRNLNQDF SISSFLFSMA TNIRFNDVRS FVGKELPGFG KYDTEIVIAG 
EGTNYSNLPI ESSVPLEEVV KERTGEGGQA PKPDTNKEKK QPAQTTGKRQ VAFIYHSHSW 
ESYLPLLNLT NDPNPNKATS SVTNISIVGD RFREQLANEG IGATNDKTDV GQKLISKGLN 
SNSSYKMSRE IVQEAMTSNK ELQYFFDLHR DSARKNVTTK AIGDKSYAKL AFVIGKGNKN 
YEKNLQLATA LHETINKKYP GVSRGVIQKG FQTGNGVYNQ DLSGQAILIE VGGVDNTEEE 
LNRSIDVLAK AFGEYFWQAE KVNG