Gene BAS1899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1899
Symbol
ID	2851913
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1918966
End bp	1920072
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	31%
IMG OID	637505150
Product	spore coat protein H
Protein accession	YP_028163
Protein GI	49184911
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG5337] Spore coat assembly protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAGAGAA CTGAGAAGGG ATGTGAAAAT ATGCTACCTT CATATGATTT TTTTATTCAT 
CCAATGTACG TAGTGGAATT GAAAAAAGAC ATTTGGTCAG ACAGTCCAGT ACCAGCAAAA 
TTAACTTATG GAAAAAAGAA GTATGATATT GATATCGTAT ATCGGGGTGC TCATATTCGT 
GAATTTGAGA AAAAGTCTTA TCATGTTATG TTTTATAAGC CAAAAAAATT TCAAGGTGCG 
AAAGAGTTTC ATTTAAATTC TGAGTTTATG GATCCGTCTC TCATACGAAA TAAATTATCT 
TTAGATTTTT TTCATGATAT TGGTGTACAT TCACCAAAAT CACAACATGT ATTTATAAAA 
ATTAATGGTC AAATTCAAGG AGTATATTTA CAGTTAGAAT CAGTTGATGA AAACTTTTTG 
AAAAATAGAG GATTACCTAG TGGTTCTATT TATTATGCGA TAGATGATGA TGCGAATTTC 
TCTTTAATGA GTGAAAGAGA TAAAGATGTT AAGACTGAGC TTTTTGCGGG TTATGAATTT 
AAATATTCGA ATGAACATAG TGAAGAACAA TTGAGTGAAT TTGTATTTCA AGCGAACGCT 
TTGTCGAGGG AAGCGTATGA AAAAGAAATT GGGAAGTTTC TAAATGTTGA TAAGTATTTA 
CGATGGTTAG CAGGCGTTAT TTTTACACAA AACTTTGATG GTTTTGTTCA TAACTATGCA 
TTATACCATA ACGATGAAAC AAATTTATTT GAAGTGATAC CGTGGGATTA TGATGCGACT 
TGGGGGCGTG ATGTACAAGG GAGACCGCTT AATCATGAAT ATATTCGTAT TCAAGGTTAT 
AACACGTTAA GTGCAAGATT GTTAGATATA CCTGTATTTA GAAAACAATA CCGAAGTATT 
TTGGAAGAAA TATTAGAAGA ACAATTTACG GTTTCATTTA TGATGCCGAA AGTAGAAAGT 
TTATGTGAAG CAATACGTCC TTATTTACTA CAAGATCCAT ATATGAAAGA AAAATTAGAA 
ACCTTTGATC AAGAACCTGG TGTGATTGAG GAATATATAA ATAAAAGAAG AAAGTATATA 
CAAGATCATT TACATGAATT GGATTAA

Protein sequence

MKRTEKGCEN MLPSYDFFIH PMYVVELKKD IWSDSPVPAK LTYGKKKYDI DIVYRGAHIR 
EFEKKSYHVM FYKPKKFQGA KEFHLNSEFM DPSLIRNKLS LDFFHDIGVH SPKSQHVFIK 
INGQIQGVYL QLESVDENFL KNRGLPSGSI YYAIDDDANF SLMSERDKDV KTELFAGYEF 
KYSNEHSEEQ LSEFVFQANA LSREAYEKEI GKFLNVDKYL RWLAGVIFTQ NFDGFVHNYA 
LYHNDETNLF EVIPWDYDAT WGRDVQGRPL NHEYIRIQGY NTLSARLLDI PVFRKQYRSI 
LEEILEEQFT VSFMMPKVES LCEAIRPYLL QDPYMKEKLE TFDQEPGVIE EYINKRRKYI 
QDHLHELD