Gene BAS1034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1034
Symbol
ID	2849294
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	1089061
End bp	1090179
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	37%
IMG OID	637504292
Product	hypothetical protein
Protein accession	YP_027306
Protein GI	49184054
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0320864
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTTGTA CAGCATTTAA AAAACTATGG GAGAGATACG AAAACGGAAC GCTCACGCAT 
AATGAACAAG AACTGTTAGA AAATCATATT GAGACATGTG AAGAATGCGA GGCTTACTTA 
GATCAATTGC TTTCGAAGAG TGAACCAATA AAGAAAAAAC TACCACCACA AAAACTGAAA 
GTCCCATTTT GGAAAATAAA ATGGAAACAA CGTTGGCAAA CCGTTAGTTT TGTCCTTGCC 
GTTTGTATTG CAATCTATTT TGTTGGTCAT TTTTCATCTT CTCTTTACTT CTATAATATG 
AAAAAGTTAG TCGAAGTAGA TGAGATTCCA GCACTCGCAC TAGAAGCAAC AATTCCAAAT 
AGTCGTTCCG CTGGAGGCAG TACAAAGATT AAACCCTTTT TCCGTACAGA AAATGAAATG 
AATTTAGTTA AAACGGTCGG TAAAAAAGAA ATGCCAATTG GTACAGTAAC AACGCGTAGT 
TTCTTATCAT CTGTAACTGA CACAAATCAA TCATGGGCAA ATAAACCCTA TTCCAAAAAA 
CTTTCCTTTG TTCACCCGAA AATCAAGCAA GATGATCATT TGAAAGAAAT CTCTAAAAAA 
GTTTGGAGTA CACTCGGAAA GATACATGAG GGCACCGTTG CAGAAGTAGC AATATCTTTT 
GACAAACCTT ACACTTTACA AGAGTTAGAA TCCATTCTAT ATAGCGCATT TGAAGCACAA 
GAAATGCCGC CAACTCCTTT ATGGTACGCT TTAGACACAG GGCAAGAAAG AATAGATGAA 
GAAGATTTCA TTCTACATGA CGGAGAGGTT ATCGGATTTT CAGAACATAT AAATCTCCCT 
GATAATGAAG CAAAACGACC GAAGACAAAA GAAGATGAAG TAATCGAAAT GATGCGCATT 
CTTTCTACAC ATAAAGAAAC TGTAAGTAAA ACTACTCGGA CTTCTGAAAA AGAGCTGAAC 
TTAGATAAAC GTTATGAGTA TGTAAAAGAT AACGGTGTGA AAGTATACGG GATCGTCATT 
ACCGGACCGT CGAAAGAGTT ATTAAAATTA CAAAACTCGC CTCACGTACG TTATGCGACT 
CTTGGAGATA TTGAGGTTTG GAATTGGTTT AATCAGTGA

Protein sequence

MGCTAFKKLW ERYENGTLTH NEQELLENHI ETCEECEAYL DQLLSKSEPI KKKLPPQKLK 
VPFWKIKWKQ RWQTVSFVLA VCIAIYFVGH FSSSLYFYNM KKLVEVDEIP ALALEATIPN 
SRSAGGSTKI KPFFRTENEM NLVKTVGKKE MPIGTVTTRS FLSSVTDTNQ SWANKPYSKK 
LSFVHPKIKQ DDHLKEISKK VWSTLGKIHE GTVAEVAISF DKPYTLQELE SILYSAFEAQ 
EMPPTPLWYA LDTGQERIDE EDFILHDGEV IGFSEHINLP DNEAKRPKTK EDEVIEMMRI 
LSTHKETVSK TTRTSEKELN LDKRYEYVKD NGVKVYGIVI TGPSKELLKL QNSPHVRYAT 
LGDIEVWNWF NQ