Gene BAS2043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS2043
Symbol
ID	2848887
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	2053331
End bp	2054758
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	38%
IMG OID	637505293
Product	hypothetical protein
Protein accession	YP_028306
Protein GI	49185054
COG category	[S] Function unknown
COG ID	[COG4842] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.0205742
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGGAGAAG GTTTGGAAAT TAAGGTCAAA CCTGAACAAC TCGAACAAAT TGCCAAAAAC 
ATATCAGAGA TGCAAACACA CAGCCAGAAC ATACAACAAA ATCTCAATCA ATCTATGTTT 
AGTATTCAAA TGCAATGGCA AGGAGCAACG AGTCAGCATT TTTATGGGGA ATATATGAGA 
TCAATGAGAC TCATGGAATC TTACATACGT AACTTACAAG TTACAGAAAA AGAATTACGG 
CGTATCGCTC AAAAGTTTCG TCAAGCTGAT GAAGAATATC AAAAGAAACA AAATGAAAAA 
TTGAAAGAAG CCCATAAAAA AGAAAAGAAA AATGAAAAAT CATGGTGGGA AAAGGGAATA 
GAAGGAGCAG CTGAATTCAT CGGAGTAAAT GATGCAATTC GTGCAGTTAC CGGTAAAGAC 
CCTATTACAG GAAAAGAATT ATCAACAAAA GAAAGACTCA TCGCCGCAGG TTGGACACTC 
CTAAACTTTG TTCCTGTTGG AAAAGTGGCA AGTCTTGCTG GAAAAGGAAT AAAGTATGTC 
GCTTCTAGCT TTGGGAAGAC GATTGTAAAA GCAGGAAAAA AACTAGGCGA AGGCGTAACA 
ATGGTAGCTG GAAAAGCTGG CAAAGCAGCT GTTGATGGCA TAAAAACAGC CAGCCACAAA 
GTAAAAGAGG GTGTAAACTT TGTAGCCTCC ACAGCAAAAG GATTTGCCGA CAAAATCGGA 
AGCCTATGGA ACAAAGGTGC CACAACCGTA AAAACAACCT TCTTGCAAGG GAATGAAAAG 
ATCCAGCACG CAGTAAAAAC ATTAATGGAG TACAAATGGA TCCCAGGCGA GGGAAAAGGC 
TTCGCCATGG CTGGAGTAGG AAATGTCTCA GGAGGAGGAC AGTATTCTCT GAAAGAGGCT 
TATCAGTATG TGGAGAGTAA GGTTGTTAAG GGTACGGGTA AAGTATATCC AACTAGACAA 
ATAGATTCAG TAACAGAAGC GCATATAATT GATAGAGTGA AGGAACTAAG AGGAAATTTA 
TCGAGTAAAT ATAAGAAATC TGGTAATTTT GCTGTTGCCG AAGTGGATGT CAGTGGGATA 
AGCAAATCGG AATTTTATGC TCAAAGTAGC ATAAATGAAC TTAAGGGAAG TCTTGAGCAT 
AAGGTGCCTG ATATTTCTTT ACAACCTGAA AATCCAATGT TTAAGGCTAC AGAAGCAGTT 
GGTAAAAATG GATTTAATTA TTTAAGGAAT ACAGATACTG AGTATAAAAT ACTAAATGAT 
ATAGCTTCTA GGCTTGGGGA TAATACACAA GCTAGTGGTA GAATTAAGTT ATTTACAGAA 
TTGGATACTT GCGACAGTTG TAATAAAGTT ATAGCAGAGT TTGCAGCTAA ATATAAAAAT 
ATTGAATTAG AAGTCGTACA CAACAATGGT AATAGAATTA TTCCTTAA

Protein sequence

MGEGLEIKVK PEQLEQIAKN ISEMQTHSQN IQQNLNQSMF SIQMQWQGAT SQHFYGEYMR 
SMRLMESYIR NLQVTEKELR RIAQKFRQAD EEYQKKQNEK LKEAHKKEKK NEKSWWEKGI 
EGAAEFIGVN DAIRAVTGKD PITGKELSTK ERLIAAGWTL LNFVPVGKVA SLAGKGIKYV 
ASSFGKTIVK AGKKLGEGVT MVAGKAGKAA VDGIKTASHK VKEGVNFVAS TAKGFADKIG 
SLWNKGATTV KTTFLQGNEK IQHAVKTLME YKWIPGEGKG FAMAGVGNVS GGGQYSLKEA 
YQYVESKVVK GTGKVYPTRQ IDSVTEAHII DRVKELRGNL SSKYKKSGNF AVAEVDVSGI 
SKSEFYAQSS INELKGSLEH KVPDISLQPE NPMFKATEAV GKNGFNYLRN TDTEYKILND 
IASRLGDNTQ ASGRIKLFTE LDTCDSCNKV IAEFAAKYKN IELEVVHNNG NRIIP