Gene BAS4251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4251
Symbol
ID	2853149
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4162324
End bp	4163556
Gene Length	1233 bp
Protein Length	410 aa
Translation table	11
GC content	37%
IMG OID	637507487
Product	TolB domain-containing protein
Protein accession	YP_030499
Protein GI	49187247
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGG CTATAGCAAG TGTCATCGCA TTATTATTCA TATTTTTAAG TTCAATTACT 
ATTACGAAAG CAGAAAATAG TGGAGTAAAA ATTGCTTTTA TTCGTCATCA TGACCTCTGG 
ATTAAAGTTG ATGGAAAAGA AAAACAACTT ACAAAAGGAG AATACATAAC AGGACCGAAG 
TGGTCATATG ATGGGGAGTG GCTAGCATAT GTAAAAGGAG AGAAACAAAA TACTCTTGAG 
TTATATCGGC TAAAAGATGG AAAGAAAGTT ACGCCGTTTC ACTCAGAAGT ATCAAATTAT 
CAATGGTCAC CAACAGAAAA TATAATTGCA TTTATATTTA CAGGTACATT ACATACCTTC 
AAGGTAGAAA AAAAGAATGC AGATTTTGAA AATGTATCGG CTGGTGTAGG TGATTATGCA 
TGGTACCCGA ATGGAAAGAA GTTTCTTGTA TCTTCTGAAG CACACTTACT TCCAACTGGA 
TGGACAGGAG CTCAGCTATA TGAAGTACAA AAAGATGCGC ATATGAATCC TCACAAAATG 
AAGCATTTGT ATGCATTGCC AAATGAACAT GATGATTTCC TAGCGTTAGT TGCAAGTGGC 
TTTCAGTGGT CACCAGATCA AAAGTGGATT TCATTTTTAG CAGTACCGAC AGCTTCATGG 
TCAGCTGATA GCAATACGCT TTGCTTAGTT CGTGCAGATG GTAGTCGTTT TGAAAAGGTA 
GATCAAATGT TATTAAACAC ACAATGGTTC AAATGGGCGC CAGCCAACAA TATATTGGCC 
TATATTGAAG GAAGCGGGAG AGTTGCGTTA GAGAATAAAC ATTTAAAAGT AAAAGAATTG 
CCAGCACTTC AGCAGAACAC ATTTACACCG AAAGGATATG TCGATTGGGA TTTTACATGG 
AAGAACGATA ACGTAATTAT CGTTTCACGA GCAAAAGAAG CGGGGATAGA AACTCCACCA 
GAAAAAAGGC CACTACCATC TTTATATGAG ATCGATAGTA CAAGCGACGA ACAACATCGA 
ATCACAAAGC CACCTCATAG GCAAGGAGAT TATCATCCGC TCTTCATGAA TAAGAGTAAT 
CAATTAATAT GGATACGTTC AGACCGTAAG AAAGCGGATG TATGGCTTGC TCATAAGGAT 
GGAAAGCATG AAATGAAGTG GATTGAAAAT ATAGATGTAC CAGAGTGGTA TTACGAGAAA 
TGGAATTGGG AACATGTTAT CTCGGTGAAA TAA

Protein sequence

MKKAIASVIA LLFIFLSSIT ITKAENSGVK IAFIRHHDLW IKVDGKEKQL TKGEYITGPK 
WSYDGEWLAY VKGEKQNTLE LYRLKDGKKV TPFHSEVSNY QWSPTENIIA FIFTGTLHTF 
KVEKKNADFE NVSAGVGDYA WYPNGKKFLV SSEAHLLPTG WTGAQLYEVQ KDAHMNPHKM 
KHLYALPNEH DDFLALVASG FQWSPDQKWI SFLAVPTASW SADSNTLCLV RADGSRFEKV 
DQMLLNTQWF KWAPANNILA YIEGSGRVAL ENKHLKVKEL PALQQNTFTP KGYVDWDFTW 
KNDNVIIVSR AKEAGIETPP EKRPLPSLYE IDSTSDEQHR ITKPPHRQGD YHPLFMNKSN 
QLIWIRSDRK KADVWLAHKD GKHEMKWIEN IDVPEWYYEK WNWEHVISVK