Gene BAS0222 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS0222
Symbol
ID	2849626
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	223944
End bp	224954
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	39%
IMG OID	637503427
Product	oligopeptide ABC transporter ATP-binding protein
Protein accession	YP_026507
Protein GI	49183255
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTGAAC CATTATTAGA AGTAAAAAAC TTAAAAACAT ATTTTCCAAT TAAAGGCGGC 
ATATTTAGTA GAACGGTTGG ACATGTAAAA GCAGTTGATG GAGTAAGTTT TACTATTAAG 
AAAGGCGAAG TATTCGGTCT CGTTGGTGAA TCAGGAAGCG GAAAAACGAC GATAGGAAAA 
ACAATTTTAC GTCTCGTCCA AAAAACGGAG GGAGAAGTGA AATTTAAAGG ACACGATGTT 
CATTCTCTAT CAAAAGAGGA ATTAAGAAAA CATCGTCCTA ATATGCAGCT TGTGTTTCAA 
GATCCATTTA GCTCATTAAA TCCGAGAATG AGAATTGGAG AGGCACTTGG TGAGCCGATG 
TTGGCTCACG GATTAGCGAC GAAAGAAAAT GTTCGCGAAA AAGTAACGGA AGTATTAGAG 
TTATGTGGCT TAGCCCCATA TCATATTGAC CGGTACCCTC ATGAATTTTC TGGTGGACAA 
CGTCAACGTA TCGTTATCGC AAGAGCCATG GTATTAAACC CGGAATTTAT TGTAGCTGAT 
GAACCTGTGG CAGCACTAGA CGTATCTATT CAAGCACAGA TCATTAATTT ATTTAGTGAG 
CTACAGGAGA AAAAGGGACT ATCTTATTTG TTCATTTCAC ATGATTTAAG CGTAGTAGAG 
CATTTATGTA CGAAGATTGG AATTATGTAT TTAGGAACAA TTGTGGAAAC AGCACCGCGT 
GATGAGTTAT TTACAAACCC ACTTCATCCG TATACAAAAG CATTGTTATC CGCTGTGCCA 
ATACCAGATC CAACAGTGAA GCGAGAGCGA ATTATACTAG AGGGTGATAT TCCAAGCCCA 
GCGAATCCGC CTTCAGGTTG TTGCTTTCAT ACACGCTGCC CGTTTGCAAC AGATATTTGT 
AAACAAACGG GGAATTCCGT AATGTTGGTG AAGAGCACTT TGTTGCTTGT CATCATGTAT 
AAAAGAGAAG GACTCTTTCA GAAATTGAAA GAGTCCTTTT TTATTTACTA G

Protein sequence

MSEPLLEVKN LKTYFPIKGG IFSRTVGHVK AVDGVSFTIK KGEVFGLVGE SGSGKTTIGK 
TILRLVQKTE GEVKFKGHDV HSLSKEELRK HRPNMQLVFQ DPFSSLNPRM RIGEALGEPM 
LAHGLATKEN VREKVTEVLE LCGLAPYHID RYPHEFSGGQ RQRIVIARAM VLNPEFIVAD 
EPVAALDVSI QAQIINLFSE LQEKKGLSYL FISHDLSVVE HLCTKIGIMY LGTIVETAPR 
DELFTNPLHP YTKALLSAVP IPDPTVKRER IILEGDIPSP ANPPSGCCFH TRCPFATDIC 
KQTGNSVMLV KSTLLLVIMY KREGLFQKLK ESFFIY