Gene BAS0221 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS0221
Symbol
ID	2851667
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	222967
End bp	223947
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	38%
IMG OID	637503426
Product	oligopeptide ABC transporter ATP-binding protein
Protein accession	YP_026506
Protein GI	49183254
COG category	[E] Amino acid transport and metabolism [P] Inorganic ion transport and metabolism
COG ID	[COG0444] ABC-type dipeptide/oligopeptide/nickel transport system, ATPase component
TIGRFAM ID	[TIGR01727] oligopeptide/dipeptide ABC transporter, ATP-binding protein, C-terminal domain

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTAAAG CGGTAGTAGA GCTGAAAGAT TTACAAACAC ACTTTCAGAC AGAAGAAGGA 
ACAGTAAAAG CTGTGAATCA TGTTAGTTTT TCTGTTCGAG AAGGTGAAAC TGTTTGTGTT 
GTAGGTGAAT CTGGTTGCGG GAAAAGTGTA ACAGCTTTAT CCATTATGGG ACTTATTGCT 
GAATCAGGTA GTGTAGTAGG CGGAGACATT TTATATGAAG GAAAAAGTCT TTTAGGGATG 
AAAGAGAAAG AGCTTCGTAG TTTACGAGGG AATGATATTG CGATGATTTT CCAAGAACCG 
ATGACATCGC TAAATCCAGT TTTTACTGTA GGGGAACAAA TTGTAGAGAC GTTAAGGGAG 
CATGAACTGC TTAGTAAAAA TGAAGCATAT AAGAAGGCAA TTGAGTTAAT TCGTAAAGTC 
GGTATAGCCC GCGCGGATGA AATCGTCCAT TCTTATCCAC ACGAACTGAG CGGTGGTATG 
TTACAACGTA TTATGATTGC TGTTGCACTT AGTTGTAATC CTAAGTTATT AATTGCTGAT 
GAACCGACAA CGGCTCTTGA TGTTACGATT CAAGCTCAAA TATTAGATTT ATTAAGGCAA 
ATAAAAAGGG AATTTAAAAC ATCCATTTTA TTAATTACAC ATGACTTAGG TGTCGTAGCA 
GAAATGGCTG ATTATGTTGT CGTTATGTAT GGCGGGAAAG TTATTGAAGA AGCACCGGTA 
CTAGAGATAT TTCAAAATCC GAAACACCCA TATACGAAAG GATTGTTGAA ATCAAAACCA 
GTGATGGGAA AACGAATAGA TAAACTATAT TCTATTCCAG GGCAAGTTCC TAATTTAGTT 
GGTTTGGATG AGTTTTGCTA CTTTAGCGGT CGTTGTGAGC ATTGTATGGA AATATGTAAA 
GAAGAAGCAC CAAATTTGAA TGTACATGAT GAGAATCATA AAGTAGCTTG CTGGTTATAT 
GAGGAGCGTG CGGGACAATG A

Protein sequence

MSKAVVELKD LQTHFQTEEG TVKAVNHVSF SVREGETVCV VGESGCGKSV TALSIMGLIA 
ESGSVVGGDI LYEGKSLLGM KEKELRSLRG NDIAMIFQEP MTSLNPVFTV GEQIVETLRE 
HELLSKNEAY KKAIELIRKV GIARADEIVH SYPHELSGGM LQRIMIAVAL SCNPKLLIAD 
EPTTALDVTI QAQILDLLRQ IKREFKTSIL LITHDLGVVA EMADYVVVMY GGKVIEEAPV 
LEIFQNPKHP YTKGLLKSKP VMGKRIDKLY SIPGQVPNLV GLDEFCYFSG RCEHCMEICK 
EEAPNLNVHD ENHKVACWLY EERAGQ