Gene BAS2291 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS2291
Symbol
ID	2848326
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	2291082
End bp	2292368
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	36%
IMG OID	637505539
Product	PTS system cellobiose-specific transporter subunit IIC
Protein accession	YP_028552
Protein GI	49185300
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1455] Phosphotransferase system cellobiose-specific component IIC
TIGRFAM ID	[TIGR00359] phosphotransferase system, cellobiose specific, IIC component [TIGR00410] PTS system, lactose/cellobiose family IIC component

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.523527
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATAAGT TTGTCACGTT TCTTGATAAA AACTTATCTG GACCGATGGC AAGACTTTCT 
GAACAGAGAC ATTTACAAGC AATCCGTGAT GGAGTTATTT CAGCATTACC ATTTATCATC 
GTAGGAAGTT TCTTTTTAAT CGTAGCATTT CCACCATTAC CGAAAGATAG TTTCATATCC 
GTTTGGGCAT TAAAGAATCA AACAAGTATA TTAATACCAT ATCGCCTAAC GATGTTTATT 
ATGTCTTTAT ATATAGCATT TGGAATAGGA TATAATTTAG CGAAGAGTTA TAAGTTAGAT 
GCTTTATCGG GAGCTCAGCT TGCAGTATGT TCACTGCTAT TAACATTAAC TCCTGAATTA 
ATTGATAAAA AAGGATTTAT GCTTCCGATG ACAAATCTCG GAGGGCATGG ATTATTCGTG 
ACTATGATTG TTTCTATTTT ATCAGTTGAG ATTTTAAGAT TTTGTAAGAA GAACAACGTA 
ACGATCAAAA TGCCAGAACA AGTACCACCT TCAGTATCGC GTTCGTTTGA AGCACTTATA 
CCTGCTGCAT TCGTTATTAT TATTATTATG AGCCTTATTA CAGTTGTTTT TAAAGTTGAT 
GTACATTACG TAGTGGATAA ATTAGCCGCA CCGTTAGTCA AAGCTGGAGA TAGTTACTTT 
GGCGTCATAA TACCTGTATT TTTAATTACA TTTTTCTGGT CCTTCGGAAT ACATGGTGTA 
TCGGTTGTAG GTACTGTAGC AAGACCGCTT TGGGATGTAT ATTTAGGGAA AAATGGTGAA 
GCTGTAGCAA GTGGTGCGAG TCAATTTCCA TTCATTGCAC CAGAACCGTT TTATCAATGG 
TTTATTTGGA TTGGTGGTTC GGGTGCAACG TTAGGGCTTG TGTTAGCAAT GATCGTATTT 
GGTCGATCAA AATATTCGAA GGCATTATCG AGAACTTGTA TTGTGCCTGG GATTTTTAAT 
ATTAATGAAC CAGTTATATT CGGCTTGCCG ATTGTATTGA ATCCAATTTT AATTATTCCT 
TTCGTCATTA CGCCGCTAGT AACAGCGACT ATCGCTTATG CTGCAACTGC AATGGGATTT 
GTAACGCCAA CTCATATTAT GCCGCCATGG ACATTACCAG CCCCAATTGG TGCATATTTA 
GCTACAGGAG GAGATTGGCG TGCAATTGTA TTAGTCTTAA TAAATATAGC AATATCATTC 
CTTATTTATT TACCATTCTT TAAAATGTAC GACAAAAATA TGCTTGAAAT TGAGAAGAAT 
GGTGAAGGAG AATCTGTTAA TCCATAA

Protein sequence

MNKFVTFLDK NLSGPMARLS EQRHLQAIRD GVISALPFII VGSFFLIVAF PPLPKDSFIS 
VWALKNQTSI LIPYRLTMFI MSLYIAFGIG YNLAKSYKLD ALSGAQLAVC SLLLTLTPEL 
IDKKGFMLPM TNLGGHGLFV TMIVSILSVE ILRFCKKNNV TIKMPEQVPP SVSRSFEALI 
PAAFVIIIIM SLITVVFKVD VHYVVDKLAA PLVKAGDSYF GVIIPVFLIT FFWSFGIHGV 
SVVGTVARPL WDVYLGKNGE AVASGASQFP FIAPEPFYQW FIWIGGSGAT LGLVLAMIVF 
GRSKYSKALS RTCIVPGIFN INEPVIFGLP IVLNPILIIP FVITPLVTAT IAYAATAMGF 
VTPTHIMPPW TLPAPIGAYL ATGGDWRAIV LVLINIAISF LIYLPFFKMY DKNMLEIEKN 
GEGESVNP