Gene GBAA_5443 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GBAA_5443
Symbol	celB-2
ID	2819175
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. 'Ames Ancestor'
Kingdom	Bacteria
Replicon accession	NC_007530
Strand	-
Start bp	4932110
End bp	4933417
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	38%
IMG OID	637792111
Product	PTS system cellobiose-specific transporter subunit IIC
Protein accession	YP_022106
Protein GI	47530757
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1455] Phosphotransferase system cellobiose-specific component IIC
TIGRFAM ID	[TIGR00359] phosphotransferase system, cellobiose specific, IIC component [TIGR00410] PTS system, lactose/cellobiose family IIC component

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAAT TTATTGCATT TATGGAGAAA TATATTGTTC CTGTCGCTGG TAAAATCGGG 
TCGCAACGTC ATTTAGCTGC GATCCGTGAC GGATTTATCG CAGTTATGCC ACTTATTTTA 
GTTGGTGCAC TGGCATCACT AATTAATGGT TTTCCATCTG AGGCTTTCCA AGATTTCATG 
AAAGGTTTGT TTGGTGAAAC GTGGAAACAA GTTGGCGGTG GAATGTGGAC TGGTTCTTTC 
GCGATTCTAG CACTAATCAT AGCATTTACA ACAAGTTATA ACTTAGCAAA ATCTTACGGC 
GTTGATGGTT TGTCAGCAGG TATTATTTCA TTTGGTGCGT TAATTATTCT TACGCCAACA 
ACACCGAAAG AAGGCGGATT GAACTTAGCT TGGACAGGTG CACAAGGGTT ATTCGTAGCA 
ATTATTGTAG CACTCCTTGT TACTGAAGTA TTCCGTTTCT TCGTACAAAG AAACATTACT 
TTTAAAATGC CTGATGGAGT ACCACCAGCA GTTTTAAGAT CTTTCGCAGC TATAGTTCCA 
GCATTTGTTA TTTTAACAGT AGTTGCAGGT ATTCAATTAG CAGTGAAATT AGCCGGTACA 
AGTGTTCATG AATTTATCTT TAATACGATT CAATCGCCAC TGCAAAGTTT AGCAGGGACA 
TTACCAAGTG CAATTGTTAT TGTACTCCTT GTTCATCTTC TTTGGTTCTT CGGTTTACAT 
GGTCCAAATA TCGTTGGTGG TATTATTGAG CCGTTATACT TACCAGCATT AGAGAAAAAT 
ATGAAGTTAT TCCAAGGTGG CACTTCTGCA TTTGATGTTC CAAACATTGT TACAAAACCA 
TTCTTTGATA CTTTCGTATA TCTTGGTGGT TCTGGTGCAA CATTAGCGTT CTTAGTAGTG 
GTATTACTTG TAGCAAAAAG TGCACAATTA CGCGGTGTAT CTCGCTTATC AATTGGTCCA 
GGTGCGTTCA ACATTAACGA ACCAGTAATC TTTGGTACAC CAATTATTTT AAATCCAGTT 
TTATTCTTGC CGTTTATCAT AACACCAATT GTATTGGTAA TTACTTCTTA TACAGCTATA 
TCTATTGGCT GGGTACCAAA AACAGTTGCA ATGATTCCAT GGGCAACACC ACCAATTATT 
AGTGGTTATC TTGTAACAGG TGGACATCTT TCAGGTGCAA TTCTACAGTT ATTCAACTTT 
GTAATTGCAA TGGTAATCTA TTATCCATTC GTTGTGTTAT GTGACCGTTC AGTTGTTCGT 
ACTGAAAAAG CAGCAGCACA AGGAAATAAC AACTCTGTAC CTATGTAA

Protein sequence

MQKFIAFMEK YIVPVAGKIG SQRHLAAIRD GFIAVMPLIL VGALASLING FPSEAFQDFM 
KGLFGETWKQ VGGGMWTGSF AILALIIAFT TSYNLAKSYG VDGLSAGIIS FGALIILTPT 
TPKEGGLNLA WTGAQGLFVA IIVALLVTEV FRFFVQRNIT FKMPDGVPPA VLRSFAAIVP 
AFVILTVVAG IQLAVKLAGT SVHEFIFNTI QSPLQSLAGT LPSAIVIVLL VHLLWFFGLH 
GPNIVGGIIE PLYLPALEKN MKLFQGGTSA FDVPNIVTKP FFDTFVYLGG SGATLAFLVV 
VLLVAKSAQL RGVSRLSIGP GAFNINEPVI FGTPIILNPV LFLPFIITPI VLVITSYTAI 
SIGWVPKTVA MIPWATPPII SGYLVTGGHL SGAILQLFNF VIAMVIYYPF VVLCDRSVVR 
TEKAAAQGNN NSVPM