Gene GBAA_0501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GBAA_0501
Symbol
ID	2817230
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. 'Ames Ancestor'
Kingdom	Bacteria
Replicon accession	NC_007530
Strand	+
Start bp	494216
End bp	495709
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	38%
IMG OID	637787469
Product	PTS system N-acetylglucosamine-specific transporter subunit IIBC
Protein accession	YP_017119
Protein GI	47525770
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1263] Phosphotransferase system IIC components, glucose/maltose/N-acetylglucosamine-specific [COG1264] Phosphotransferase system IIB components
TIGRFAM ID	[TIGR00826] PTS system, glucose-like IIB component [TIGR01998] PTS system, N-acetylglucosamine-specific IIBC component

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0118295
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTGCAGT TTCTACAACG TATTGGTAAA GCGTTAATGC TTCCAATCGC CGTACTACCA 
GCAGCAGGAT TATTGCTTCG TTTAGGACAA GAAGACGTAT TTAACATTCC TGTTATGGCA 
CAGGCCGGTG CAGCAATTTT TGATAATTTA GCACTTATTT TTGCAATTGG TGTTGCAATC 
GGTTTGTCTG TTGACGGTAG TGGAGCAGCT GGACTTGCCG GAGCAATCGG ATATCTTGTT 
TTACAAAATA CAACGAATGC TCTAAGTAAG ACGTATTCAG CAGCAGAGTT AAATGATAAA 
TTAAAAAGTG TTCAAGATTT AGTCGGTTCA GTAGATCCAA CTAAATTAGC AGATACAATG 
ACAAAGGTTT CAAAAGCAGC GGCGTTAACG CCAAAAATAA ATATGGCCAT ACTCGGTGGT 
ATTATTGCAG GGGTTGTTGC GGGATTACTA TACAACAAAT TCCATAAGAT TAAACTACCA 
GAATGGTTAG GATTCTTTGC AGGAAAACGC TTCGTACCAA TCATTACTTC AATCGTAATG 
TTACTTTTAG GATTGGTATT CGGTCAAATT TGGCCAACAA TTCAAAGTGG TATTGATGCA 
GTGGCACATG GTATCGTGAA CTTAGGTTCA ATTGGTGCTG GTTTATTTGG ATTATTAAAC 
CGTTTATTAA TTCCAATTGG TTTACACCAC GTAATGAACA CATACTTCTG GTTCGTACTT 
GGTGACTTTA CAAATGCAGC TGGCGATATT GTTCATGGTG ATATTGCACG TTTCTTTGCA 
AAAGATCCAT CAGCAGGTAT GTTTATGACT GGTTTCTTCC CAGTTATGAT GTTCGGTTTA 
CCAGCAGCAT GTTTCGCAAT GATTGCAGCT GCTAAACCAG AAAAACGTAA AATGGTTACA 
GGTATGTTAG GTGGTCTAGC ATTAACTTCA TTCTTAACTG GTATTACAGA GCCAATTGAA 
TTCTCATTCA TGTTCTTATC GCCAGTACTA TATGGAATTC ATGCTGTATT AACAGGTCTA 
TCTCTATTCA TTACAACAAC ACTTGGCATT CATGATGGTT TCTCATTTAG TGCCGGGGCA 
ATCGATTACG TCTTAAACTT CGGTATTGCA ACAAAACCAT TGTTACTAGC AGGAATCGGT 
TTAATTTACG CAGCAATTTA CTTTGTAGTA TTCTACTTCT TAATTAAGAA GTTCGACCTA 
AAAACTCCTG GTCGTGAAGA TGAAGAGGAA ATGGCTGAAG GCGAAGAAGC TCCAGTTGCA 
GGTTCAATTG GTGAAACTTA CGTAGCAGCT TTAGGTGGAA AAGAAAACTT AACAGTTATT 
GATAACTGTG CAACACGTCT ACGCTTACAA GTGAAAGATG CTGGTCAAGT AAACGAAGCA 
GCATTAAAAC GTGCTGGTGC AAAAGGTGTT ATGAAATTAA GTAACACGAG TGTCCAAGTT 
ATCGTAGGTA CAAATGTTGA ATCTGTTGCC GATGATATGA AAAAACACGT ATAA

Protein sequence

MLQFLQRIGK ALMLPIAVLP AAGLLLRLGQ EDVFNIPVMA QAGAAIFDNL ALIFAIGVAI 
GLSVDGSGAA GLAGAIGYLV LQNTTNALSK TYSAAELNDK LKSVQDLVGS VDPTKLADTM 
TKVSKAAALT PKINMAILGG IIAGVVAGLL YNKFHKIKLP EWLGFFAGKR FVPIITSIVM 
LLLGLVFGQI WPTIQSGIDA VAHGIVNLGS IGAGLFGLLN RLLIPIGLHH VMNTYFWFVL 
GDFTNAAGDI VHGDIARFFA KDPSAGMFMT GFFPVMMFGL PAACFAMIAA AKPEKRKMVT 
GMLGGLALTS FLTGITEPIE FSFMFLSPVL YGIHAVLTGL SLFITTTLGI HDGFSFSAGA 
IDYVLNFGIA TKPLLLAGIG LIYAAIYFVV FYFLIKKFDL KTPGREDEEE MAEGEEAPVA 
GSIGETYVAA LGGKENLTVI DNCATRLRLQ VKDAGQVNEA ALKRAGAKGV MKLSNTSVQV 
IVGTNVESVA DDMKKHV