Gene Acel_0354 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0354
Symbol
ID	4485893
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	365722
End bp	366795
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	61%
IMG OID	639729121
Product	putative simple sugar transport system substrate-binding protein
Protein accession	YP_872114
Protein GI	117927563
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.0988695
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGAAGCA CGACACGCAT CCTCACCTGG CGAAGACTCG CATTGCTCGC GATCGTCCCG 
CTGGTCGCGG CGGGCTGCAG CAGCAAGAGT CAGACGCCGC AGAAGCAGAG CACGAGTGCG 
CCGGCAACGG AAACGGCCGC CGGTGCCGTG CCGACGGGCG CCCAGTTCTG CAAGGGCATG 
AAGATCGTCT TCTTCCCGGG CGGAACTCCC GGCGGACCGT TTGAGACCGT CGTCTACAAC 
GGCGCGAAGG CCGCCGCAGC CGCACTGGGT CCGTCGGTCA CGTATGAATG GTCCGATTGG 
GATCCGAACA AGATGATTAC CCAATTCAAG CAGGCAATGG CCACGCATCC CGACGGTATC 
GCCATCATGG GACACCCCGG TGATGCGGCC TTCGACCCGC TCATCGACCA AGCCGAGGCG 
CAGGGCATCA CCGTGACGGT GATGAACACC GAATTGCCGC AGGCCGAAGC GAAATACCAG 
TCACAGGGCA TGGGCTATGT CGGTGCGGTG CTCTACCAGG CAGGCGCCTC GCTCGCTTCG 
GAGGCCATCA AGCGCGGGAA TCTAAAGGCG GGCGACCGGG TCTTCGTCTG GGGTCTCCTG 
TCGCAACCCG GCCGCGGGGA GCGGACCAAG GGAATTGTCG ACACGTTGAA GAAAGCCGGC 
CTCACCGTTG ACTACCTGGA AATCAACGAT GCGACCAACA AGGACCCGGC AGCCGGTGTC 
TCCATCTTCA CCGGTTACGT GTCCAAGCAC CCCGACGTCA AAGCCATTTT CATTGACCAC 
GGCAACCTGA CCGCCACAAT CCCGACCTAC ATGAAGGCGG CCAACCTCAA GCCCGGATCG 
GTCTTCGCCG CGGGCTTCGA CATGTCGCCG GCGACCGTCA AGGGCATCCA GGACGGATAC 
ATCAGCCTCG TCATTGATCA ACAGGAATGG CTGCAGGGAT ACTTCGGAAT TCTGCAGTTG 
TGTCTCTCCC ACGTGTACGG CTTCAGCGGA TTGCGCATTG ACACCGGCGC AGGCTTTGAT 
GACAAGTCGA ACATCGATAA ACTCGCTCCA CTGGTCGACA AGCAGATCCG CTGA

Protein sequence

MGSTTRILTW RRLALLAIVP LVAAGCSSKS QTPQKQSTSA PATETAAGAV PTGAQFCKGM 
KIVFFPGGTP GGPFETVVYN GAKAAAAALG PSVTYEWSDW DPNKMITQFK QAMATHPDGI 
AIMGHPGDAA FDPLIDQAEA QGITVTVMNT ELPQAEAKYQ SQGMGYVGAV LYQAGASLAS 
EAIKRGNLKA GDRVFVWGLL SQPGRGERTK GIVDTLKKAG LTVDYLEIND ATNKDPAAGV 
SIFTGYVSKH PDVKAIFIDH GNLTATIPTY MKAANLKPGS VFAAGFDMSP ATVKGIQDGY 
ISLVIDQQEW LQGYFGILQL CLSHVYGFSG LRIDTGAGFD DKSNIDKLAP LVDKQIR