Gene Acel_1051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1051
Symbol
ID	4484833
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	1157936
End bp	1159051
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	63%
IMG OID	639729826
Product	ABC-type sugar transport system periplasmic component-like
Protein accession	YP_872810
Protein GI	117928259
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.28211
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.0668071
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTTCAC AGCCCACCCG CCGACGAGGG ACCCCCACCC TCCTCACTGC TGCCATGGCC 
CTGGCTGCCG TCGCTCTCGC CGCGTGCAGC TCGGGAACGA GCGGCACAGC GCGCACGAGT 
ACGACACCGA ACGCGTCCGC TTCGTCAAGC TCTACCGCCG GCACCCCGGC ATCGGCGTCA 
GCCGCCGGCA GCGCCAACAC GGGCAAAACA CTGCAAATCG CATATCTATC CTTTGCGGTC 
GCCAACAGCT ACGACGCCCC GATGCTCGCC GCGGCGCAGG CGGTGGCCTC AGGGGAGAAT 
GCGAAAGTCA CCGTATTCGA CGCCAACAAC AATCCGCAGA CCCAGTTCGC CCAGTTCCAG 
AATGCCATCA CGGCCGGAAA GTACGACGGC ATTCTCATCC AACCGATTCT TGCGACAAAT 
CTCGTCGATC TGGTCAAGCA AGCCGTCGCC AAAGGCATCA AAGTGGTTGA CATCGACCAG 
ATCCTCGGAC CCGACTTCCA TACGTACGAT CCGCAGGTGC CTGGGATGTC AGCCGCCGTC 
GTCGACCGCA TCCCTGACAT CGGCCGCCTT CTCGGCGAAC AGGTCGTCGC CGCGTGTCAG 
TCCGTCAACG CCAATCCGTG CAACGTGGGC TATCTCTACG ACATCAAAGC GTCCACGCTT 
GACGGTGTCA TCCACGACGA CTTCATGAAA GTCGTTCAGG GCACGCCCTC CATCAAAGTT 
GTCGCGGAAG GGCAGGACTT CTTCACACCT GCAGGCGGCC TCAAGGCCGT CCAGGACATG 
CTGCAAGCCC ATCCCGACCT GACGCTCATC GTGGGTTCCG ACCAGGGCAT CGAGGGTGCA 
GTGCAGGCGC TGGCGGCGGC AAAGAAGACG GGAAAGGTGC TTCTCGTGGG CTTTGGTGCC 
AGTGCCGCAG GCATCCAGGG CGTCGCCTCC GGCCAGTGGT TCTCGACAGT GGCCCAGGCT 
CCGGCCAGCA CCGGACGGCT TGGAATGCAG GCGCTCATCA AAGCGATCCG CGACGGTCAG 
GACAGCGGCG GGATCAACCC GACGGCCGGA CTGCCCAACA ACGGAATCGT CACCAAGGCG 
ACGGCAAGTG AGTTCACCGC CGAGTGGCCG GGGTGA

Protein sequence

MSSQPTRRRG TPTLLTAAMA LAAVALAACS SGTSGTARTS TTPNASASSS STAGTPASAS 
AAGSANTGKT LQIAYLSFAV ANSYDAPMLA AAQAVASGEN AKVTVFDANN NPQTQFAQFQ 
NAITAGKYDG ILIQPILATN LVDLVKQAVA KGIKVVDIDQ ILGPDFHTYD PQVPGMSAAV 
VDRIPDIGRL LGEQVVAACQ SVNANPCNVG YLYDIKASTL DGVIHDDFMK VVQGTPSIKV 
VAEGQDFFTP AGGLKAVQDM LQAHPDLTLI VGSDQGIEGA VQALAAAKKT GKVLLVGFGA 
SAAGIQGVAS GQWFSTVAQA PASTGRLGMQ ALIKAIRDGQ DSGGINPTAG LPNNGIVTKA 
TASEFTAEWP G