Gene Acel_1360 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1360
Symbol
ID	4486252
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	1514434
End bp	1515870
Gene Length	1437 bp
Protein Length	478 aa
Translation table	11
GC content	60%
IMG OID	639730140
Product	extracellular solute-binding protein
Protein accession	YP_873118
Protein GI	117928567
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.937812
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.278157
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATAGTCG ACACTAACCG CGAGGTGAAC CCGCGCCGCG GTTGGCGACG CGCAGGTCAG 
GTGACGGGTG TTGCCCTGGC ACTGGCTCTC ACGATTGCCG GCTGTAGCAG CGGGACAAAG 
ACTTCGTCGT CACCGTCAAC AAACCCACCG ACGACATCGC CGTCGCAAAG CTCCAGTATC 
ACGGCGTCGG GCGGGCCGCC AACCGAAGAG CAGGCATGCG GCACCAAGCC GGTAACCATG 
CAGGCGTACG TCGAAACGGG CTTCCCCGAC GTTATCGACC TCATGCACCT ATTCACCAAG 
CAGTACCCGA ATGTGACGTG GAACATCCGG CAAGACCAAT TCGCGGTCCT CACCCAGAAT 
GCACCGCTCG TGCTCTCCGG GCCGAATCCG CCGGACATCA TGCGTCTGCC ACAGTTGAGC 
GGCCTTGTCC ACGATCATCT TCTCAAGAAC CTCGACTCCT ACTATGACGC GTACGGATGG 
AGCTCCTTCC CGTCGGCGCA GTTAGCGCAA CTGCGGATGC CGCCGAGCGG TCACCCCAGA 
GGAAGCGGCT CTCTGTGGGC GATGGGCCTC AACTACAGCC TGACCGGTGT CTTCTACAAC 
AAGACGCTGG CCGCGAAGAT CGGAATGACC AGCCCGCCGA AGACGCTCGC CGAATTCGAT 
GCGCTCCTCG CCAAGGCGAA GGCGGCGGGC CTCACGCCGA TCGTCCAGTT CAACGGGGGC 
GCGACGGGTG GTCTGCTCTT TCCGCTGCAG CAACTCATGG CCGACTACGG TCCGACAGAC 
GCCATCAATA ACTGGATCTT CCAGAAGCCC GGTGCCACGA TTGACACGCC GTCCAATCTC 
GAAGCAGTCA AGCACCTCAA GCAATGGATC GACAACGGCT ACTTCAACAG CGACGCCAAC 
GCCACCGACT ACGCGAAGAT GATGAGTAAG TTCGAACACG GCGAAGGTGT GTTCATGTTT 
GACGGTGACT GGGAATCAGG AAATCTCGAC AAACTCATGC CCGGCCAGGT CGGCTTCTTC 
CTCATGCCGC CGCTGAAGGA AGGCGACAAG TACGCAGCCA TGTCCGCACC CCTGACCTAC 
GGAATTGCTG CGACCGCCAA GCATGCGGAT TGCGCTGCCT TCTTCTTCAA CTGGGTCGCG 
ACCAACCCCG ACGCTCGTCA GATGAACGTC GAGGTCGGCG GGTCCAATCC CGGTGGTCCG 
CCGAATCTGC CGATCCCGGT CAAAGAAGGA ACTCTCGTCG CACAGACACT GGCGGCAGGG 
AAGATCATCG CTCAGGAGAA CACGGCTATG GACTTCATTG CCAACGCGAC CGGAGCGATC 
TATGCGCAGG CGTGGACACC CGAGGTTCAG AAACTGTTCG CCGGACAAGA GAGTCCTGAG 
GGTGTATTGC AGAAGGTCCA AGCCGCCTAT GAACAGGAGA TCAAGAGTGG TGCATAG

Protein sequence

MIVDTNREVN PRRGWRRAGQ VTGVALALAL TIAGCSSGTK TSSSPSTNPP TTSPSQSSSI 
TASGGPPTEE QACGTKPVTM QAYVETGFPD VIDLMHLFTK QYPNVTWNIR QDQFAVLTQN 
APLVLSGPNP PDIMRLPQLS GLVHDHLLKN LDSYYDAYGW SSFPSAQLAQ LRMPPSGHPR 
GSGSLWAMGL NYSLTGVFYN KTLAAKIGMT SPPKTLAEFD ALLAKAKAAG LTPIVQFNGG 
ATGGLLFPLQ QLMADYGPTD AINNWIFQKP GATIDTPSNL EAVKHLKQWI DNGYFNSDAN 
ATDYAKMMSK FEHGEGVFMF DGDWESGNLD KLMPGQVGFF LMPPLKEGDK YAAMSAPLTY 
GIAATAKHAD CAAFFFNWVA TNPDARQMNV EVGGSNPGGP PNLPIPVKEG TLVAQTLAAG 
KIIAQENTAM DFIANATGAI YAQAWTPEVQ KLFAGQESPE GVLQKVQAAY EQEIKSGA