Gene Acel_1377 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1377
Symbol
ID	4485865
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	1535584
End bp	1536624
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	70%
IMG OID	639730161
Product	ROK family protein
Protein accession	YP_873135
Protein GI	117928584
COG category	[G] Carbohydrate transport and metabolism [K] Transcription
COG ID	[COG1940] Transcriptional regulator/sugar kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.407084
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.525187
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCCCC CACCGCAGCC AGCCGGCGAC TGGGTCGTCG TCGGCCTCGA CAACGGGGGC 
ACGGCCAACA ACGCAACTGT CCTCACGGGC GACGGCCGGT TCCTGGTGGA CGCCCTGGTG 
GAGAGTCCAA GCCGGGTGAC GGAGGGACCG ACGGCTGCGC TGCAGGCCCT GCTGGCGGCG 
TACCACGACA TTCTCGCCCG GACCGGCTGT TCGGAGGGGC AGGTCCGCGC AGTCGGCCTG 
GACAGCCCAG GCCCGGCAAG CGCCGACGGC GTGATTTCCC GGGTCGGGGC AACGAATTTC 
GGTCATCCGG ATTGGCGGGG ATTCGATTTT CGCGGCGAAC TCGAGAAGCT TCTCGGCGTC 
CCAGTGATTT ATCACAATGA CGGCAATGCC GCGGCGCTAT ACGCGCACCG CATGTTCTTC 
GGTGACGAGG CGCCGATCCG ATCGTCGGTC TCGGCCATCG TCGGCACCGG TCTGGGCGGC 
GGGATCATCG TCTCCGGGGC GGTGATCCGT GGAGCCGCCG GGATGGCCGG CGAACTCGGC 
CACGTCCACA TTCCGCTCGA CGGCATTCTG GCCGACGGCC AACCGGTACC CCGGTGCAAC 
TGCGGCTTTC GTGCGGACGC CGAGAGCATC GCCAGCCTCA GCGCCATCGA GCGGAACCTG 
CTGCCGTTCT GGCTCTCCCG GTACCCCGGC CACGCCCTGG CCGCCCTGCC GATCCGACAG 
GCGGCCCGTG AAGTCCGCCG CCTTGCCGAG CAGGGGGATC CGTTGGCGCT CGATATCTTC 
CGGCAGCAGG CGGCGGCGAT CGGCCGGCTC TTCACCATCC TGGCGAACGT CATCGACCCG 
GACGCCTACT TTATCGGTGG CGGCGTCGTC CAGGCCACCG AACAGTTCCG TGAATGGTTC 
CTCGCCCAGG TCAGGGCGGA GACCCGGCTC CGTCCCGAGC AGCAGGAGAC GGCCGCCTTC 
GCGCTCACCC CCGACCTGGA CATGGCAGGG GCCCGCGGGG TCGCCATGGC GGCGCGGGAC 
GCCGTCCTCG CCGGCCGCTG A

Protein sequence

MTPPPQPAGD WVVVGLDNGG TANNATVLTG DGRFLVDALV ESPSRVTEGP TAALQALLAA 
YHDILARTGC SEGQVRAVGL DSPGPASADG VISRVGATNF GHPDWRGFDF RGELEKLLGV 
PVIYHNDGNA AALYAHRMFF GDEAPIRSSV SAIVGTGLGG GIIVSGAVIR GAAGMAGELG 
HVHIPLDGIL ADGQPVPRCN CGFRADAESI ASLSAIERNL LPFWLSRYPG HALAALPIRQ 
AAREVRRLAE QGDPLALDIF RQQAAAIGRL FTILANVIDP DAYFIGGGVV QATEQFREWF 
LAQVRAETRL RPEQQETAAF ALTPDLDMAG ARGVAMAARD AVLAGR