Gene Acel_1798 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_1798
Symbol
ID	4485697
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	2037482
End bp	2038903
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	69%
IMG OID	639730588
Product	LacI family transcription regulator
Protein accession	YP_873556
Protein GI	117929005
COG category	[F] Nucleotide transport and metabolism [K] Transcription
COG ID	[COG1051] ADP-ribose pyrophosphatase [COG1609] Transcriptional regulators
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.651793
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGGAAA TCCCCGCGGT GGGCGGGATT GCCGTTGTCG ACGGCAAGCT CCTGTTGGTG 
CGGCGCGGAC GACCGCCGTC CGCCGGTTCG TGGTCGGTGC CCGGAGGTCG GGTCGAACCG 
GGTGAAGACG ACCAGGCCGC CCTGGTCCGC GAATTCCGGG AGGAGACCGG CCTGCTGGTC 
AGCGTGAAGG AACTGCTCGG GGAGGTGCGC CGGCCGGGGC CGGCCGGCAC GACATACCGG 
ATCCGGGATT ACCGGGTCGA GCTGGTCACC CCTGCCACGG CCGTCGCCGG GGACGACGCC 
GCAGACGTTG CGTGGGTCCC GCTGGACGCC GTCGCCCGGT ATCCACTCAG TCCCGGCTTG 
CTCCGCGCCC TGCAGCGTTG GGGGATCGTG CCGCCGGCGG CGTACCGGCA TCCGAGCCAC 
GGTTCGCCAA CGTTGGAGGA GGTCGCGGCC CACGCCGGGG TGTCGCGCGC GACAGTCTCC 
CGCGTGGTCA ACGATTCACC GCGGGTCTCT CCAGCGGTGC GGGAGGCCGT TCTCCGCTCG 
ATCGAGGAAC TTGGCTATGT ACCGAACCGC GCTGCGCGCA CCCTGGTCAC CCGACGCACG 
GACACGATCG CGTTGGTGAT TTCCGAACCG GAATCGCGGT TGTTCTCCGA CCCGGTGCTG 
GCCGGTTTCG TTCGCGGCAT CGCCGATGTC CTGGCCGGTA CCGACTACAT GTTCGTGCTC 
CTCACCGCGC AACCGGACAC CGAACGGATC GCCCGCTACA TCCGCAACGG CCATGCGGAC 
GGCGTCATCC TGATGTCCTT GCACGGCGAT GACCCGCTCG TCGGCATGCT GGAAGCCCGG 
CGGATGCCGG CGGTTCTCTC CGGCCGGCCG CTCGGCCGGG GACACACGAT CCCGTACGTT 
GACGCCGACA ACGTCGGTGG AGCGCGGCAA GCGACGGAGT ACCTGGTCCG CCAAGGACGT 
CGCACCATCG TCTCCATCAC CGGGCCGATG GAAATGTGCG CGGCGATTGA CCGGCTTGCC 
GGATTCCGCA GCGGACTGCC ACCGGAGCTG CGCCGCCGTT GGCGCAGCCT CATCGCCACC 
GGAGCGTTCA CCGAGGAGAG CGGCGAACGG GCGATGGCTG AGCTGCTGGA ACGCGTTCCT 
GACCTTGACG CCGTTTTCGC CGCCAACGAT TTGATGGCGG CTGGTGCACT CCGGGTGTTG 
AAGGCAGCCG GACGACGCGT GCCGGACGAC GTCGCGCTCG TCGGTTTCGA CGATTCCAGC 
GCCGCCCGCC ACACCGATCC GCAGTTGACG AGCGTCCGAC AGTCTGCCGA GGAATTGGGA 
CAGAACATGG CCAAGCTACT GCTCGTCCAG TTGGCGGATC CCGATGCCCG GCCGGATCCC 
GTGATCCTCC CGACCGAGCT CGTCATCCGC GAGTCGGCCT GA

Protein sequence

MPEIPAVGGI AVVDGKLLLV RRGRPPSAGS WSVPGGRVEP GEDDQAALVR EFREETGLLV 
SVKELLGEVR RPGPAGTTYR IRDYRVELVT PATAVAGDDA ADVAWVPLDA VARYPLSPGL 
LRALQRWGIV PPAAYRHPSH GSPTLEEVAA HAGVSRATVS RVVNDSPRVS PAVREAVLRS 
IEELGYVPNR AARTLVTRRT DTIALVISEP ESRLFSDPVL AGFVRGIADV LAGTDYMFVL 
LTAQPDTERI ARYIRNGHAD GVILMSLHGD DPLVGMLEAR RMPAVLSGRP LGRGHTIPYV 
DADNVGGARQ ATEYLVRQGR RTIVSITGPM EMCAAIDRLA GFRSGLPPEL RRRWRSLIAT 
GAFTEESGER AMAELLERVP DLDAVFAAND LMAAGALRVL KAAGRRVPDD VALVGFDDSS 
AARHTDPQLT SVRQSAEELG QNMAKLLLVQ LADPDARPDP VILPTELVIR ESA