Gene Acel_0719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_0719
Symbol
ID	4485141
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	-
Start bp	786795
End bp	787949
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	66%
IMG OID	639729489
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_872478
Protein GI	117927927
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.356733
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGGAA GATCCCGGCT CGTCGCGGTG AGCGCGGTGG CGGCCGCCGC CAGCCTGGTC 
CTCGCAGCCT GCAGCAGCTC CAAGAGCTCC TCGCCGTCGT CGAGCTCCGG CGCACCGGCC 
GCGAACACGA GCGCGGCGTC CGCCAGCGCC GGCGCAGGGG GCGCGGGCGG CGGCAAGATC 
CAGGCCGCAC TCATCCTCAA GGAGTTCACC AACCCGTACT GGATCTCGAT GGAGAATGCC 
GCGAAGGCCG AGGCGGCGAA GCTCGGCGTG GATCTCCACG TTTCGGCCGG CAAGGCGGAC 
GATGACGCCA CGTCCCAGAT TCAGCAGATC GACGCCGCGA TCTCCGCGGG TTACAAGGGC 
ATCATCATTG CCATCAACAG CGACGCGGTG AACACCGCCT TGCAACGCGC GAAAGCCGCC 
GGGCTCCTGG TCGTGGTCGT CGACACGCCG CCGATCCCGG CGAGCATCGC GGACGTCACC 
TACGCGACCG ACAACCTGCA GGCCGGCCTG TTCATCGGCA AGTGGATGGC GCAGAAGCTG 
AACGGCGCCA ACGCCGACAT CGCCATGCTG GACGACCTCG CCAATCAGGT GATCACAGTG 
GACGTCGACC GGGACCATGG CTTCCTCCAA GGCATGGGCA TCCCGGTCGG CAATCCCAAC 
GTGAACGGGC AAGAGCCCAA GTCCGGTCAT TACACCGGGG GGAAGGGCGG CAGCTATAAG 
ATCGCATGTC AGCTACCCAC CAACGGTTCC GCGACTGGGG GTCTGTCGGC AATGGAGACC 
TGTCTGTCGA AGGACCCGAA CATCAATGTC GTCTACACCA TCAACGAGCC GGCGGCCAAG 
GGGGCGGCGC AAGCCCTGAA GAACGCCGGC AAGACCCCCG GCAAAGACGT GACGATCGTG 
ACCATCGACG GAAGCTGCAA CTACCTGTCC CTCCTCACCA GTGGGGAGAT CGGAGCGGAC 
TCGGGGCAGT TCCCGGGCAA GATGGCACAG CTCGGCGTCG ACGCCATTGC GCAGTTCGCG 
AAGACCGGTG CGAAACCGAG CATGCCGGCG GGCAAGGACT TCATCAACAC CGGCGTCCAG 
CTGATCACCG CTCAACCGCA ACCAGGGGTG GACAGTGTCA CCCCGGACCA AGCGAAGTCC 
AGCTGCTGGG GATGA

Protein sequence

MKGRSRLVAV SAVAAAASLV LAACSSSKSS SPSSSSGAPA ANTSAASASA GAGGAGGGKI 
QAALILKEFT NPYWISMENA AKAEAAKLGV DLHVSAGKAD DDATSQIQQI DAAISAGYKG 
IIIAINSDAV NTALQRAKAA GLLVVVVDTP PIPASIADVT YATDNLQAGL FIGKWMAQKL 
NGANADIAML DDLANQVITV DVDRDHGFLQ GMGIPVGNPN VNGQEPKSGH YTGGKGGSYK 
IACQLPTNGS ATGGLSAMET CLSKDPNINV VYTINEPAAK GAAQALKNAG KTPGKDVTIV 
TIDGSCNYLS LLTSGEIGAD SGQFPGKMAQ LGVDAIAQFA KTGAKPSMPA GKDFINTGVQ 
LITAQPQPGV DSVTPDQAKS SCWG