Gene Acel_2042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acel_2042
Symbol
ID	4486206
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidothermus cellulolyticus 11B
Kingdom	Bacteria
Replicon accession	NC_008578
Strand	+
Start bp	2314308
End bp	2315429
Gene Length	1122 bp
Protein Length	373 aa
Translation table	11
GC content	65%
IMG OID	639730838
Product	hypothetical protein
Protein accession	YP_873800
Protein GI	117929249
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGAGG TGGCGGTACG AGTTCTCATC GGCACCCGCA AGGGTGCCTT CATCGCGACG 
TCCGACGACA CCCGACGGAG CTGGTCGGTG ACCGGGCCGC TGTTTGCCGG ATGGGAGGTC 
TACCACGTTC AAGCGTCGCC CGTTGATCCG GACCGCCTCT ACGCCGCGCC GTCCCGGGGC 
TGGTTCGGTC AGACCATCCA GCGCTCGGAC GACGGCGGTC GCTCCTGGCA ATTGGTCGGA 
AATGATTTTC GTTACGACGG CGAGATCGGG GATCATTTCT GGTACGACGG AACGCTCCGG 
CCCTGGCATT TCACCCGGGT ATGGCACCTC GCGCCGTCGC CGGTCGACGC GAACACGGTG 
TATGCCGGAA CCGAGGACGC CGCGCTGTTT GTGTCGAGCG ACGGCGGCCA GACCTGGCCG 
GAATTGACCG GGCTTCGTTG CCACGACACG GCACCGAATT GGGCCCCGGG CGCCGGCGGA 
TTATGCCTCC ATACCATCCT CTTTGATCCG CGCGATGCCA CTCGCATGCA TGTGGCTATT 
TCCGCTGCGG GTGTTTTGCG CTCCGACGAT GCCGGCCTCA CCTGGCGGAC CGCCAATCGC 
GGACTCCGCT CGGATTTCCT GCCGCAACCC GAAGCCGACG TCGGTCACTG CGTGCACAAA 
ATCGCCCGTC ATCCGGCGCG GCCGGACGTC CTCTTCATGC AGAAACACTG GGACGTGATG 
CGCAGCGACG ACGGCGGTAA CAGCTGGTAC GAAATCAGCG GCGACCTCCC CAGCGACTTC 
GGTTTTCCGA TCGCCGTTCA TCCCCATGAC CCTGACACCG TGTACGTGGT TCCCATCACG 
AGCGACACCG AACACTTCCC GCCGGAGGGA CGGCTGCGGA TATACCGTAG TCGCACCGGC 
GGGCGGTACT GGGAACCGTT GAGCAAGGGA CTTCCGCAAG AACACTGCTA CGTCAACGTG 
TTACGCGACG CCTTCGCAAC AGACGAGCTT GAGCCGTGTG GACTGTACGT CGGAACCACC 
GGCGGCCAGA TTTACGCCTC CGCCGACGAA GGTGCCACGT GGACGACGAT CGGCCGTGAC 
CTACCCGCCG TGCTCTCCGT CGAGGTGCAG ACTCTGCGAT GA

Protein sequence

MAEVAVRVLI GTRKGAFIAT SDDTRRSWSV TGPLFAGWEV YHVQASPVDP DRLYAAPSRG 
WFGQTIQRSD DGGRSWQLVG NDFRYDGEIG DHFWYDGTLR PWHFTRVWHL APSPVDANTV 
YAGTEDAALF VSSDGGQTWP ELTGLRCHDT APNWAPGAGG LCLHTILFDP RDATRMHVAI 
SAAGVLRSDD AGLTWRTANR GLRSDFLPQP EADVGHCVHK IARHPARPDV LFMQKHWDVM 
RSDDGGNSWY EISGDLPSDF GFPIAVHPHD PDTVYVVPIT SDTEHFPPEG RLRIYRSRTG 
GRYWEPLSKG LPQEHCYVNV LRDAFATDEL EPCGLYVGTT GGQIYASADE GATWTTIGRD 
LPAVLSVEVQ TLR