Gene Cthe_2972 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2972
Symbol
ID	4810860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	3490091
End bp	3492142
Gene Length	2052 bp
Protein Length	683 aa
Translation table	11
GC content	45%
IMG OID	640108394
Product	glycoside hydrolase family protein
Protein accession	YP_001039362
Protein GI	125975452
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0726] Predicted xylanase/chitin deacetylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACAAA AATTACTGGT AACTTTCCTG ATTTTAATTA CTTTTACCGT TTCACTGACT 
TTGTTTCCGG TAAATGTACG CGCTGATGTA GTAATTACGT CAAACCAGAC GGGTACTCAT 
GGCGGGTACA ACTTTGAGTA CTGGAAAGAC ACCGGAAACG GAACCATGGT CCTCAAAGAC 
GGTGGTGCGT TCAGCTGCGA ATGGAGCAAT ATCAACAATA TTCTTTTCCG TAAAGGTTTC 
AAATACGATG AAACAAAGAC ACATGATCAA CTTGGATACA TAACGGTAAC TTATTCCTGC 
AACTATCAGC CAAACGGAAA CTCTTATCTG GGAGTCTACG GATGGACCAG CAATCCGCTT 
GTAGAGTATT ACATCATCGA GAGCTGGGGA ACCTGGAGAC CACCGGGAGC AACACCAAAG 
GGCACTATTA CCGTTGACGG TGGTACATAC GAGATATACG AGACCACCAG AGTTAACCAG 
CCTTCCATCA AAGGTACAGC TACTTTCCAG CAATACTGGA GTGTACGTAC ATCAAAACGT 
ACAAGCGGAA CCATATCCGT AACCGAACAC TTTAAAGCCT GGGAACGTCT GGGTATGAAA 
ATGGGAAAAA TGTATGAGGT TGCTTTGGTT GTAGAAGGAT ACCAGAGCAG CGGAAAAGCC 
GACGTAACCA GCATGACAAT TACTGTTGGC AACGCACCGT CAACATCATC ACCACCAGGT 
CCGACACCTG AACCGACTCC AAGAAGTGCT TTTTCAAAAA TCGAAGCTGA GGAGTACAAC 
TCCCTCAAGT CATCAACCAT TCAGACCATA GGCACTTCCG ACGGAGGAAG CGGTATAGGT 
TATATTGAAA GCGGTGACTA TCTGGTATTT AACAAAATAA ACTTTGGAAA CGGCGCAAAC 
TCTTTCAAGG CAAGGGTTGC ATCCGGTGCG GACACACCCA CCAATATCCA GTTAAGACTC 
GGAAGCCCGA CCGGTACTCT TATAGGAACT CTTACGGTGG CTTCCACAGG TGGTTGGAAC 
AATTACGAGG AAAAATCCTG CAGCATAACC AACACTACAG GACAGCACGA CTTATATCTG 
GTATTCTCAG GTCCTGTTAA CATTGACTAC TTCATATTCG ACTCGAATGG CGTAAATCCT 
ACACCCACCT CTCAGCCTCA ACAAGGCCAG GTTTTGGGTG ACTTGAACGG AGACAAACAA 
GTAAATTCAA CAGACTACAC AGCACTGAAG AGACATTTGC TCAATATAAC CAGACTTTCA 
GGAACTGCTC TTGCCAACGC CGATTTAAAC GGTGACGGCA AAGTTGATTC CACTGACCTT 
ATGATTCTAC ACAGATATCT TCTCGGTATA ATTTCATCTT TTCCACGCAG CAATCCACAA 
CCAAGCAGTA ACCCTCAACC AAGCAGCAAT CCGCAGCCAA CGATTAATCC AAATGCGAAA 
CTGGTGGCTC TTACCTTTGA CGACGGTCCG GACAACGTAC TTACGGCACG GGTTCTCGAC 
AAGCTTGATA AATATAACGT TAAGGCTACA TTCATGGTAG TAGGTCAGAG AGTCAATGAT 
TCGACGGCTG CCATCATCAG AAGGATGGTT AATTCAGGCC ATGAAATAGG AAACCACTCA 
TGGAGTTATT CAGGCATGGC CAATATGAGT CCGGATCAGA TAAGGAAATC CATTGCCGAT 
ACAAATGCAG TTATTCAAAA ATATGCTGGA ACAACACCCA AGTTCTTCCG TCCGCCGAAC 
CTCGAAACAA GCCCAACATT ATTCAACAAT GTTGACTTGG TGTTTGTCGG CGGCTTAACG 
GCAAATGACT GGATTCCATC CACAACCGCC GAACAGAGGG CTGCCGCAGT TATAAACGGT 
GTCAGAGACG GTACAATAAT TCTTTTGCAT GATGTTCAAC CTGAGCCACA CCCGACACCG 
GAAGCTCTGG ATATAATCAT CCCTACACTT AAGAGCCGGG GCTATGAATT TGTGACCTTG 
ACTGAGTTGT TCACGTTAAA GGGTGTGCCA ATTGACCCAT CAGTCAAAAG AATGTATAAC 
TCTGTACCGT AA

Protein sequence

MKQKLLVTFL ILITFTVSLT LFPVNVRADV VITSNQTGTH GGYNFEYWKD TGNGTMVLKD 
GGAFSCEWSN INNILFRKGF KYDETKTHDQ LGYITVTYSC NYQPNGNSYL GVYGWTSNPL 
VEYYIIESWG TWRPPGATPK GTITVDGGTY EIYETTRVNQ PSIKGTATFQ QYWSVRTSKR 
TSGTISVTEH FKAWERLGMK MGKMYEVALV VEGYQSSGKA DVTSMTITVG NAPSTSSPPG 
PTPEPTPRSA FSKIEAEEYN SLKSSTIQTI GTSDGGSGIG YIESGDYLVF NKINFGNGAN 
SFKARVASGA DTPTNIQLRL GSPTGTLIGT LTVASTGGWN NYEEKSCSIT NTTGQHDLYL 
VFSGPVNIDY FIFDSNGVNP TPTSQPQQGQ VLGDLNGDKQ VNSTDYTALK RHLLNITRLS 
GTALANADLN GDGKVDSTDL MILHRYLLGI ISSFPRSNPQ PSSNPQPSSN PQPTINPNAK 
LVALTFDDGP DNVLTARVLD KLDKYNVKAT FMVVGQRVND STAAIIRRMV NSGHEIGNHS 
WSYSGMANMS PDQIRKSIAD TNAVIQKYAG TTPKFFRPPN LETSPTLFNN VDLVFVGGLT 
ANDWIPSTTA EQRAAAVING VRDGTIILLH DVQPEPHPTP EALDIIIPTL KSRGYEFVTL 
TELFTLKGVP IDPSVKRMYN SVP