Gene Cthe_1171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1171
Symbol
ID	4810123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1397667
End bp	1398914
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	40%
IMG OID	640106593
Product	Serine-type D-Ala-D-Ala carboxypeptidase
Protein accession	YP_001037596
Protein GI	125973686
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1686] D-alanyl-D-alanine carboxypeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.987269
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTATAGAA GAGTCTTGAT ACAAATTCAG TGCTTTACAG TAGCAATGAT GATTTTGTTT 
TTCTCTCAAA GTCCGGTTTT CGCAGTTGCG GAACCTCCGG AAATCAAGGC ACCTTCCGCT 
ATTTTGATGG AAGTGCAGAG GGGACAGATA CTCTATCAAA AGAATCCAAA ATTAAAACTT 
CATGTTTCGT GTGCAAATAA AATTATGACC GGACTCATTG CTTTGGAAAA AATGCAGAAT 
CAACTGAACA CCAATATCAC TGTCAGCAAG AAGGCGGTTT CTGTTGAAGG AGCTGTGTTA 
AATCTCGAGG TCGGCGGAAA ATACCCGGTT GAAGATTTGA TATATTCGGT TTTGTTAGGA 
TCCGCCAATG ACAGTGCCAA TGTTCTGGCT GAGTATATAG GTGGAGACGA GAAGGGTTTT 
GTTGAGCTTA TGAATAAAAA GGCCCAGGAA CTTGAGATGA AGGATACTTA TTTTACAAAT 
CCCACGGGTC TTTATGATGA AAAACAATAT ACAACGGCGT ATGACCTGGC CGTTTTAATA 
AGATATGCTC TGACAAAATC CAGCACTTTC AATGAGATGT TTTCGGCTAA GGCCAGACCA 
TGGGTTGACG GAACGCAGAT TTTAATAAAC AGCAATGAGT TGTTCTGGAG CTATGACGGC 
GTTGACGGTG GAAAGACCGG ATATAACGAA ATAGACCGTC AAACGGCAAT TACCACTGCC 
ACAAGAAACG GGCAAAGGTT GATATGCATA GTTCTTGATT CACCGGAAGA AAGCATGTAT 
GACGATTCGG TAAAGCTTCT GGACTATGGT TTTTTAAATT TCAGGACAGG CATTCTGGTA 
TCAATGGGAC AACCTTTGAA GAAAGTTACC GTCGGCGATA AAGTTATAGA TTTGGTTAGC 
ATAGGTGACT ATTACTATAC TTACCCTGCC GGGGAAAATT ATATAAAGAA TATTGAATTT 
AAAGTTCCTG AAAAGTTTGA TCCTCCTGTA CTGAAAAGTG ATGTTTTAGG CATTGCAAAG 
TATACTTTGG AGGATGGAAC GGTTATTGAA GTAAGTCTGC ATCCGGCGGT TGATGTTTAC 
TCTTCGATGG GCTTGTTTGA GTCGTTGATA AATCAAGTGA AGGAATACAG GGATATAGTA 
ATATTGCTGT GTATTCTTTT GGTAATAGAA TTATTTATTG CGGTTTATCA TATAGTGAGG 
CTGATAAAGC GGCTGTTTCT AAAGCTTGTT TACAAGCCTG GGAAATAA

Protein sequence

MYRRVLIQIQ CFTVAMMILF FSQSPVFAVA EPPEIKAPSA ILMEVQRGQI LYQKNPKLKL 
HVSCANKIMT GLIALEKMQN QLNTNITVSK KAVSVEGAVL NLEVGGKYPV EDLIYSVLLG 
SANDSANVLA EYIGGDEKGF VELMNKKAQE LEMKDTYFTN PTGLYDEKQY TTAYDLAVLI 
RYALTKSSTF NEMFSAKARP WVDGTQILIN SNELFWSYDG VDGGKTGYNE IDRQTAITTA 
TRNGQRLICI VLDSPEESMY DDSVKLLDYG FLNFRTGILV SMGQPLKKVT VGDKVIDLVS 
IGDYYYTYPA GENYIKNIEF KVPEKFDPPV LKSDVLGIAK YTLEDGTVIE VSLHPAVDVY 
SSMGLFESLI NQVKEYRDIV ILLCILLVIE LFIAVYHIVR LIKRLFLKLV YKPGK