Gene Cthe_1960 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1960
Symbol
ID	4810743
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2335339
End bp	2336421
Gene Length	1083 bp
Protein Length	360 aa
Translation table	11
GC content	46%
IMG OID	640107376
Product	peptidoglycan binding domain-containing protein
Protein accession	YP_001038371
Protein GI	125974461
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3409] Putative peptidoglycan-binding domain-containing protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAGA AGAAACCTGC TTTGTTTGCG GTCATTCTGC CTCTCTTAAT CGCCTGTATA 
ATGATTAATT CTTCAATGGT ATTTGCATCT TCAGGGATTT TGAAGGAGGG AATGAGCGGA 
AGCCAGGTTA CATCACTGCA GAGGGATCTT AACACGCTGG GGTATCTTGA TGTAACTCCT 
ACAGGTTATT ATGGCAGTCT TACAACAGCA GCAGTTAAGA AGCTTCAGAG AAATTACGGA 
CTTAAAGAGG ACGGCATTGC GGGGCCTGAC ACTCTCTCGC TTATCAAAAG GCTGATAAAC 
GAAAGGACTG CTTCAAGGTC TTCCGGCGGC ACAACGTTGA AAGAGGGTAT GAGCGGGAGC 
AGTGTGACAG CTTTGCAGAA GGACTTGAAA GCTTTGGGCT ATCTGAGCGT GGATCCAACG 
GGTTACTATG GAAGCCTTAC AAAAGAAGCG GTAAAGAAAC TTCAGGCAAA GCACGGTCTT 
GAGCAGGACG GAATTGCAGG ACCGAAGACC TTGGCATTGA TTGACAGGCT TATGGGAAGA 
AGCGGTAGTT CTGCTTCACA ATCCGCAGCT ACGGCATCCA GGGGAGGGCT CGATAAGACC 
AATTACCTTT ATTCCTGGTT CGGTAATGCG GAAAACATTT TCAAGATAGG CGATACAGCA 
CAGGTATATG ACATTAGGAC TGGGCGCACA TTTAATATAA AGAGGACTTA TGGCTATAAC 
CATGCAGACT GTGAGACTTT AACCGCTAAA GACACGGAAA TAATGCTCAG TATCTACGGC 
GGAAGCTGGA GTTGGGAAAG AAGACCGATA ATTGTTATTG TCAACGGGAG AAAAATGGCG 
GCTTCGATGG CGGGAATGCC TCATGCAGGA GTTGACAGTG CGCCGGCTAA TACATATGTA 
AAATCGAGAA GCGGAGGATA TGGCGCAGGA GACAATCTCG ACTCCGTTAA AAACAACAAC 
ATGAACGGAG TGTTTGACGT TCACTTTTTA AACAGCAAGA CTCATGGAAC CAACAGAGTG 
GATGAAAATC ATCAGAAGGC GGTCAGGGAA GCGGCAGAGT GGGCTGCAAA GAATAAGTTT 
TAG

Protein sequence

MQKKKPALFA VILPLLIACI MINSSMVFAS SGILKEGMSG SQVTSLQRDL NTLGYLDVTP 
TGYYGSLTTA AVKKLQRNYG LKEDGIAGPD TLSLIKRLIN ERTASRSSGG TTLKEGMSGS 
SVTALQKDLK ALGYLSVDPT GYYGSLTKEA VKKLQAKHGL EQDGIAGPKT LALIDRLMGR 
SGSSASQSAA TASRGGLDKT NYLYSWFGNA ENIFKIGDTA QVYDIRTGRT FNIKRTYGYN 
HADCETLTAK DTEIMLSIYG GSWSWERRPI IVIVNGRKMA ASMAGMPHAG VDSAPANTYV 
KSRSGGYGAG DNLDSVKNNN MNGVFDVHFL NSKTHGTNRV DENHQKAVRE AAEWAAKNKF