Gene Cthe_0427 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0427
Symbol
ID	4808430
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	536692
End bp	537861
Gene Length	1170 bp
Protein Length	389 aa
Translation table	11
GC content	39%
IMG OID	640105841
Product	serine phosphatase
Protein accession	YP_001036858
Protein GI	125972948
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	52
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGATT TATGCGTTGA TTTAGGATAT AAAAGCCTTA ACAAATTTGG GGAGCAGCTG 
TGTGGCGACA TGATACAGGT TGTAAAAGAT GATGACACTA CAATTCTGGT TCTGGCCGAC 
GGTTTGGGAA GTGGTGTCAA GGCCAATATT TTATCCACCC TTACCTCAAA GATTATTTCA 
ACGATGATTG CAGCGCATAT GGGTATTGAA GAATGTGTCA ATACGATTAT GTCAACTCTT 
CCGGTTTGCA AGGTCAGAGG AATTGCCTAT TCAACATTTA CCATAATAAA AATTACCAAC 
AACACCTACG CAGAAATAAT TCAGTATGAC AATCCTCTGG TAATACTTTT GCGGAACGGT 
AAAAAATATG ATTATCCTAC ACAGACAAAA ATAATATCCG GCAAAAAAAT CGTTGAATCA 
AAAATAAGGC TGAATTGTGA TGATGTGTTT GTTGTGATGA GTGACGGGGC AATTTATGCG 
GGAGTCGGCC AGACTTTAAA TTACGGCTGG CAAAGGGAGA ATATTATTGA GTTTATTGAG 
TCTCATTATG ACAAAAGCCT TTCTGCCAAT GCTCTTACAT CTCTTTTGAT TGATACTTGC 
AACAACCTGT ATGCAAACAT GCCCGGAGAT GATACAACCA TTGCAGCAAT TAAGATTAGA 
AAAAGACAAG TAGTCAATCT GATGTTTGGT CCGCCGCAGA ATCCTGAAGA TGTCCATAAT 
ATGATGTCTC TGTTTTTTGC AAAACAGGGA AGACATATTG TATGTGGCGG TACCACATCA 
ACGCTTGCAG CGAAGTTTTT GGGCAAGGAG CTTGAAACGA CCATTGATTA TATTGACCCG 
AGAATTCCGC CCATTGCCAG GATTGAAGGA GTTGATCTTG TGACAGAGGG CGTGTTGACA 
ATAAGCCGGG TTCTGGAATA TGCAAAGGAT TATATTGGGA AAAACATTCT TTATAACGAG 
TGGCACAGCA AAAATGACGG TGCTTCGATA ATAGCAAGAA TGCTTTTCGA GGAAGCAACG 
GACATCAATT TCTATGTTGG AAAGGCTATT AATCCTGCCC ACCAGAATCC CAATCTTCCC 
ATAGGATTTA ATATTAAAAT GCAGTTGGTG GAAGAGCTTT CAAAGATACT TAAGCAAATG 
GGCAAAACAA TAAATCTTAG CTATTTTTGA

Protein sequence

MNDLCVDLGY KSLNKFGEQL CGDMIQVVKD DDTTILVLAD GLGSGVKANI LSTLTSKIIS 
TMIAAHMGIE ECVNTIMSTL PVCKVRGIAY STFTIIKITN NTYAEIIQYD NPLVILLRNG 
KKYDYPTQTK IISGKKIVES KIRLNCDDVF VVMSDGAIYA GVGQTLNYGW QRENIIEFIE 
SHYDKSLSAN ALTSLLIDTC NNLYANMPGD DTTIAAIKIR KRQVVNLMFG PPQNPEDVHN 
MMSLFFAKQG RHIVCGGTTS TLAAKFLGKE LETTIDYIDP RIPPIARIEG VDLVTEGVLT 
ISRVLEYAKD YIGKNILYNE WHSKNDGASI IARMLFEEAT DINFYVGKAI NPAHQNPNLP 
IGFNIKMQLV EELSKILKQM GKTINLSYF