Gene Cthe_1302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1302
Symbol
ID	4809554
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1579458
End bp	1581125
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	42%
IMG OID	640106725
Product	hypothetical protein
Protein accession	YP_001037727
Protein GI	125973817
COG category	[R] General function prediction only
COG ID	[COG0595] Predicted hydrolase of the metallo-beta-lactamase superfamily
TIGRFAM ID	[TIGR00649] conserved hypothetical protein

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGCAAAAA AGAAGAGAAA GTTAAAAGTC ATACCCCTTG GCGGATTGGG GGAGATAGGA 
AAAAACATTA CTGTTTTTGA ATATGGCGAT GATATATTTG TGGTTGACTG CGGTATTGCT 
TTCCCGGAAG ACGATATGCT GGGAATAGAT CTTGTTATAC CGGATATATC ATATCTGACC 
AAGAACAGGG AAAAGGTGAG AGGTATAGTT CTTACCCACG GACATGAGGA TCATATTGGT 
GCATTGCCTT ATGTTCTGAA GGATTTGAAC GTACCCGTAT ACGGCACAAA GCTTACTTTG 
GGACTTTTGG AGCAAAAACT TGAAGAGCAT GGGCTTTTAA ACAATGTGGT TCTCAATGTT 
GTCAAACATT CCGATGTGAT AGAACTGGGA TGTTTCAAGG TTGAATTTAT CCGGTCAACT 
CACAGTATAG CAGACTCAAC GGCTTTGGCT ATTTTTACCC CTGTGGGTAC AATTTTTCAT 
ACCGGAGATT TCAAAATTGA TTACACGCCC ATAGAGGGTG AGCCCATTGA TCTGGCAAGG 
CTTGCTGAAC TTGGGAAAAA AGGTGTGCTG CTTCTTATGT GTGACAGCAC CAACGTTGAA 
AGAGAAGGCT ATACAATGTC GGAGAAAACC GTTGGAGAAA CCTTTGATGA GATTTTCATG 
AATGCAAAGA ACAGGATACT TGTAGCAACC TTTGCGTCCA ATGTTCATCG AATTCAGCAA 
ATTGTCAATG CTGCAATCAA ATTCGGAAGA AAAATCGCCA TATGCGGAAG AAGCATGGTC 
AATGTCGTAA ATGTTGCCAT GGAACTTGGC TATATGAATG TACCCGAAGG GCTGATTATT 
GATATAGACC ACATAAACAA ATATCCGCCT GAAAAGATAG TGATAATCAC TACGGGAAGC 
CAGGGAGAAC CAATGTCAGC CCTGACGCGA ATGGCTTCCG GTGACCATAA GAAGGTTGAA 
ATCATACCAG GCGACCTTGT TATTATTTCC GCAAATCCCA TACCCGGAAA TGAAAAACTT 
GTTTCAAGAG TGGTAAATGA CCTTTTCAAA AAGGGTGCGG AAGTTATATA CGAATCTTTG 
GCAGATATTC ATGTTTCAGG TCATGCGAGC CAGGAAGAGT TAAAGCTTAT CCACAGACTG 
ATAAGGCCAA AGTACTTTAT GCCGGTGCAT GGTGAGTACA GGCATTTGAA GCGCCATGCA 
AATCTTGCCG TTGAGCTGGG AATGTCGCCC GAAAACATTT TTATCATGGA TATTGGAAAA 
GTCCTGGAGC TTACCAATGA CTCTGCGAAG ATAAACGGCA GTGTGAATGC CGGAAGAGTG 
CTGGTTGACG GTCTTGGAGT GGGAGATGTG GGAAATATAG TCTTAAGGGA CAGAAAACAT 
TTGTCTCAGG ACGGACTTAT AGTTGTGGTT ATTACCATAG AAGGAGATAC CGGCAATGTA 
ATTGCAGGAC CTGATGTGAT ATCCAGAGGT TTTGTATATG TGCGGGAATC CGAAGACCTC 
ATGGAAGAAA TAAGAGAAGT GTGCAAAGCT GCGCTTCAAA AATGCAATGA CAAGAAAAAG 
AATGACTGGT CTACGAAGAA AAGCATTATA AGAGATGCCT TAAGAGACTT TCTCTATGAG 
AGAACCAAGA GAAGGCCGAT GATTCTGCCA ATAATCATGG AAGTGTAA

Protein sequence

MAKKKRKLKV IPLGGLGEIG KNITVFEYGD DIFVVDCGIA FPEDDMLGID LVIPDISYLT 
KNREKVRGIV LTHGHEDHIG ALPYVLKDLN VPVYGTKLTL GLLEQKLEEH GLLNNVVLNV 
VKHSDVIELG CFKVEFIRST HSIADSTALA IFTPVGTIFH TGDFKIDYTP IEGEPIDLAR 
LAELGKKGVL LLMCDSTNVE REGYTMSEKT VGETFDEIFM NAKNRILVAT FASNVHRIQQ 
IVNAAIKFGR KIAICGRSMV NVVNVAMELG YMNVPEGLII DIDHINKYPP EKIVIITTGS 
QGEPMSALTR MASGDHKKVE IIPGDLVIIS ANPIPGNEKL VSRVVNDLFK KGAEVIYESL 
ADIHVSGHAS QEELKLIHRL IRPKYFMPVH GEYRHLKRHA NLAVELGMSP ENIFIMDIGK 
VLELTNDSAK INGSVNAGRV LVDGLGVGDV GNIVLRDRKH LSQDGLIVVV ITIEGDTGNV 
IAGPDVISRG FVYVRESEDL MEEIREVCKA ALQKCNDKKK NDWSTKKSII RDALRDFLYE 
RTKRRPMILP IIMEV