Gene Cthe_1748 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1748
Symbol
ID	4810178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2067664
End bp	2069217
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	33%
IMG OID	640107161
Product	hypothetical protein
Protein accession	YP_001038162
Protein GI	125974252
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000315273
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTTAAATT ACTGGTGGGT AACAAGACCA AAGCGAAAAT TAAATTCTGT TCCTGAAGTA 
TTATCAGCAT TTGCTGAATT ATCATTAGAT CAAGAATGGC AGGGACAGAG AGAGTCTCAT 
TTATCTTTTG AAGATGCCTT AGAGCAGGCA GGTTTAAAGC GTAAAGGGGA ACGCAGAGAT 
CAGACAGGCG GAGGAGCACG AACATATAAG GCATGGCTTA CAAGCTTAGG GTTGATATTC 
ACACAGGAAT CAACAGGAAA GATAAAGTTA ACATTAGCAG GTGAAGCCAT AATGGCAGGT 
GACTCTCCTG TTGAAGTTTT GAAAAACCAA ATTTTAAAAT ATCAGTTTCC ATCTTCTTTT 
TCATTGAGCA GAGGAGTTCA AGTCGCCCCA AGATTTAAAA TCAGACCATT TAGATTTTTA 
TTGAGACTAT TAAATGATCC AGAGATAGAA TATTTGACAG AAGAGGAAAT TGCAAAAATT 
ATAGTTACGA AGGCAGAAAA TGAAACAGAT AAATGTTATA GATATATTGT AGGTAAAATT 
TTAGAATTCA GACAAAGCGG CGATATGATT CATGAAGAAG ATTTTTTTGA TAAATATAAA 
TCTTCAAAAG GTGATATCAA TCTTGAACAT CCATATAGGC ATTTAATGGA TTTAGCAAAT 
ACTATTGTAA ACTGGTTAGA ATATACACAG CTTGTAAAAA GAGATAATGG TGAAGTACGT 
ATTCTTGAAG ATAAACGATT AGAAGTTCAG CAGATTTTAT CTGTTTCACC GCCTTTTATT 
GATCGACCTG AACAACATGA ATATTTTCAA AGAAAATACG GCCTTGACCC TAAGCACAAG 
AAAGATACTA GAAATCTTAC AGAAACTAAG ACTATTACAG CTAAAATTAT TGCTGAACAG 
AAGATTAAAA AAGCATATAT TGTTGAATCT TTAAAACAGC CGATAACCAA AATAACGACA 
GATCTTATAG ATAAAATTTC TGAGCAGACA GGTTTTGAGG ACAAGCTGGT AGAAGAAACC 
CTTTTGAAAC TGTATCCAAG AGGGTCTGTT GGTGCATTTA TGACAGAGTA CTTTGAAATG 
GCTTTTAAAG GGAGAGATGA GGCTTCAGAC TTTGAAAAAG CAACTGTGCA ATTATTTCAA 
AATGTTTTTG GTTTTGAAGC AAAACATGTA GGACCTATAG GCCTTACGCC TGATGTTTTA 
ATTTTATCTG ATAAAGATGG ATATCAGGCT ATTATAGATA ATAAGGCATA CAGTAAATAT 
ACAATTAGCA ATGACCATCA TAATAGAATG GTTCACAATT ATATAGGAAA TTTAAATCGT 
TATAGTAATT CTAGTGATCC GCTTGCCTTT TTTTCATATA TTGCAGGTGG CTTTGGAAAG 
AACATTAATT CTCAAATTAT AGATATTGTT AATGCTACTG GTGTTTCTGG TTCAGCAATG 
AGTGTATCTA ATATGATTAA ACTTGTTGAA TCATACGAGT CCAAGCATTA TACACATAAA 
AACATTAGAG ATATATTTTC TGTTAATAGG CAGATATTGT TATCTGATTT ATAA

Protein sequence

MLNYWWVTRP KRKLNSVPEV LSAFAELSLD QEWQGQRESH LSFEDALEQA GLKRKGERRD 
QTGGGARTYK AWLTSLGLIF TQESTGKIKL TLAGEAIMAG DSPVEVLKNQ ILKYQFPSSF 
SLSRGVQVAP RFKIRPFRFL LRLLNDPEIE YLTEEEIAKI IVTKAENETD KCYRYIVGKI 
LEFRQSGDMI HEEDFFDKYK SSKGDINLEH PYRHLMDLAN TIVNWLEYTQ LVKRDNGEVR 
ILEDKRLEVQ QILSVSPPFI DRPEQHEYFQ RKYGLDPKHK KDTRNLTETK TITAKIIAEQ 
KIKKAYIVES LKQPITKITT DLIDKISEQT GFEDKLVEET LLKLYPRGSV GAFMTEYFEM 
AFKGRDEASD FEKATVQLFQ NVFGFEAKHV GPIGLTPDVL ILSDKDGYQA IIDNKAYSKY 
TISNDHHNRM VHNYIGNLNR YSNSSDPLAF FSYIAGGFGK NINSQIIDIV NATGVSGSAM 
SVSNMIKLVE SYESKHYTHK NIRDIFSVNR QILLSDL