Gene Cthe_1383 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1383
Symbol
ID	4809378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	1688143
End bp	1689300
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	37%
IMG OID	640106807
Product	tetratricopeptide TPR_2
Protein accession	YP_001037808
Protein GI	125973898
COG category	[S] Function unknown
COG ID	[COG1729] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATAGATT TTAAAAATGA GCTTCAAAAT TATCCAATGA TTGATTTGGA TAAGTTGTCC 
CAGGCGAACC CGAACATACC TGACAATATA AAAAATTCAA TTGTGCTTTA CAATAAAGCT 
TTGGAGGATT TTCGCGCAAA AAGCGAGGAT ATAGCCATAA TTGAGCTTAA AAAAGCCATT 
TCCCTGAATC CGGATTTTCA TGAGGCAATG AATTTGTTAG GTATCTTCTA TATGTATATA 
GGAGAGAACG ATAAAGCTGC AGAAGTTTTC CAAAAAGTTG TGGATGCGGA AAAAAACAGC 
GTAATGGCGA TGAGATATTT AAAAGAAATT GATTCCGGGT ATGATCCTGT CGGAAATAAA 
CAGGAAAAGG ATAAAAAATC CAGGAAGAAG AAAGAAAGAA ACAGAGGGGC AGCTCAGCTT 
TCAAACCAGG TGACGGTAAA AAGCAGTGCC TCTTTTTCCT TTAAGAAGCT GATAAAAATA 
TGGGAATACA AGCCCATGGA CACGGCAAGA CTGTTTTTGG GATTTGTAAT TGGTGCTCTT 
CTGGTTTTCC TCTTAAGTTA TAATTATTAT TTCAGAGAAG AGAATAATGA GCAATTGGAG 
CAGTTAACAG AGGAAAATAA CACTCTTATT GGAGAAAAAA ATGAGATTCA GAAAAAGTAT 
GATGAACTGA ACGAGAAATA TCAGGGATTA AACGACACGT TTGAAGAAGT GAAAAAGCAG 
GTTGACTATT ATTTGAATGC TTCAAAACTT CTTCAAATTG AGAAATATGC TTCCCAGAAC 
CAGTATCGTG AAGCGGCCGA TTTATTATTG TTATTGAAAA ACACCGCATT TACCGGAGTG 
GAAAAAGAAA AGTTTGACAA ATTATCCCAG GATGTCATGC CTAAAGCTGC GCAGGAAGAA 
TATAATAAAG GAAGAGAATT GTACAACAGA AAAAATTACC AGGAAGCCGT GGAGAGATTT 
GAAAGATCCC GCTCTTACAG TGACAATTGG AGGTATGCGG TAAATAATCT CTATTATCTG 
GGAGTATGCT ATCAGGAACT CAACAACACC ACCAAGGCTT TGGAGATATT TGAAGAGGTT 
GTAAATAAAT ATCCGAACAC TTCCTATGCC GGATACTCAA GGGAACGTAT AAACTATATA 
CGAGGCAGCC AGCAATGA

Protein sequence

MIDFKNELQN YPMIDLDKLS QANPNIPDNI KNSIVLYNKA LEDFRAKSED IAIIELKKAI 
SLNPDFHEAM NLLGIFYMYI GENDKAAEVF QKVVDAEKNS VMAMRYLKEI DSGYDPVGNK 
QEKDKKSRKK KERNRGAAQL SNQVTVKSSA SFSFKKLIKI WEYKPMDTAR LFLGFVIGAL 
LVFLLSYNYY FREENNEQLE QLTEENNTLI GEKNEIQKKY DELNEKYQGL NDTFEEVKKQ 
VDYYLNASKL LQIEKYASQN QYREAADLLL LLKNTAFTGV EKEKFDKLSQ DVMPKAAQEE 
YNKGRELYNR KNYQEAVERF ERSRSYSDNW RYAVNNLYYL GVCYQELNNT TKALEIFEEV 
VNKYPNTSYA GYSRERINYI RGSQQ