Gene Cthe_1055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_1055
Symbol
ID	4811353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	1260203
End bp	1261411
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	34%
IMG OID	640106477
Product	hypothetical protein
Protein accession	YP_001037480
Protein GI	125973570
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAGAA ATAGAATCTT ATATTCATTT TTATATGTTC TGTCTTTAAT ATTTATATAT 
TTTTACGGCG GCAAAATCCC TTACATGCTG TTTTATACCG TCTTGTTGCT GCCTTTTGTT 
TCCATAGCCA TAACCTCCAT TGCATTTGTC AGATTCAAAT ATGTTCAGGA TATTGATAAG 
CGAAGTGTGG TAAAGGGCGA GGAAATAAAC TACACCTTAA GCATACATAA TGAGGATTTT 
TTCCTTTATC CTTACATTAA AATTAACTTT TTTAATAATG ACACAATTTT TTCAAACCAA 
TTTGAACCAC AATGCTTTTC TCTCCTTCCT TTTAAGAAGA AAACCTTTAG CTACAAGCTT 
TGCTGCAAAT ACAGGGGAGA CTTTTTCGTG GGGGTAAAGA GCATAGAATT TGAAGATTAT 
CTGGGTATTG TAAAATTTGT TCACGAGCCC ATTTCAATAA AAGAAATTAC AGTGTATCCC 
CGTTTGATCA AGCTGGACAG CCTGAAGCTT AAAACAGACT ATTTGTCGGA ATCCCATGCT 
CTGTCAAACA GCAGGTTTGA AAACACTCTG ACCTTTTCCG ACGTAAGGAA ATACACCTAT 
GGTGACAGCA TGAAGAAGAT ACACTGGAAA CTTTCTTCAA AGATGAATGA GCTTCTTGTA 
AAAAACTTTG AAGGTTCGTC CCATGCAAGC TCCGCAATTT TGCTGGATCT TAAGAAAAGC 
AACCGTTCCT TCGAAGAAAA CTCGATAATT GAAGATATGC TTATTGAAGC CTCCATTGCC 
GTAATTTATT ATTGCCTTGT CAACTGGATA CCAATAAATT TTATATATTA CAACAGTAAA 
GGTTTTAATA CCATCGAGGC GAAAAACGCT TTGGAATTTA AAGAAATCTA TGAAATTTTA 
TCCGGCATCA AATTTGAAAA TACCATGGAT ATAAAAGACG TCCTTAATAT TTATGTGAAA 
AACAGTGTCT TGAAAAAAAC TTCGATACTC CTTTTTACGT CTAATTTGGA TTATGGACTC 
TATGATGAGA TTTACAAAAC AAAACTAATG GGGTACGACA TAAATTTAGT GTACGTTTGC 
CCGAAACATG TTGTAAATAC CGCTTCTTTT GAAGTAAACA ATATTTTAAA CGAGCTTTTG 
GAAATTGGAG TCATGGTTTA TAAAATACAA ACCGAAGATG ACATCAAAAA TGTGCTGGAG 
TATAGATAA

Protein sequence

MQRNRILYSF LYVLSLIFIY FYGGKIPYML FYTVLLLPFV SIAITSIAFV RFKYVQDIDK 
RSVVKGEEIN YTLSIHNEDF FLYPYIKINF FNNDTIFSNQ FEPQCFSLLP FKKKTFSYKL 
CCKYRGDFFV GVKSIEFEDY LGIVKFVHEP ISIKEITVYP RLIKLDSLKL KTDYLSESHA 
LSNSRFENTL TFSDVRKYTY GDSMKKIHWK LSSKMNELLV KNFEGSSHAS SAILLDLKKS 
NRSFEENSII EDMLIEASIA VIYYCLVNWI PINFIYYNSK GFNTIEAKNA LEFKEIYEIL 
SGIKFENTMD IKDVLNIYVK NSVLKKTSIL LFTSNLDYGL YDEIYKTKLM GYDINLVYVC 
PKHVVNTASF EVNNILNELL EIGVMVYKIQ TEDDIKNVLE YR