Gene Cthe_2093 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2093
Symbol
ID	4810953
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2488992
End bp	2490050
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	44%
IMG OID	640107500
Product	hypothetical protein
Protein accession	YP_001038493
Protein GI	125974583
COG category	[S] Function unknown
COG ID	[COG3583] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.00901653
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGTCGCAGC TTGTTGAAAG TATTAAAAGG CGTGTTTCGT TCAAACTGTT GGCTTGTTTG 
GCTGTTGCAT TCGTTGTTGC GGGAATTGCA GGATGGGGAA CATATTACAG CTGTCAAAAA 
GAAGTAGTGA TAAACCTGGA TGGCGAGCGG CTTGTTGTAA AAACAGTAAA ATCCACCGTG 
AAAGAAGTAT TGAAGCAAAG CGGGATAAAT ATAACCGAGG ATGACTATGT TAGTGTTCCG 
CTTGATACGA AACTTAAGAG TAAAAAAGGC AACGTGATAG ATATAAAAAA AGCAGTACCT 
GTTACAGTAA TTGCCGATGG ACAGGAATTC AAGCTTATGA CTTCCAAGAA GACAGTCCGG 
GAAGCGTTGG AAGGAGAACC GGTCAATCTT GGACATTTGG ACCGGGTTGA AGGGGCCGGA 
CTTGATGACG AAATAGTTGG AGGCATGAAG CTCAAAGTCG TCAGAGTAAA GAAGAAACTT 
GTCAGTGAAA ACGAAATTAT CCCTTACAAC GTGATAAAAA GGGAAAACGG CAGCATGGAC 
AAGGGAGATT ACAGAGTAAT CAAAGAAGGA AAAGAAGGAG TAAGAGAAAA GGTCTATGTG 
GTTTCGTATG AGGACGGCAA AGAAGTGGGG AAACAGCTTG TAAGCTCGAC CGTTGTTTCA 
GAACCGGAAA CCAGGATTGT GGAATACGGT ACTGTTCCGG TCTATATGAC GGCCAGAGGA 
GAGAAATTCA GATACAAAAA GGTGCTGACT ATGAAAGCCA CAGCTTATAC CGCATCTTAT 
GAGGACACAG GGAAAACCCC CGATCATCCG GAGTTTGGAA TCACTTATAC CGGAATTAGG 
GCAAAGAAAG GTGTTGTTGC GGTGGATCCA AAGGTTATAC CTTTGGGAAC AAAGTTGTAC 
ATAGAAGGCA TAGGAGGGAC GCCCGACTAC GGATTTGCCG TTGCCGCGGA CATTGGAAGT 
GCTGTAAAGG GTAATGTCAT CGACCTTTAT ATGGACAGCA GGCAAGCCGT TAAACAGTGG 
GGAGTAAAAA AGGTAAGAGT CTACATACTT TACGATTAA

Protein sequence

MSQLVESIKR RVSFKLLACL AVAFVVAGIA GWGTYYSCQK EVVINLDGER LVVKTVKSTV 
KEVLKQSGIN ITEDDYVSVP LDTKLKSKKG NVIDIKKAVP VTVIADGQEF KLMTSKKTVR 
EALEGEPVNL GHLDRVEGAG LDDEIVGGMK LKVVRVKKKL VSENEIIPYN VIKRENGSMD 
KGDYRVIKEG KEGVREKVYV VSYEDGKEVG KQLVSSTVVS EPETRIVEYG TVPVYMTARG 
EKFRYKKVLT MKATAYTASY EDTGKTPDHP EFGITYTGIR AKKGVVAVDP KVIPLGTKLY 
IEGIGGTPDY GFAVAADIGS AVKGNVIDLY MDSRQAVKQW GVKKVRVYIL YD