Gene Cthe_0686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_0686
Symbol
ID	4810304
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	+
Start bp	845641
End bp	846630
Gene Length	990 bp
Protein Length	329 aa
Translation table	11
GC content	42%
IMG OID	640106103
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_001037114
Protein GI	125973204
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAAGAAAG GTACTATTTT GAGCGGCATG AGACCTACCG GAGCTTTGCA TCTTGGCAAT 
TATTTCGGAG CTCTGGAAAA CTGGGTAAAA CTTCAGGATG AATACGAGTG TTATTTTTTT 
GTGGCTGATT GGCATGCCCT TACAACAGGA TATGAAGATA CATCTCAAAT CAAAAATAAT 
ATAAATGACC TTGTTATAGA TTGGCTAAGT GCAGGACTTG ACCCTGAAAA ATGCGTCATA 
TTTTTGCAGT CAAGTATAAA AGAACATGCA GAGCTTCATC TGTTGTTTTC CATGACAACG 
CCTCTTTCCT GGCTGCTTCG CTGTCCGACA TACAAGGATC AGATTAATCA ATTGAAGGAC 
AAGAATATTA CGACCTACGG ATTTTTAGGA TATCCGTGTC TTCAGGCAGC CGACATATTA 
ATTTACAAAG CCGGTTTTGT ACCTGTGGGA GAAGACCAGC TTCCGCACCT TGAGTTGACG 
AGGGAAATTG CAAGAAGATT TAATTATTTG TTTGGCGAGG TATTCCCTGA GCCGCAGGCA 
ATTTTGACCA AGGCAAAAGT ATTGCCCGGA ACCGACGGCA GAAAGATGAG CAAAAGCTAT 
GGCAATACCA TAGCTCTGTC CGACAGTCCC GATACAATCA GAAAGAAAGT CAGCTCAATG 
ATAACCGACC CTGCAAGAAT CAGAAAGGAC GATCCCGGTC ATCCCGAGGT GTGTACGGTA 
TTTTCCTTCC ACAAAGTATT TAATGAAAAT GAAGTGCCTG AAATTGAGCA GCACTGCAGA 
GGCGGAAAAA TTGGGTGTGT GCAATGTAAA AAGAACCTTG CTGACAAAAT GGTGGAGCAT 
TTGGAGCCCA TATATGAAAA AAGGCAAAAG ATAGTTGAAA ATCCGTCCAT AGTCAAAGAA 
ATTCTCGCAG ACGGAAATGA AAAAGCCAGA AAGGTTGCGC AAAAGACTCT TGAAGAAGTA 
CGAAAAGCCA TGAAAATAGA TTTTATTTAG

Protein sequence

MKKGTILSGM RPTGALHLGN YFGALENWVK LQDEYECYFF VADWHALTTG YEDTSQIKNN 
INDLVIDWLS AGLDPEKCVI FLQSSIKEHA ELHLLFSMTT PLSWLLRCPT YKDQINQLKD 
KNITTYGFLG YPCLQAADIL IYKAGFVPVG EDQLPHLELT REIARRFNYL FGEVFPEPQA 
ILTKAKVLPG TDGRKMSKSY GNTIALSDSP DTIRKKVSSM ITDPARIRKD DPGHPEVCTV 
FSFHKVFNEN EVPEIEQHCR GGKIGCVQCK KNLADKMVEH LEPIYEKRQK IVENPSIVKE 
ILADGNEKAR KVAQKTLEEV RKAMKIDFI