Gene Cthe_2096 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cthe_2096
Symbol
ID	4810956
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Clostridium thermocellum ATCC 27405
Kingdom	Bacteria
Replicon accession	NC_009012
Strand	-
Start bp	2491872
End bp	2493836
Gene Length	1965 bp
Protein Length	654 aa
Translation table	11
GC content	45%
IMG OID	640107503
Product	methionyl-tRNA synthetase
Protein accession	YP_001038496
Protein GI	125974586
COG category	[J] Translation, ribosomal structure and biogenesis [R] General function prediction only
COG ID	[COG0073] EMAP domain [COG0143] Methionyl-tRNA synthetase
TIGRFAM ID	[TIGR00398] methionyl-tRNA synthetase [TIGR00399] methionyl-tRNA synthetase C-terminal region/beta chain

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGATAGAA AGACTTTTTA CATTACAACG CCCATTTATT ACCCGAGCGA CAAGTTACAT 
ATAGGCCACT CATACACTAC TGTTGCGGCG GATGCCGTGG CAAGATACAA AAGGCTGAAA 
GGTTACGATG TAATGTTTCT TACGGGAACG GATGAGCATG GACAGAAGAT TGAACGCAAG 
GCGAAGGAAA AGGGAGTTAC CCCGAAACAG TATGTGGATG AAATTGTGGC CGGAATCAAG 
GAACTGTGGA AGCTTTTGAA AATAACCAAC GACAGGTTTA TCAGAACGAC GGATCCCCAC 
CATGAGAAGA CTGTGCAGAA GATATTTAAA AAGCTCTACG ACCAGGGAGA TATTTACAAG 
AGTGAATATG AAGGCTGGTA TTGCACTCCT TGTGAGTCTT TCTGGACGAA GACACAGCTG 
GTTGACGGAA AATGTCCCGA CTGCGGAAGG GAAGTGGAAC TTACAAAAGA GGAGAGCTAT 
TTCTTCAGGC TTTCCAAATA TCAGGACCGG CTGATAAAAC ATATCGAGGA GAATCCGGAT 
TTTATACAGC CTGTTTCCAG ACAGAACGAG ATGCTGAACA ATTTCTTAAG GCCGGGGCTT 
GAAGACCTTT GCGTGTCCAG AACCACCTTT GACTGGGGAA TACCGGTGTC CTTTGATGAC 
AAGCACGTGG TATATGTTTG GATTGACGCC CTTTCCAACT ATATTACCGC CCTTAACTAC 
ATGTCCGAGG ACGATTCGGA TTACCGCAAG TACTGGCCTG CGGATGTTCA TCTTGTGGGA 
AAGGAAATAG TGCGTTTCCA CACCATCATA TGGCCTGCAA TGCTCATGGC TTTGGGTGAG 
CCTTTGCCGA AGCAGGTATT TGGCCATGGC TGGCTCCTTC TTGAGGGCGG AAAAATGTCC 
AAGTCCAAGG GAAATGTGGT CGATCCTGTT GTGCTTGTTG AAAAGTACGG TGTTGACGCG 
ATAAGGTATT TCCTCTTAAG AGAGGTTCCT TTCGGTTCGG ACGGAGTATT TTCAAATGAA 
GCATTGATAA ACAGGATTAA TTCAGACTTG GCAAACGACC TTGGAAATCT TGTCAGCAGG 
ACCGTTGCCA TGATTGACAA ATATTTTGGA GGGAAGCTGC CGCAGGAAAG ACAGGCGGGA 
GAATTTGACG ACGACCTTAT AAAGACTGTG ACGGATACAC CTCAAAAGGT TGAGGAACTG 
CTTGACCGTT TGCAGTTCAG TACGGCGCTT ACTGAAATCT GGAAAGCCAT TTCCAGAACC 
AACAAGTATA TTGACGAGAC AATGCCGTGG GCACTGGCAA AAAGTGAAGA AAACAAGGCA 
AGACTTGCCG CTGTTTTATA CAATCTTGCG GAAAGTATCA GAATAGTTTC CATACTCATA 
CAGCCGTTTA TGCCTGAAAC TCCTGAAAAG ATATGGCATC AGCTGGGTAT AAACGACAAA 
AAGTATGTGG AGTGGGAAAC TGCAAAGAAA TGGGGAGTAT ATCCTGAAGG TGCCGCTGTG 
AACAAAGGAG AACCCTTGTT CCCGAGAATT GATGTTAAGA AAGAGCTGGA GGAATTGGAA 
AAGCTCACTT TGGCTGCGGC TGAAAATAAG GAAAAGCAAT CACCGAAGCA GGAAACGGAG 
AAAAAGGATG CGGAAAAGAA TGAATATATC ACCATAGAGG ATTTTGAGAA GCTGGATTTG 
AGGGTTGGCA AGGTTCTTGA GGCTCAGAAG GTTGAAAATG CCGACAAGTT GCTGAAACTA 
AAGATTGAAG TTGGCAATGA AGTACGCCAG GTGGTGTCCG GTATTGCAAA GTACTACTCT 
CCGGAGGAAT TAAAGGGTAA ATACGTTGTG CTGGTGGCAA ACTTAAAGCC GGTAAAACTC 
AGGGGAATAG AGTCGCAGGG TATGATTCTT GCCGCTTCGG ATGACAAGGA CCTGGTACTG 
GTGACGATTG ACAAAGAGAT AAACAGCGGA ACCAAGGTTC AGTAA

Protein sequence

MDRKTFYITT PIYYPSDKLH IGHSYTTVAA DAVARYKRLK GYDVMFLTGT DEHGQKIERK 
AKEKGVTPKQ YVDEIVAGIK ELWKLLKITN DRFIRTTDPH HEKTVQKIFK KLYDQGDIYK 
SEYEGWYCTP CESFWTKTQL VDGKCPDCGR EVELTKEESY FFRLSKYQDR LIKHIEENPD 
FIQPVSRQNE MLNNFLRPGL EDLCVSRTTF DWGIPVSFDD KHVVYVWIDA LSNYITALNY 
MSEDDSDYRK YWPADVHLVG KEIVRFHTII WPAMLMALGE PLPKQVFGHG WLLLEGGKMS 
KSKGNVVDPV VLVEKYGVDA IRYFLLREVP FGSDGVFSNE ALINRINSDL ANDLGNLVSR 
TVAMIDKYFG GKLPQERQAG EFDDDLIKTV TDTPQKVEEL LDRLQFSTAL TEIWKAISRT 
NKYIDETMPW ALAKSEENKA RLAAVLYNLA ESIRIVSILI QPFMPETPEK IWHQLGINDK 
KYVEWETAKK WGVYPEGAAV NKGEPLFPRI DVKKELEELE KLTLAAAENK EKQSPKQETE 
KKDAEKNEYI TIEDFEKLDL RVGKVLEAQK VENADKLLKL KIEVGNEVRQ VVSGIAKYYS 
PEELKGKYVV LVANLKPVKL RGIESQGMIL AASDDKDLVL VTIDKEINSG TKVQ