Gene Moth_1709 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1709
Symbol
ID	3833159
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1745040
End bp	1746281
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	56%
IMG OID	637829634
Product	tyrosyl-tRNA synthetase
Protein accession	YP_430554
Protein GI	83590545
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0162] Tyrosyl-tRNA synthetase
TIGRFAM ID	[TIGR00234] tyrosyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.0000000000941896
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.172619
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCATGATT ATTTCGGAGG ATGGTTTAAG TTGGAACAAG AAGTCGCACG GCAGTTAAGG 
ATCCTCCGCC GGGGAGTGGC TGAGATTGTG CCTGAGGAGG ATTTGCAGGC CAAACTCAGA 
AAATCCCTGG CCACCGGTAA ACCCTTAAAG GTTAAACTGG GTTTAGACCC TACGGCCCCG 
GATATTCATC TGGGTCATAC GGTGGTGCTC CAGAAACTGC GCCAGTTTCA GGAATTGGGC 
CACCAGGTGA TAATCATCAT CGGCGATTTT ACCGGGCGTA TAGGCGATCC CACCGGTAAA 
TCGGAAACCA GGCGCCAGCT TACAGAAGCA GAAATCCTGG CCAATGCCGA AACCTATAAG 
GAACAGATTT TTAAAGTACT GGACCCAGAG CAAACCCGGG TGACCTTTAA CAGCCACTGG 
CTGGGCAAGC TTACCTTTGC CGAAGTCATT GAACTGGCAG CTAGGACGAC GGTGGCCCGC 
ATGCTGGAGC GGGACGATTT TGCCCGCCGG TTCCAGGAAA ATCGTCCTAT CAGCATCCAT 
GAGTTTTTTT ACCCCCTGAT GCAGGGTTAT GATTCCGTGG CCCTGGCTGC AGATGTCGAA 
CTTGGGGGTA CGGATCAGAA GTTTAACCTC CTTATGGGCC GTCACCTGCA GCGTGAATAT 
GGCCAGGAGC CCCAGGTGGC CATGATGATG CCCATCCTCC CCGGCCTGGA CGGCGTACAG 
AAGATGAGCA AGAGCCTGGG GAACTATATC GGTATCAAGG AATCCCCCCG GGAGATGTAC 
GGTAAGACCA TGTCCCTCCC TGATGAACTC ATGCTCACCT ATTACGAGCT GGTGACGGCA 
GTGCCCCTGG AGGAGCTGGC AGCCATCAGG CAGGGCCTGG CCAGCGGCAG CCTGCACCCC 
AGGGATGCCA AAATGCGCCT GGCCCGGGAG ATAGTAGCCA TGTATCACAC TCCGGAAGCG 
GCCCTGGAGG CGGAGAGGGA ATTTCGCCAG GTCTTCCAGC AGCATGACCT GCCTGATGAT 
ATGCCGGAAT TAACGATTAA AGAAGACAGG GTGTGGCTGC CCCGGCTCAT GGTCCAGGCC 
GGGCTGGCTC CCAGCACCAG CGAGGCCCGG CGCCTGATCC GCCAGGGTGC AGTAAAGATC 
GACGGTGAAC GGGTAACCGA TCCTGACACC GAGGTTGAGG TCAGGGAGGG CCAGGTCCTC 
CAGGCCGGTA AACGTAAATT TGCCCGGCTG CACACATTTT AA

Protein sequence

MHDYFGGWFK LEQEVARQLR ILRRGVAEIV PEEDLQAKLR KSLATGKPLK VKLGLDPTAP 
DIHLGHTVVL QKLRQFQELG HQVIIIIGDF TGRIGDPTGK SETRRQLTEA EILANAETYK 
EQIFKVLDPE QTRVTFNSHW LGKLTFAEVI ELAARTTVAR MLERDDFARR FQENRPISIH 
EFFYPLMQGY DSVALAADVE LGGTDQKFNL LMGRHLQREY GQEPQVAMMM PILPGLDGVQ 
KMSKSLGNYI GIKESPREMY GKTMSLPDEL MLTYYELVTA VPLEELAAIR QGLASGSLHP 
RDAKMRLARE IVAMYHTPEA ALEAEREFRQ VFQQHDLPDD MPELTIKEDR VWLPRLMVQA 
GLAPSTSEAR RLIRQGAVKI DGERVTDPDT EVEVREGQVL QAGKRKFARL HTF