Gene Moth_0603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0603
Symbol	glyQ
ID	3830988
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	626030
End bp	626989
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	60%
IMG OID	637828544
Product	glycyl-tRNA synthetase subunit alpha
Protein accession	YP_429476
Protein GI	83589467
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0752] Glycyl-tRNA synthetase, alpha subunit
TIGRFAM ID	[TIGR00388] glycyl-tRNA synthetase, tetrameric type, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAATTTCC AGGAACTCAT AATGACCCTG CAGCGGTTCT GGGCAGAACA AAACTGCGTC 
ATCCAGCAGC CCTATGACCT GGAAAAAGGC GCCGGTACCA TGAACCCGGC CACTTTTTTA 
CGCGTCCTGG GGCCGGAGCC CTGGCGGGTA GCCTACGTGG AGCCTTCCCG GCGGCCGACA 
GACGGCCGCT ACGGGGAGAA CCCCAACCGC CTCCAGCACT ACTACCAGTA CCAGGTAATC 
TTAAAACCGT CGCCGGATAA CGTCCAGGAT CTTTACTTAC AGAGCCTGGA AGCCATGGGC 
ATCAATCCCC TGGAACACGA CATCCGTTTT GTTGAAGATA ACTGGGAGTC CCCCACCCTG 
GGGGCCTGGG GCCTGGGCTG GGAGGTGTGG CTGGACGGCA TGGAGATAAC CCAGTTTACA 
TACTTCCAGC AGTGCGGCGG TTTTGACTGC CATCCCGTTA GCGCCGAAAT CACCTACGGC 
CTGGAGCGCC TGGCCATGTA TATCCAGCAG GTCAACAGCG TCTACGACAT TGAGTGGGTG 
GACGGCATCA CCTACGGCGA TATACATCAC CAGACGGAAG TCGATTACTC CCACTACAAC 
TTCACCTTTG CCGACACCGC CATGCTCTTC AACCTTTTTA ACGCCTATGA GGCCGAAGCT 
ATGCGGGTGG TCGAACAGGG CCTGGTCCAG CCAGCCTATG ATTACACCCT CAAGTGCTCC 
CACACCTTTA ACCTCCTGGA CGCCCGCGGG GCTATCAGCG TCACCGAGCG GACGGCCTAC 
ATTGGCCGGG TGCGCCACCT GGCCCGCCTC TGTGCCGCCG CCTACCTGGA ACAGCGGCAA 
AAGCTCGGCT ATCCCCTGTT AAAAGCTAGG CAGCAACAGC CCGAAGCCCC TGCACCTGGG 
CCGGCAGCCG TGGTGGGCGG CCGGGACCGC AAGGACGCCT GCGATGTGAA GGAGGGATAG

Protein sequence

MNFQELIMTL QRFWAEQNCV IQQPYDLEKG AGTMNPATFL RVLGPEPWRV AYVEPSRRPT 
DGRYGENPNR LQHYYQYQVI LKPSPDNVQD LYLQSLEAMG INPLEHDIRF VEDNWESPTL 
GAWGLGWEVW LDGMEITQFT YFQQCGGFDC HPVSAEITYG LERLAMYIQQ VNSVYDIEWV 
DGITYGDIHH QTEVDYSHYN FTFADTAMLF NLFNAYEAEA MRVVEQGLVQ PAYDYTLKCS 
HTFNLLDARG AISVTERTAY IGRVRHLARL CAAAYLEQRQ KLGYPLLKAR QQQPEAPAPG 
PAAVVGGRDR KDACDVKEG