Gene Moth_2105 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2105
Symbol	guaA
ID	3832472
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2198413
End bp	2199963
Gene Length	1551 bp
Protein Length	516 aa
Translation table	11
GC content	60%
IMG OID	637830030
Product	GMP synthase
Protein accession	YP_430940
Protein GI	83590931
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0518] GMP synthase - Glutamine amidotransferase domain [COG0519] GMP synthase, PP-ATPase domain/subunit
TIGRFAM ID	[TIGR00884] GMP synthase (glutamine-hydrolyzing), C-terminal domain or B subunit [TIGR00888] GMP synthase (glutamine-hydrolyzing), N-terminal domain or A subunit

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0748059
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGGAG AAAACAAACA GCTTGCAGAA ATAGTACTGG TGCTGGATTT CGGCGGCCAG 
TACAACCAGT TGATCGCCCG GCGGGTCCGC GAAGCCGGGG TTTACTCGGA GATGATACCC 
TATAACACGC CCCTGGAAAA GATCCTGGCC CGGCGACCCC GGGGGATTAT TTTTTCCGGC 
GGGCCGGCCA GCGTCTATAG CCTCGGGGCA CCCCGTATCG ACCGGGCCCT CTATGAAAGC 
GGCATTCCCA TTTTGGGCAT CTGTTATGGT ATGCAGCTCA TGGCCCATGA CCTGGGCGGT 
AGGGTAGAGG GGGCCTCGGG ACGGGAGTAT GGTAAAACCC AGCTGGAAAT AACAGCAGCA 
GATCCCCTTT TCGCCGGTTT ACCTGAAAGT ATACAGTGCT GGATGAGCCA CGGCGACTAT 
ATCAGCGCCC CGCCGCCTGG CTTCCAGGTG ACGGCCCGCT CGGCCTATAC CCCGGTGGCG 
GCTATGAGCG ACCCGGCCAG GAAGCTTTAT GGCGTTCAGT TTCACCCGGA AGTAAAGCAT 
ACTCCCATGG GGCAGGAGAT ACTGCGTCGT TTTCTCTTCC AGGTATGCGG CTGCCGGGGT 
GACTGGTCGG TGAGTTCCTT CATTGAAGAC CAGGTGGCGG CCATTCGCCG GCAGGTAGGT 
AACGGCCGGG TCCTCTGCGC CCTGAGCGGC GGGGTCGATT CCTCGGTGGC TGCGGCCCTG 
GTCCACCGGG CCGTCGGCGA CCGCTTGACC TGCGTGTTTG TTAACCACGG TCTCCTGCGC 
CAGGGGGAGG CCGAACAGGT GCAGCGGGCC TTTGGCCAGG CCATGGGCAT GAACATCGTC 
TATGTCGATG CCAGCCGGCG TTTCCTGGAG AAACTCACCG GCGTTACAGA CCCGGAAGAA 
AAGCGCAAAA TTATCGGCCA TGAATTTATC CGGGTCTTTG AGGAGGAAGC CAGGAAACTG 
GGACGGGTGG ATTTCCTGGT CCAGGGCACC CTTTACCCCG ATGTCATTGA GAGCGGTACC 
GAAACGGCCG CCGTCATCAA GAGCCACCAT AACGTCGGTG GCCTGCCGGA AGATATGGAA 
CTGGAATTAA TTGAACCCCT GCGCCTTTTA TTTAAGGACG AAGTGCGCCG GGTAGGGGAG 
GAACTGGGCC TGCCGGAGGA GATTGTCTGG CGGCAACCCT TCCCGGGGCC GGGCCTGGCT 
ATCCGCATCC TGGGGGAAGT CACCCCGGAG AAACTGGAAA TCTTACGTCA GGCTGACGCC 
ATTGTCACCG AGGAGATCCG GCGAGCCGGC CTCTACCGGG AAATCTGGCA GTCCTTTGCG 
GTATTGCCCT CCATGAAGAG TGTGGGTGTT ATGGGCGACG AGCGGACCTA TGCCTACCCC 
ATCGTCCTGC GGGCCGTGAC CAGCGATGAC GCCATGACTG CCGACTGGGC CAGGCTCCCC 
TACGACCTCC TGGAGCGTAT CTCCTCCCGG ATCGTCAACG AGGTGCGTCA TATCAACCGG 
GTCGTTTACG ACATCACTTC CAAACCCCCG GCGACCATAG AGTGGGAGTA G

Protein sequence

MIGENKQLAE IVLVLDFGGQ YNQLIARRVR EAGVYSEMIP YNTPLEKILA RRPRGIIFSG 
GPASVYSLGA PRIDRALYES GIPILGICYG MQLMAHDLGG RVEGASGREY GKTQLEITAA 
DPLFAGLPES IQCWMSHGDY ISAPPPGFQV TARSAYTPVA AMSDPARKLY GVQFHPEVKH 
TPMGQEILRR FLFQVCGCRG DWSVSSFIED QVAAIRRQVG NGRVLCALSG GVDSSVAAAL 
VHRAVGDRLT CVFVNHGLLR QGEAEQVQRA FGQAMGMNIV YVDASRRFLE KLTGVTDPEE 
KRKIIGHEFI RVFEEEARKL GRVDFLVQGT LYPDVIESGT ETAAVIKSHH NVGGLPEDME 
LELIEPLRLL FKDEVRRVGE ELGLPEEIVW RQPFPGPGLA IRILGEVTPE KLEILRQADA 
IVTEEIRRAG LYREIWQSFA VLPSMKSVGV MGDERTYAYP IVLRAVTSDD AMTADWARLP 
YDLLERISSR IVNEVRHINR VVYDITSKPP ATIEWE