Gene Moth_2299 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_2299
Symbol
ID	3831331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	2413292
End bp	2414719
Gene Length	1428 bp
Protein Length	475 aa
Translation table	11
GC content	55%
IMG OID	637830219
Product	L-glutamine synthetase
Protein accession	YP_431129
Protein GI	83591120
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0174] Glutamine synthetase
TIGRFAM ID	[TIGR00653] glutamine synthetase, type I

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.00444261
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTAAGA CACCAGGCGA AGTACTTGAG ATGGCCCGAA AGAACAATAT CCAGATGGTC 
GATCTCAAAT TTATCGACCT GCCAGGGACC TGGCAGCACT TCAGTGTGCC CTTAGACGAA 
TTCGATGAAG GCGCTTTTAC CAGCGGCGTG GGTTTTGACG GCTCCAGCAT TCGCGGTTTT 
AAAACCATTA ACGAGAGCGA TATGATCTTA GTTCCCGACC CCGATACCGC CTTTATCGAT 
CCCTTCTGTG ATGTGCCCAC CCTCAGCCTG GTATGCAATG TCTACGACCC TATGACCGGG 
CAGAATTACA ACCGCGATCC CCGGTTTGTG GCCAAAAAGG CTGAAGCCTA TCTAAAGGAG 
ACCGGCATTG CCGATACCAG TTACTGGGGA CCCGAGGCCG AGTTCTTTAT CCTCGATCAT 
GTCCGCTTTG ACCAGAGCCA GTACGCTGGT TACTATTTCC TGGATTCTGA TGAAGGCTTC 
TGGAACTCGG GCGTGGAAAT GAACGGTCAT CCCAACCTCG GCTACCGGCC GCGCTATAAA 
GAAGGTTATT TCCCGGTACC ACCTACCGAC ACCCTGCAAA ACTTGCGGAC GGAGATGGTC 
CTGCTGCTGA AGCAGATGGG CATCGCCGTG GAAGCCCATC ACCACGAGGT GGCTACTGCC 
GGCCAGGGCG AGATCGATAT GAAGTACGCC CCCCTGACCC GGATGGCCGA CCAGCTGATG 
ATGTTCAAAT ATGTGGTCAA GAATGTGGCC ATCAAGCATA ATAAGACGGC TACCTTCATG 
CCCAAACCGG TTTTCCAGGA CAACGGCTCG GGCATGCACG TCCACCAGAG CCTGTGGAAG 
GGTAACGAAC CCCTCTTCTA CGATGCCAAT GGTTATGCGG GGCTTAGCGA ACTGGCCCTG 
TATTATATCG GCGGTTTGTT AAAACACGCC CCCGTCCTGA CGGCCTTCTG CAGCCCGACC 
ACCAACTCCT TCAAACGATT GGTGCCCGGC TTTGAAGCCC CCGTCAACCT GGTTTACTCC 
CAGCGTAACC GCAGCGCGGC CATCCGCATT CCCATGTACT CCAGCAGCCC GGCCGCCAAG 
AGGATCGAAT ACCGGCCGCC CGATCCTTCC TGCAACCCGT ACCTGGCCTT TGCCGCCCTG 
TTAATGGCCG GCCTGGACGG TATTAAGAAC AAGATCCACC CCGGCGAGCC CCTGGATAAA 
GATATCTATG ACCTGCCGCC GGAAGAAGCG GCCAGGGTGA AGTCCCTGCC CGACTCCCTG 
GAGGAAGCCA TCGCCGCCCT GGAAAAAGAC CACGAGTTCC TGCTTCAGGG AGGCGTCTTC 
GACGAGGACC TCATCAACGC CTGGATTGAA TACAAGCAAA AGCGGGAGAT CAACCAGATC 
AAGCTGCGTC CCCATCCCTA TGAGTTCGTT TTGTATTATG ATGTTTAA

Protein sequence

MSKTPGEVLE MARKNNIQMV DLKFIDLPGT WQHFSVPLDE FDEGAFTSGV GFDGSSIRGF 
KTINESDMIL VPDPDTAFID PFCDVPTLSL VCNVYDPMTG QNYNRDPRFV AKKAEAYLKE 
TGIADTSYWG PEAEFFILDH VRFDQSQYAG YYFLDSDEGF WNSGVEMNGH PNLGYRPRYK 
EGYFPVPPTD TLQNLRTEMV LLLKQMGIAV EAHHHEVATA GQGEIDMKYA PLTRMADQLM 
MFKYVVKNVA IKHNKTATFM PKPVFQDNGS GMHVHQSLWK GNEPLFYDAN GYAGLSELAL 
YYIGGLLKHA PVLTAFCSPT TNSFKRLVPG FEAPVNLVYS QRNRSAAIRI PMYSSSPAAK 
RIEYRPPDPS CNPYLAFAAL LMAGLDGIKN KIHPGEPLDK DIYDLPPEEA ARVKSLPDSL 
EEAIAALEKD HEFLLQGGVF DEDLINAWIE YKQKREINQI KLRPHPYEFV LYYDV