Gene Moth_1764 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1764
Symbol
ID	3831056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1819191
End bp	1820519
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	57%
IMG OID	637829689
Product	L-glutamine synthetase
Protein accession	YP_430608
Protein GI	83590599
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0174] Glutamine synthetase
TIGRFAM ID	[TIGR00653] glutamine synthetase, type I

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.705801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGGATA GCCGGGAAGC GATTTTACAG AAAGCTACCG ACCTGGGAGT CAAGTTTATT 
CGCCTCCAGT TTACCGATAT CTTTGGGGTG CTGAAAAATG TCGCCATCAC CCTGGACCAG 
CTTCCCAAAG CCCTCAATAA CGAGTTGATG TTCGACGGGT CCTCTATTGA GGGTTTCGTC 
CGGATTGAAG AATCTGATAT GTACCTGCGC CCGGACCCAT CCACCTTTAC CATCTTTCCC 
TGGAAGCCCA ATGGCGACGC CGTGGCGCGG TTGATCTGCG ACGTTTATAA TGCCGACGGC 
ACGCCTTTTA TCGGGTGCCC ACGCGGGACC TTAAAGCGGG TTATCGCTGA AGCCGAGGCC 
CTGGGTTATA CCATGAATGT CGGCCCGGAG GCGGAGTTTT TCCTCTTCCA TACCGACGCC 
ACCGGCCGGC CGACCCTGGA AACCCACGAT CGGGCCGGTT ATTTTGACCT GACCCCGGTA 
GACCTGGGGG AAGACGCCCG GAGGGATATG GTCCTGACCC TGCAGCAGAT GGGGTTTGAA 
ATCGAGGCCT CCCACCATGA GGTGGCTCCC GGCCAGCATG AGATAGATTT TAAATACGCC 
GACGCCTTAA GGACGGCCGA CAATATCGCT ACTTTCAAGT TTGTGGTGCG GACCATCGCC 
CAGCGCCACG GCCTCCATGC CACCTTTATG CCCAAGCCCA TTTACGGCAT TGCCGGTTCG 
GGCATGCACT GCAATATCTC TCTTTTCCGC GCCGGCCAAA ATGCCTTTTA CGACCCTGAC 
GACGATCTCC AGCTGAGCCA GGTTGCCTAC TACTTTATCG GCGGCCTGAT AGCCCACGCC 
CGGGGCATGA CGGCAATTAC CAATCCCACT GTTAACTCAT ACAAGCGTCT GGTACCTGGT 
TACGAAGCCC CGGTGTATAT AGCCTGGTCA CCTCAAAACC GTAGCCCCCT GATCCGTATC 
CCCGCCAAGC GGGGCCTGTC AACGCGGCTG GAGGTACGCC ATCCCGACCC CTCGACCAAC 
CCCTACCTGG CCATTGCCGT CATGTTGAAG GCCGGCCTGG ACGGCATTAA GAACCGTATC 
CAACCGCCGG CGCCCATCAA TGCCAATATT TTTGACATGG AAGCGACTAG ACTACGGGCC 
GAAGGTATCG ACCTCCTGCC GGGCACCCTG GATGAAGCCC TGGATGCATT AGAAAAAGAC 
CCCGTTATCC GCGAGGCCCT GGGGCCCCAT ATCTACCAGC GGTTCATGGA GGCGAAACGC 
ATCGAATGCG AGGAGTACCG CACCCGGGTG CACCAGTGGG AAATCGAACA TTACCTGACT 
AAGTTCTAA

Protein sequence

MVDSREAILQ KATDLGVKFI RLQFTDIFGV LKNVAITLDQ LPKALNNELM FDGSSIEGFV 
RIEESDMYLR PDPSTFTIFP WKPNGDAVAR LICDVYNADG TPFIGCPRGT LKRVIAEAEA 
LGYTMNVGPE AEFFLFHTDA TGRPTLETHD RAGYFDLTPV DLGEDARRDM VLTLQQMGFE 
IEASHHEVAP GQHEIDFKYA DALRTADNIA TFKFVVRTIA QRHGLHATFM PKPIYGIAGS 
GMHCNISLFR AGQNAFYDPD DDLQLSQVAY YFIGGLIAHA RGMTAITNPT VNSYKRLVPG 
YEAPVYIAWS PQNRSPLIRI PAKRGLSTRL EVRHPDPSTN PYLAIAVMLK AGLDGIKNRI 
QPPAPINANI FDMEATRLRA EGIDLLPGTL DEALDALEKD PVIREALGPH IYQRFMEAKR 
IECEEYRTRV HQWEIEHYLT KF