Gene Moth_1294 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1294
Symbol
ID	3831557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1334225
End bp	1335559
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	59%
IMG OID	637829231
Product	L-glutamine synthetase
Protein accession	YP_430151
Protein GI	83590142
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0174] Glutamine synthetase
TIGRFAM ID	[TIGR00653] glutamine synthetase, type I

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0180309
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGACA AAGAAAAGAG AGCAGCGGTC CTGCAACAGG CCGAGGAATG GGGGGTCAAG 
TTTGTCCGCC TCCAGTTTAC GGACATCTTT GGCGTACTCA AAAACGTAGC CATTCCCGTG 
GACCAGCTCC CCAAGGCCCT CAATAACGAG CTGATGTTCG ACGGATCTTC AATTGAAGGG 
TTCGTTCGCA TTGAGGAGTC CGATATGTAC CTGCGGCCGG ACCCGGATAC CTTTGTTGTT 
TTTCCCTGGC GGCCCCATGA GGGTTCAGTG GCCCGGCTGA TCTGTGATGT CTACAACCCC 
GACGGCACGC CCTTCGCCGG TTGCCCCCGC TCCACCTTAA AAAGGGTAAT GGCCGAAGCG 
GCGGAAATGG GCTTTACCAT GAATGCCGGG CCGGAGGCCG AGTTTTTCCT CTTCCACACC 
GACGCCGACG GCCGCCCGAC CCTGGAGACC CAGGACCGCG CCGGTTACTT TGACCTGACT 
CCGGTGGATC TGGGTGAAGA CGCTCGCCGG GATATGGTCC TGACCCTGGA GCAAATGGGC 
TTTGAGATCG AGGCCTCCCA CCATGAAGTG GCTCCCGGGC AGCACGAGAT TGATTTCAAA 
TATGCCGAGG CCCTGACTAC CGCCGACCGG ATCGCTACCT TTAAATTTGT GGTCCGGACC 
ATCGCCCAGC GGCATGGCCT CCACGCCACC TTTATGCCCA AACCCATCTA CGGCATCAAC 
GGTTCCGGTA TGCATGCCAA CCTTTCCTTA TCTAAAGACG GTAAAAACGC TTTTGACGAT 
CCCTCTGATG AACTGGGCTT AAGCCAGGTG GCCTACCATT TTATCGCCGG CATCATGGCC 
CATGCCCGTG CCCTGACGGC CGTTACCAAC CCCACGGTTA ACTCCTACAA GCGCCTGGTG 
CCGGGTTACG AGGCGCCGGT ATACATCGCC TGGTCGCCGC GCAACCGGAG CCCCTTGATC 
CGGGTACCGG CCAAGCGGGG GGCCTCCACC CGGATTGAAG TGCGTCACCC GGACCCCTCC 
TGCAACCCCT ACCTGGCCCT GGCTGTTCTC TTGAAGGCCG GTCTCGATGG TATCAAAAAG 
GGCCTGACAC CACCGCCGCC GACGGATAAA AACATCTTTG CTATGACCCC GGCGGAGCTT 
AAGGCAGAAG GAATCGGCGT CCTGCCCGGC AGCCTGGAGG AGGCCCTGGC GGCCTTGGAG 
CAAGATGAAG TCATCCGCGA GGCCCTGGGA CCCCATATCT ACGAACGCTT GACCCTGGCT 
CAAAAGATGG AATGCGAGGA GTATCGCACC CGGGTCCACC AGTGGGAGAT TGACCAGTAC 
TTGACTAAAT TTTAA

Protein sequence

MDDKEKRAAV LQQAEEWGVK FVRLQFTDIF GVLKNVAIPV DQLPKALNNE LMFDGSSIEG 
FVRIEESDMY LRPDPDTFVV FPWRPHEGSV ARLICDVYNP DGTPFAGCPR STLKRVMAEA 
AEMGFTMNAG PEAEFFLFHT DADGRPTLET QDRAGYFDLT PVDLGEDARR DMVLTLEQMG 
FEIEASHHEV APGQHEIDFK YAEALTTADR IATFKFVVRT IAQRHGLHAT FMPKPIYGIN 
GSGMHANLSL SKDGKNAFDD PSDELGLSQV AYHFIAGIMA HARALTAVTN PTVNSYKRLV 
PGYEAPVYIA WSPRNRSPLI RVPAKRGAST RIEVRHPDPS CNPYLALAVL LKAGLDGIKK 
GLTPPPPTDK NIFAMTPAEL KAEGIGVLPG SLEEALAALE QDEVIREALG PHIYERLTLA 
QKMECEEYRT RVHQWEIDQY LTKF