Gene Moth_1850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1850
Symbol
ID	3831711
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1908171
End bp	1910243
Gene Length	2073 bp
Protein Length	690 aa
Translation table	11
GC content	65%
IMG OID	637829782
Product	4-alpha-glucanotransferase
Protein accession	YP_430693
Protein GI	83590684
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1640] 4-alpha-glucanotransferase
TIGRFAM ID	[TIGR00217] 4-alpha-glucanotransferase

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGGAA CCTTGTCAGA TAAAGAGTTG CGTCTTTTGC ACCGACTATG CCGGTGGTAC 
GGCGTGGAGC CTGCCTATCG CGATGGGGAG GGTAAACTCA GGAGGGCCGG GCCGGAGTCG 
TTGCTGGCGG TATTGCGGGC CCTGGGGGCA CCGGTGGCAG GCCTGGCTGA CCTTCCCGGT 
GCCCTCCGGG AGCGGCGGCA GCAATACTGG CGGCGCTGTT GTGAGCCGGT AGCCGTAGCC 
TGGGCCGGCC GGTTGTCGCA TATGGAACTG CGTCTCCCGG CCGGTCGGGC AACCGGGCCC 
CTGGAGTGCC GGCTGCGGCT GGAAGACGGC CGGGTATGGC GGATGGTAAT CGATCCGGGT 
AGCCTGCCCC TTCTCCGGAC TACCGTTGTG GAAGGGGTAG CCTTTGAGGC CAGGCAGCTC 
ACCCTTCCCG CCAGGCTGCC CTGGGGCTAC CATCACCTCC ATCTGCGCCT GCCGGGCCTT 
ACCCGGGAGG TATTGCTTAT TGCCGCCCCC TCCCGGGCCG GTGCCCCGCT AACAGGCCAG 
GGGGAACACC TCTGGGGGTG TTTTTTACCC CTCTATGCCC TCCATTCCCA CCGTAGCCTG 
GGGGCCGGGG ATTTTGGCGA CCTGGAGGCT CTATCCCTCT GGGTCAACAG CATGGGGGGC 
AGTTTTACCG GCACCCTGCC CTTCCTGGCG GCCTTCCTGG ACGAGCCCTT TGCCCCCAGT 
CCCTATCAGC CGGTTAGCCG CCTCTTCTGG AATGAGTTTT ACCTGGATAT TTCCCGTCTG 
GAAGAGGTGC AGCAGTGCCG GGAAGCCCGG GATTTTCTAA ACTCGGCGGC GGTGCAGAAG 
GAGATAGCCG CTTTACGGGC CGCTCCCCTG GTAGACTACC GCCGGGGGAT GGCCCTGAAA 
AGACGCCTGT TAGCTCTCTG CGCCCGTACC TTTTTTACCG GTGCTCCCGG CCGGAGGGAA 
GAGATGGCGG CCTGGCTGGC CGGCAACCCG GCGGCCCGGG ACTACGCCCG CTTCCGGGCC 
GCCGTCGAGA AACAGCACGC CACCTGGCCG GAGTGGCCGG CCCCGATGCG GGATGGTAAC 
CTCGGCGAGG GAGATTACGA TCCGGAAGCC ATGCAGTACC ACCTGTACGT CCAGTGGCAG 
GCCCACCGAC AGGTGCAGGC CCTGGCAGCC CGCGCCCGGC GCTCCGGTCC GGGTTTATAC 
CTGGACCTGC CCCTGGGAGT CCACCGGGAG GGTTATGATG TCTGGCGTCA TCGCCGGGCC 
TTCGCCCTGG CGGCCAGCAG CGGGGCCCCA CCGGATGCCC TCTTCCGCCG GGGTCAGGAC 
TGGGGGTTTC CCCCCTTCCA CCCTGAGGGA ATCCGGGAAG ACGGTTATCA CTATTACATC 
GCCTGCCTGC GCCATCACCT GCGCCACGCC GGCATCCTGC GCCTGGATCA CGTCATGGGG 
TTGCACCACC TCTACTGGAT ACCCCGCGGC CTGGCGGCCA CGGAGGGGGT TTATGTGCGC 
TATCACGCCG GGGAATTTTA CGCCATCCTG TCCCTGGAAT CCCGGCGCCA CGGGGCCCTC 
CTGGTGGGGG AAGACCTGGG GACGGTGCCA GCTTACGTGC GCCGGGCCAT GACCAGGCAC 
AATATCAGCC GCATGTATAT CTTGGCCGTA GAGTATACCG GGAAAACGGG CCGGGCCCTG 
GGACCGGTGC CCCCAGAGAG CCTGGCCGGC CTGAATACCC ACGACATGCC GCCCTTTGCT 
GCCTTCTGGC GGGAAAGGAA AAAGAACAGC CGCCAGCTGG CGGCCCTGCC TGTCTTCCTT 
TATAACCGGG GTCGCCTGGA AGTGCCAACG ACGGCGACCA GAAGCCTTCT AAGGGGCTGC 
CTGGCGTACC TGGCCGCCAG CCCGGCGCGT TTGTTGCTGG TAAACCTGGA GGATCTGTGG 
CTGGAGACGG AACCCCAGAA TATCCCCGGC ACAAGCACCG AGTACCCCAA CTGGCGGCGT 
AAGGCCCGCT ACAGCCTGGA GGAGTTCAGC CGGCAGCCAG GAGTAGTGGC TCTCCTGCGG 
GAGGTTAACT ACTGGCGAGG TACAGCTAAA TAA

Protein sequence

MDGTLSDKEL RLLHRLCRWY GVEPAYRDGE GKLRRAGPES LLAVLRALGA PVAGLADLPG 
ALRERRQQYW RRCCEPVAVA WAGRLSHMEL RLPAGRATGP LECRLRLEDG RVWRMVIDPG 
SLPLLRTTVV EGVAFEARQL TLPARLPWGY HHLHLRLPGL TREVLLIAAP SRAGAPLTGQ 
GEHLWGCFLP LYALHSHRSL GAGDFGDLEA LSLWVNSMGG SFTGTLPFLA AFLDEPFAPS 
PYQPVSRLFW NEFYLDISRL EEVQQCREAR DFLNSAAVQK EIAALRAAPL VDYRRGMALK 
RRLLALCART FFTGAPGRRE EMAAWLAGNP AARDYARFRA AVEKQHATWP EWPAPMRDGN 
LGEGDYDPEA MQYHLYVQWQ AHRQVQALAA RARRSGPGLY LDLPLGVHRE GYDVWRHRRA 
FALAASSGAP PDALFRRGQD WGFPPFHPEG IREDGYHYYI ACLRHHLRHA GILRLDHVMG 
LHHLYWIPRG LAATEGVYVR YHAGEFYAIL SLESRRHGAL LVGEDLGTVP AYVRRAMTRH 
NISRMYILAV EYTGKTGRAL GPVPPESLAG LNTHDMPPFA AFWRERKKNS RQLAALPVFL 
YNRGRLEVPT TATRSLLRGC LAYLAASPAR LLLVNLEDLW LETEPQNIPG TSTEYPNWRR 
KARYSLEEFS RQPGVVALLR EVNYWRGTAK