Gene Moth_1936 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1936
Symbol
ID	3832428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	2010888
End bp	2012351
Gene Length	1464 bp
Protein Length	487 aa
Translation table	11
GC content	59%
IMG OID	637829867
Product	glycogen/starch synthases, ADP-glucose type
Protein accession	YP_430777
Protein GI	83590768
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0297] Glycogen synthase
TIGRFAM ID	[TIGR02095] glycogen/starch synthases, ADP-glucose type

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.0962192
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	1
Fosmid unclonability p-value	0.00000030545
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAACAAAC CCTTGAAGAT CTTGCTGGTT TCTCCCGAGG TTGCACCCCT GGCCAAAACC 
GGCGGCCTGG CTGATGTGGC CGGTAGCCTG CCCAAAGCCC TGGCGGCCAA GGGCCACGAG 
GTCAGGGTAG CCATGCCCCG TTACCGCCAG GTCAAGGAGG TTAACTACCT CACCGATCTG 
CCGGTAGAGA TGGACGGCAG CCTGGAGACA GCCGTCATTC GCCAGGGGAA ACTGCCCGGG 
GAAGCCGGGA TCCCGGTATA CCTGATCGAC AACTACAAGT TTTTCTACCG TGATGGCATG 
TATGGTTACG GCGATGACGC CGCACGGTTC AATTTCTTCT GCAAAGCCGT GCTGTCCATG 
CTGCCCTGGC TGGAGTTTCA GCCGGATATC ATCCATTGTA ACGACTGGCA GACCGGTCCC 
ATACCCCTGT TCCTCAAGGT AAAGCACGAG GACAACCCTT TTTACCGGGA GACGGCAACC 
ATCTATACCA TCCATAACCT GCAGTACCAG GGTACCTTTC CCCGCAACAT CCTCAAGACC 
ATGGCCCTCA GCGAGGAATT CTTTGTCCCG GAACGCCTGG AGTTTTACGG GCAGGTCAGC 
TATATGAAGG CCGGGATCCT GTACGCCGAC CTGGTGAACA CCGTCAGCAA GAAATACGCC 
CTGGAAATCC AGACGCCGGA GTACGGGGAG CGCCTGGACG GCCTGCTCCG TAAAAGGGCA 
GCCGACCTGA GGGGCATCCT GAACGGCATC GACTATGAGG AGTTCGACCC GGCCACCGAC 
CGGCGCCTGG CAGTCAATTA CGACGCCGAT CACCTGGAGA AGAAAGGGGA AAACAAGGCG 
GCCCTGCAGC GGGAGATGGA ACTGCCCGTC AGGGACGTCC CCGTCCTGGG CCTGATCTCC 
CGCCTGGTGA GCCAGAAGGG TCTCGACCTC CTGGCCGCTA TCCTGGACCC ATTGATGCAA 
CAGGACCTGC AGTTCGTCCT CCTGGGCAGC GGCGAGGACT ACTACCAGCA GCTTTTCTCC 
CGATATAAGG TAAAATATCG CGATAAAATG GCCGTGAAAA TCGGCTTTGA CCCGGTCCTG 
GCCCAGCATA TCTACGCCGG GTGCGATATC TTCCTGATGC CATCCCGGTT CGAGCCCTGC 
GGCCTGGGGC AGATGATCAG CCTGCGCTAT GGTGCCGTCC CGGTGGTCAG GGCAACTGGC 
GGCCTGGAGG ATACCATCAA AGACTTGCAC CAGTATCCGG GAGTGGGTAA CGGCTTTACC 
TTCCGTGATT ACCAGCCCCA GGCCCTCCTG GATACCATCA ACCGCGCCCT GCACGTCTAC 
CGCCACGAAC CCGGAGAATG GCGTAAACTG ATGCGGCGGG GCATGGCCGC CGATTTCTCC 
TGGAGCGCTT CGGCCGGTCA CTACGAGGAA ATGTACCGCG AGGCCCTGGA GAAGAGGCGG 
GCCGCCATGT TTAAGGTAGG GTAA

Protein sequence

MNKPLKILLV SPEVAPLAKT GGLADVAGSL PKALAAKGHE VRVAMPRYRQ VKEVNYLTDL 
PVEMDGSLET AVIRQGKLPG EAGIPVYLID NYKFFYRDGM YGYGDDAARF NFFCKAVLSM 
LPWLEFQPDI IHCNDWQTGP IPLFLKVKHE DNPFYRETAT IYTIHNLQYQ GTFPRNILKT 
MALSEEFFVP ERLEFYGQVS YMKAGILYAD LVNTVSKKYA LEIQTPEYGE RLDGLLRKRA 
ADLRGILNGI DYEEFDPATD RRLAVNYDAD HLEKKGENKA ALQREMELPV RDVPVLGLIS 
RLVSQKGLDL LAAILDPLMQ QDLQFVLLGS GEDYYQQLFS RYKVKYRDKM AVKIGFDPVL 
AQHIYAGCDI FLMPSRFEPC GLGQMISLRY GAVPVVRATG GLEDTIKDLH QYPGVGNGFT 
FRDYQPQALL DTINRALHVY RHEPGEWRKL MRRGMAADFS WSASAGHYEE MYREALEKRR 
AAMFKVG