Gene Moth_1867 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_1867
Symbol
ID	3831498
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	-
Start bp	1929845
End bp	1931593
Gene Length	1749 bp
Protein Length	582 aa
Translation table	11
GC content	62%
IMG OID	637829799
Product	pyruvate kinase
Protein accession	YP_430710
Protein GI	83590701
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0469] Pyruvate kinase
TIGRFAM ID	[TIGR01064] pyruvate kinase

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCACA CGAAGATTGT CTGTACCATG GGCCCGGCCA GCGAGCGGGT CGAGGTAATC 
AAGGCTATGA TCCGGGCGGG GATGAACGTA GCCCGGTTCA ATTTTTCCCA TGGCAGCCAC 
GCCGAGCACG GGGCGCGGAT GGCTGCCGTG CGCCAGGCGG CAGCTGAACT GGGCGCCAGG 
GTAGCGTTAA TGCTGGATAA TAAGGGGCCC GAAATTCGCC TGGGAGAGAT CCAGGGCGAG 
GTCACCCTGA AGGACGGCGA CCAGGTGACC CTGACCACAG AACCTATTAT TGGTGACGCC 
AGGCGTTTGC CGGTGAGCTT TGCCGGTCTG CCGGGGGACG TCCGGCCGGG CCAGATCATT 
CTCCTGGACG ACGGCCTGGT GGAGCTGGAG GTCCTGGCGA CCACCGCCAC CGAGATTCAC 
TGCCGCGTCC GTCACGGCGA TGTTATTTCC AGCCATAAGG GCGTCAACGT CCCCGGGGCC 
GAGATCAGCC TGCCTCCTTT TACCGAGCAG GATATTAAAG ACCTTGAGTT CGGCCTCCAG 
CAGGGGATAG ATTTTATCGC CCTCTCCTTT GTCCGGACGG CCGGGGATGT CCTGGCAGTA 
CGCCGGGAGC TTGAGAAGCG CAACGCCAGG GTAGCCATTA TCGCCAAGAT AGAAAACCAT 
GCCGGGGTCA ATAACATCCA CGAGATCCTT GAGGTGGCCG ACGGGGTCAT GGTGGCCCGG 
GGTGACCTGG GGGTAGAGAT CCCCGTGGAA GAGGTCCCCC TGGTGCAGAA AAAGATTATC 
GAGGCGTGTA ACCTGGCCGG CAAGCCGGTT ATCACGGCCA CCCAGATGCT GGAGTCTATG 
ATTCATAACC CGCGGCCGAC CCGGGCCGAA GCCAGCGATG TGGCCAATGC CATCTTTGAC 
GGAACGGATG CCATTATGCT CTCCGGGGAA ACGGCTACGG GCCGTTATCC GGTAGAGGCT 
GTGGCGACCA TGGCCCGCAT CGCCCGCCGG GCCGAGAGGG GTTTGCCCTA TGGTGACCTG 
TTGACGAAAA AGGGTCTGGC TGCCGAGCGG ACGGCCACCG ATGCCATCAG CCACGCGAGC 
TGCACCATTG CCTATGAACT CGACGCCGCC GCCATTATCA CCCCCACGGC TTCCGGTTCC 
ACCGCCCGCC GGGTGGCCAA ATACCGTCCC CGGGCGCCTA TCCTGGCCAC CAGCCCCAAC 
GAGAAGGTTT TGAACCAGCT CTGCCTGGTC TGGGGGGTTG AACCCCTCCT GGTGGAGCCG 
ACAAGCGGCA CCGACGAAAT GGTTAATGCC GCGGTGGCGG CGGCCATACT CTCCGGCCGG 
GTGAAACAGG GCGACCTGGT GGTTATTACT GCCGGCGTGC CTGCCGGTGT TCCGGGTACC 
ACCAACCTCC TCAAGGTCCA CATCGTCGGC GAGGTCCTGG TGCGGGGACG GGGGATCGGC 
AAAGAAGTAA CCAGTGGCCC GGTCCGGCTG GTAAAGACTG CTGCTGACGC CGTGGCAAGG 
GTCAAAAAAG GCGACATTCT GGTGACCACT GAGACCGGCC CTGAATTCCT GCCAGCTATG 
GAAAGGGCGG CAGCAGTAAT TACGGAAACC GGGGGGCTGA GTTCCCATGC CGCGGTAACC 
GGCCTGAGCC TGGGTATACC GGTAGTCGTC GGGGCAAAGG GGGCCACTGA AAAGCTAACC 
GATGATCTGG TCGTAACCAT AGACGTTGTC CGCGGCCTGG TCTACCGCGG TCAGACGCGG 
GTGTTGTGA

Protein sequence

MRHTKIVCTM GPASERVEVI KAMIRAGMNV ARFNFSHGSH AEHGARMAAV RQAAAELGAR 
VALMLDNKGP EIRLGEIQGE VTLKDGDQVT LTTEPIIGDA RRLPVSFAGL PGDVRPGQII 
LLDDGLVELE VLATTATEIH CRVRHGDVIS SHKGVNVPGA EISLPPFTEQ DIKDLEFGLQ 
QGIDFIALSF VRTAGDVLAV RRELEKRNAR VAIIAKIENH AGVNNIHEIL EVADGVMVAR 
GDLGVEIPVE EVPLVQKKII EACNLAGKPV ITATQMLESM IHNPRPTRAE ASDVANAIFD 
GTDAIMLSGE TATGRYPVEA VATMARIARR AERGLPYGDL LTKKGLAAER TATDAISHAS 
CTIAYELDAA AIITPTASGS TARRVAKYRP RAPILATSPN EKVLNQLCLV WGVEPLLVEP 
TSGTDEMVNA AVAAAILSGR VKQGDLVVIT AGVPAGVPGT TNLLKVHIVG EVLVRGRGIG 
KEVTSGPVRL VKTAADAVAR VKKGDILVTT ETGPEFLPAM ERAAAVITET GGLSSHAAVT 
GLSLGIPVVV GAKGATEKLT DDLVVTIDVV RGLVYRGQTR VL