Gene Moth_0476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0476
Symbol
ID	3832414
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	479327
End bp	480826
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	41%
IMG OID	637828410
Product	carbohydrate kinase, FGGY
Protein accession	YP_429349
Protein GI	83589340
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1070] Sugar (pentulose and hexulose) kinases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	29
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAAAAC CACTTTTAAT AGGCATAGAT GCAGGAACAA GCAGCGTTAA AATTTGTATT 
TTTAATATTA ACGGGGAACT AGTTCGACAG GGCGAAGTCA AAATTGCTTT TTCGAGTCCA 
CGACCCGGTT GGATAGAATT AGATTTAAAG CAGTATTGGG ATGCCACTTG CCGGGTTCTT 
CGGGAGATAA CAACAGATTT AACAGGTTTT GCAGGATTGG GTTTTAGTGT AACGAGTCCT 
ACCACTGTAT TTTTAGATGA TGAGGGTCTT CCGGTAAGAC CTGCTATTCC TTATTTAGAT 
ATCAGGAGCA AAGAGGATGT CGAAGAACTA GTTAAATATT GGGGGGGAGA GGAAGATTTT 
CAATCTCATG TAGGGAATAA ACCTATTCCG TCTACCTATT CTGCCGGAAT AGTGCGTTGG 
ATAATGAGAG AAGAAAATAA TAGCTGGAAT AGAACCAAAA AAGTTGGCTT TCTTAATACA 
TTTTTATGTG GCCAATTAAA GGGGGAATGG GCAGTTGATC CTACTGTAGC ATCTTTTTCT 
GGCCTGGTGC GTTTAGCCGA ACCTTTTAAA TGGTCAGATG AATTACGCGA ACTCTTAGGA 
ATTCCATCCT CGAAACTTCT TACAATTTTA ACACCTTATA CAAAAATTGG TGAAGTAACT 
CCTCAAGCGG CTAAGGAGAC AGGATTGCCC ACAGGACTTC CTGTCGCCCT GGGCTGTGCT 
GATACCGCGG CTGCTAGTTT TGCTCTGGGT TTATCACAGA AAGGCGACTG TTTTGAAAGT 
GCAGGGACCT CGGATGTGCT AACTTTTTGC CTTGATAGAC CAGATTTTAA TTCTATGTTT 
CTAAACAGAT CTCACGTTTA CCCGGGCCGT TGGCTTGCTC ACGGGGCTAT GTCTACTCCA 
GGTGCTGCTA TCGAATGGTT GATAACTAAT GTTTTTCCCG AATTAGGTAC AGTGAGTGAA 
CTAGAAAAAG AGGCAGAAAG ATCCGAACCC GGTGCTCGTG GACTTATTTT TCTACCATAT 
TTGGCGGGAG AAAGGAGTCC GATTTTCGAT CCCAATGCCA AAGGCCTTTG GCTGGGTCTA 
CGACTGGATA CTAGACGAGC TGATATTATA AGAGCCGTAT ATGAAGGAAT AGCTTTTGGT 
TTACGTCAAA TCTTGAAATA TGCTGAAGCA CAGTGGGATT TAAAAATTAA AAGTTTACCT 
TGTGTCGGTG GTGCAGCTAA AAGCCAATTG GGATTAAAGA TTAAAGCGGA TGTATTAGGT 
TTAGAGTACC AGACAACAGA TTTTCAGCAT GTTGCAGCAT TAGGTGCCGC ATTACTTGGG 
GGTATAGCAG GGGGTGTTTA TATGGGATGG GAGGATCCAG AAATTCCTTA TCTTAAAAAA 
TTCAACTCAT GTTTTAAACC TAATTTCACA AATTACAAGA TATATGACCA GTTATTTACT 
ATTTATGAAA GGTTGTACCC TTCGACAAAA GAAGCAATGC ACGCGTTAAA TGTATATTAA

Protein sequence

MKKPLLIGID AGTSSVKICI FNINGELVRQ GEVKIAFSSP RPGWIELDLK QYWDATCRVL 
REITTDLTGF AGLGFSVTSP TTVFLDDEGL PVRPAIPYLD IRSKEDVEEL VKYWGGEEDF 
QSHVGNKPIP STYSAGIVRW IMREENNSWN RTKKVGFLNT FLCGQLKGEW AVDPTVASFS 
GLVRLAEPFK WSDELRELLG IPSSKLLTIL TPYTKIGEVT PQAAKETGLP TGLPVALGCA 
DTAAASFALG LSQKGDCFES AGTSDVLTFC LDRPDFNSMF LNRSHVYPGR WLAHGAMSTP 
GAAIEWLITN VFPELGTVSE LEKEAERSEP GARGLIFLPY LAGERSPIFD PNAKGLWLGL 
RLDTRRADII RAVYEGIAFG LRQILKYAEA QWDLKIKSLP CVGGAAKSQL GLKIKADVLG 
LEYQTTDFQH VAALGAALLG GIAGGVYMGW EDPEIPYLKK FNSCFKPNFT NYKIYDQLFT 
IYERLYPSTK EAMHALNVY