Gene Anae109_2331 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_2331
Symbol
ID	5374037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	2695686
End bp	2697221
Gene Length	1536 bp
Protein Length	511 aa
Translation table	11
GC content	79%
IMG OID	640843850
Product	carbohydrate kinase, YjeF related protein
Protein accession	YP_001379517
Protein GI	153005192
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	58
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCTCG TCGGCTCGGC TGAGATGCGC GCCATCGATC GCGCCGCCAT CGACGCCTTC 
GGCGTGCCCT CGCTCGCCCT CATGGATCGG GCGGGGCGCG CCGTCGCGGA GGCCGTCCGA 
TCGCTCTGCG CGCCTGGCGG GCGGATCGTC GTCGTCTGCG GCGGCGGTAA CAACGGCGGC 
GACGGCTACG TGGCGGCGCG GGTCCTGCGG GCGGAGGGCT GGGACGCGCG CGTCGTCTCG 
ATCGTGCCGG CGGCGCGGCT TTCCGGCGAT GCGCGCGTGA CGCGCGAGGA GGCGGAGCGC 
GCGGGCGTGC CGATCGACGA GGCGGGCGAG CTGCTCACCG TGGACGCCGG GCCCGGGGAC 
GTGGTGGTGG ACGGCGTGTT CGGCACCGGC CTCACCCGCG CGCCGGAGGG CGCGTTCGCG 
CGAGCCATCG AGCGGATCGA CGCCGCCCGC GCGGCGGGGG CGCGCGTCGT GGCGGTGGAC 
GTCCCGTCCG GCCTGTCGGC GGACACCGGC CGCCCGCTCG GCGCGGCCTG CGTCCGGGCG 
GACCGGACCG TCACCTTCGC CTTCCAGAAG CGCGGGCTCG TCCTCCACCC GGGGCCGTCC 
GTCGCCGGCG AGGTGATCGT CGCCGACATC GGCATCCCGC TCGAGGCCGC CGCGCGGGTG 
CCGCTCACCT GCGAGCTGCT CGAGGCGGCT CAGGCGCAGG CGCTCCTCCC GGCGCGCTCG 
CCCGACGCCC ACAAGGGCGA CGCCGGCCGG CTGCTCGTGG TGGCCGGGTC GCCCGGCAAG 
ACGGGCGCGG CCCACCTCGC GCTCACCGGC GCGCTGCGCG GCGGCGCCGG CCTCGTCACG 
CTCGCCGCCC GCGCCGAGGC GCTGCCGCTC GCGCTGTTCG GCCGCCCGGA GGCGATGAGC 
GTGGCGCTTC CCGGCGCGGG TCCGCTCGGC CGGGCAGATC TCCAGGCGCT CCTCGCGGCG 
GCGAAGGGCG TGGACGCGCT GGCCATCGGC CCGGGCATCC CGCGCGGCGA GGAGACGGGT 
GAGCTGCTGC GGGCGCTGCT CGAGCGGGCG CGGCTGCCGG CGGTGCTCGA CGCGGACGCG 
CTGAACGCGC TCGCCGACGA GCCCGGCCGG CTCGCCGCGC TGGGCGAACC GCTCGTGCTC 
ACGCCGCACC CCGGCGAGAT GGCGCGCCTG TGCGGGACCC CGATCGACGA GGTGCAGGCG 
GACCGCATCG AGGTCGCGCG CGCGAAGGCG CGAGAGTGGG GCGTGACGGT GGTGCTGAAG 
GGGGCGCGCA CGGTGGTCGC CGATCCGCAC GGGCCCGCGG CGGTGATCCC GACCGGCAAC 
GCCGGGATGG CGACGGGCGG CACCGGCGAC GTGCTCGCGG GGCTCATCGG CGCGCTCCTC 
GCCGGCGGCC TTCCGCCCGG GGCGGCGGCG CGCGTCGGCG CGTGGGTTCA CGGCCGGGCA 
GGGGACCGCG TCGCGGCCCG GCTCGGCGAG CGTGGGCTCC TCGCCGGTGA TCTGGGCGAG 
GCCATCGGCG AGGTGTGGGC GGAGTGGCGG CGATGA

Protein sequence

MRLVGSAEMR AIDRAAIDAF GVPSLALMDR AGRAVAEAVR SLCAPGGRIV VVCGGGNNGG 
DGYVAARVLR AEGWDARVVS IVPAARLSGD ARVTREEAER AGVPIDEAGE LLTVDAGPGD 
VVVDGVFGTG LTRAPEGAFA RAIERIDAAR AAGARVVAVD VPSGLSADTG RPLGAACVRA 
DRTVTFAFQK RGLVLHPGPS VAGEVIVADI GIPLEAAARV PLTCELLEAA QAQALLPARS 
PDAHKGDAGR LLVVAGSPGK TGAAHLALTG ALRGGAGLVT LAARAEALPL ALFGRPEAMS 
VALPGAGPLG RADLQALLAA AKGVDALAIG PGIPRGEETG ELLRALLERA RLPAVLDADA 
LNALADEPGR LAALGEPLVL TPHPGEMARL CGTPIDEVQA DRIEVARAKA REWGVTVVLK 
GARTVVADPH GPAAVIPTGN AGMATGGTGD VLAGLIGALL AGGLPPGAAA RVGAWVHGRA 
GDRVAARLGE RGLLAGDLGE AIGEVWAEWR R