Gene Rleg2_1738 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_1738
Symbol
ID	6980475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	+
Start bp	1778807
End bp	1780279
Gene Length	1473 bp
Protein Length	490 aa
Translation table	11
GC content	67%
IMG OID	643396461
Product	carbohydrate kinase, YjeF related protein
Protein accession	YP_002281251
Protein GI	209549334
COG category	[G] Carbohydrate transport and metabolism [S] Function unknown
COG ID	[COG0062] Uncharacterized conserved protein [COG0063] Predicted sugar kinase
TIGRFAM ID	[TIGR00196] yjeF C-terminal region, hydroxyethylthiazole kinase-related [TIGR00197] yjeF N-terminal region

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.203791
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCACC AACTGTCCGA CCTTCTTCTC ACGCCTGCCG AAATGGCCGC CGTCGACGCG 
GCCGCTGCCG CATCCGGTAT CGATTCTTTT GGCCTGATGG AAAGGGCAGG TGCGGCGGCT 
GCGGCTGCGG CCCTGCGCCT TCATGCCGGA GCCCTGCGCT TCGTCGTGCT CTGCGGGCCG 
GGCAACAATG GCGGCGACGC CTATGTCGCC GCACGACATC TGCAGGAGGG CGGGGCTCCA 
GTGGCGCTCT TCCATCTTGG CGATCCCTCC AGGCTGAAGG GCGATGCAGC CCGTGCGAAA 
GCCGGATGCG CGCTGCGGGG GGAACCGCTC CACCTCTATA GTCCCGAAAT CGGCGACGTC 
GTCATTGACG GCCTGTTCGG CGCGGGGCTC GGCCGCGATG TGCCGGCCGA TGTCCGCGCG 
GTGATCGATC GGGTCGCCGA GGCCGGTCTT CCCGTGCTTG CCATCGATCT GCCCTCCGGC 
CTGGACGGCC GTACCGGCAG AGTGCTGGGA GCTGCCTTCC GCGCCAGCAA CACCATTACC 
TTCATGACCC GCAAACCCGG CCATCTGCTG ATGCCGGGCA GGGAGCTTTG CGGTGAGTTG 
GAGGTCTTCG ATATCGGCAT TCCCGCCCGC ATCATCAGGG CCGAGGCGAG TGGCGTCATC 
GCCGAAAACA GGCCGGACGC CTGGAAGGGT GTGCTGCCGG CCGAGCAGCT GGAAACCCAC 
AAATACAAGC GCGGTCATCT GGTCGTCTTC TCAGGCGAGG CTGATAAGAC GGGTGCGGCG 
CGCATGTCGG CGATCTCGGG CCTGAAGGCG GGGGCCGGCC TAGTGACGAT CGCGGCCCCT 
GATGCGGCGA TAGCCGCCAA TGCTGCGCAT CTCACCGCCG TCATGCTGCA TGCGATCGAT 
GATGCGGCCG ACCTCGAAGA CTGGCTCACC GACAAGCGGC TGCAGACCTT CGTTCTCGGC 
CCCGGTTTCG GCATCGGCGC CAGGGCGCGC GCCTTCGTCT CGGCGCTCGC CGAACGCCGG 
CTGGTGCTCG ATGCCGACGG CATCTCCTCG TTCAAGGACG ATCCGCAGCA GCTTTTCGAT 
CTTTTCGGCG GTGAGCCGCG CCTAGTGCTG ACGCCGCACG AGGGCGAATT TTCGCGGCTC 
TTTCCCGATA TCGGCGGCGA CGAAGCGCTG GGGAAGGTGG ACAAGGCCCT GGCCGCCGCC 
CGCCGCGCCA ACGCCGCGAT CGTCTATAAA GGCGCCGATA CCCTCATCGC CGCGCCGGAC 
GGCCGTGCGC TGATCAATAC TAACGCTCCT GCCTGGCTTG CCACCGCCGG TTCCGGCGAC 
GTGCTCGCCG GCATCATCGG CGGATTGCTC GCCCAGGGCC TGCCGGCCTT CGAGGCTGCG 
GCCGCCGGCG TCTGGCTGCA TGGAGAGGCC GCCCACCGTG CCGGCAAGGG GCTGACGGCG 
GAAGACCTCG CGGCTCATGT CTTGCCACTT TAA

Protein sequence

MSHQLSDLLL TPAEMAAVDA AAAASGIDSF GLMERAGAAA AAAALRLHAG ALRFVVLCGP 
GNNGGDAYVA ARHLQEGGAP VALFHLGDPS RLKGDAARAK AGCALRGEPL HLYSPEIGDV 
VIDGLFGAGL GRDVPADVRA VIDRVAEAGL PVLAIDLPSG LDGRTGRVLG AAFRASNTIT 
FMTRKPGHLL MPGRELCGEL EVFDIGIPAR IIRAEASGVI AENRPDAWKG VLPAEQLETH 
KYKRGHLVVF SGEADKTGAA RMSAISGLKA GAGLVTIAAP DAAIAANAAH LTAVMLHAID 
DAADLEDWLT DKRLQTFVLG PGFGIGARAR AFVSALAERR LVLDADGISS FKDDPQQLFD 
LFGGEPRLVL TPHEGEFSRL FPDIGGDEAL GKVDKALAAA RRANAAIVYK GADTLIAAPD 
GRALINTNAP AWLATAGSGD VLAGIIGGLL AQGLPAFEAA AAGVWLHGEA AHRAGKGLTA 
EDLAAHVLPL