Gene Rleg_4443 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4443
Symbol	glk
ID	8015210
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4576206
End bp	4577231
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	65%
IMG OID	644827018
Product	glucokinase
Protein accession	YP_002978220
Protein GI	241207124
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG0837] Glucokinase
TIGRFAM ID	[TIGR00749] glucokinase, proteobacterial type

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.862688
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAAAAC CGAACAACAG CATCGCTCCG CAGCCTTTCC CGATCCTGAT CGGCGATATC 
GGCGGCACGA ATGCCCGCTT CTCCATCCTG ACCGATGCCT ATGCCGAGCC GAAGCAGTTT 
CCGAACGTGC GCACGGCGGA TTTCGCCACG ATCGACGAAG CGATCCAGCA AGGCGTGCTC 
GACAAGACCG CCGTGCAGCC GCGCTCGGCG ATCCTCGCCG TCGCCGGCCC GATCAACGAC 
GACGAGATCC CGCTGACCAA TTGCGACTGG GTGGTGCGGC CGAAGACGAT GATCGAGGGC 
CTCGGCATGG AGGATGTGCT CGTCGTCAAC GATTTCGAGG CGCAGGCGCT GGCAATCGCC 
GCGCTTTCGG ATGAAAACCG CGAACGCATC GGCGACGCCA CCGGCGACAT GATCGCCTCC 
CGCGTCGTGC TCGGACCAGG CACCGGCCTC GGCGTCGGCG GGCTTGTGCA TGCCCAGCAC 
AGCTGGATCC CGGTTCCCGG CGAAGGCGGC CATGTCGATC TCGGGCCGCG CAGCAAGCGC 
GATTATGAAA TCTTCCCGCA TATCGAGACG ATCGAAGGCC GCGTTTCGGC CGAGCAGATC 
CTCTGCGGGC GCGGCCTCGT CAACCTCTAC CATGCCATCT GCGTTGTCGA CGGCATCCAG 
CCGACGATGA AAGATCCCGC CGACATCACC TCGCATGCGC TTGCCGGCAG CGACAAGGCA 
GCCGTAGAGA CCGTCTCGCT GTTTGCCACC TATCTCGGCC GCGTGGCGGG CGACATGGCG 
ATGGTGTTCA TGGCGCGCGG CGGCGTCTAT CTGTCCGGCG GCATCTCGCA GAAGATCATC 
CCGGCGCTGA AGAAGCCGGA ATTCCGCATC GCCTTCGAGG ACAAGGCGCC GCATACGGCG 
CTGCTTCGCA CCATCCCGAC CTATGTGGTG ACGCATCCGC TGGCAGCGCT TGCCGGGCTT 
TCCTCCTATG CGCGGATGCC GGCAAATTTC GGCGTCTCGA CCGAAGGCCG CCGCTGGCGG 
CGCTAG

Protein sequence

MPKPNNSIAP QPFPILIGDI GGTNARFSIL TDAYAEPKQF PNVRTADFAT IDEAIQQGVL 
DKTAVQPRSA ILAVAGPIND DEIPLTNCDW VVRPKTMIEG LGMEDVLVVN DFEAQALAIA 
ALSDENRERI GDATGDMIAS RVVLGPGTGL GVGGLVHAQH SWIPVPGEGG HVDLGPRSKR 
DYEIFPHIET IEGRVSAEQI LCGRGLVNLY HAICVVDGIQ PTMKDPADIT SHALAGSDKA 
AVETVSLFAT YLGRVAGDMA MVFMARGGVY LSGGISQKII PALKKPEFRI AFEDKAPHTA 
LLRTIPTYVV THPLAALAGL SSYARMPANF GVSTEGRRWR R