Gene Rleg_4469 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4469
Symbol
ID	8015233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	4601570
End bp	4602790
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	63%
IMG OID	644827045
Product	phosphopentomutase
Protein accession	YP_002978246
Protein GI	241207150
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1015] Phosphopentomutase
TIGRFAM ID	[TIGR01696] phosphopentomutase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	0.614507
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.393425
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGCGTG CCTTTCTTTT CGTTCTGGAT TCCTTCGGCA TTGGCGGGGC GCCGGATGCG 
GCGGCCTATG GCGACGAGGG CGCCGATACG CTCGGCCATA TCGCCGAGTT CTGCGCAGCC 
GGAGCCGGAG ACCGCGCCGG ATTGCGCGAA GGGCCGCTTT CCCTGCCCAA CATGTCGGAA 
CTCGGGCTCA TGCAAATCGC GCGATCCGCC TCCGGCCGAT TTCCGGCCGG CATGCCCGTC 
CCGGAGAAGG TTTATGGCAT TTATGGCGCT GCGACCGAAA TCTCCCGAGG CAAGGATACG 
CCGTCGGGTC ATTGGGAAAT CGCGGGAACA CCGGTCAGTT TCGATTGGGG TTATTTCCCG 
ATAGAGGGCG ACGCCTTTCC TGCCGAATTC ATCGAGGCGC TATGCAGAGA GGCTGACGTG 
CCCGGCATCC TCGGCAACTG CCATGCTTCG GGAACGGAGA TCATCGCCCG GCTCGGCGAG 
GACCATATCC GCACCGGCAA GCCAATCTGC TACACCTCTT CGGATTCCGT CTTTCAGGTC 
GCGGCGCACG AGGAGCATTT CGGCCTCGAT CGTCTGCTCG CCTTCTGCCG TTTGGCCCGG 
GGGCTGCTCG ATCCCTACAA TATCGGCCGT GTCATCGCCC GGCCCTTTAT CGGCCAGTCC 
GCCTCTACTT TCCAGCGCAC GGGAAACCGG CGCGACTTCT CCGTGGTGCC GCCGGAGCCG 
ACGCTACTCG ACCGGCTGAT CGAGCACGGC CGGCATGTGC ATGCTGTGGG AAAGATCGAC 
GACATCTTCG CGCATCAGGG CATTTCCAAG GTCATCAAGG CGAACGGAAA CGAGGCGCTG 
ATGGATGCGT CCCTCGCGGC GCTCGACGAG GCTGGGGACG GCGATCTCGT TTTCACCAAT 
TTCGTCGATT TCGACATGAT CTACGGTCAT CGCCGCGACG TGCCGGGTTA TGCAGCCGCA 
CTCGAAGCCT TCGATGCGCG CTTGCCTGAA GTCCACAAGA AACTGAAGCC CGGCGATCTC 
GTCGTGCTCA CCGCCGATCA TGGCTGCGAT CCGACCTGGC GCGGCACGGA CCATACGCGC 
GAGCGTGTGC CTGTCATCGC TTATGGCCCC GGCATCCGGT CGCGTTCGAT CGGCGTGCGC 
CGCAGCTATG CCGATATCGG CGAGAGCATC GCCCGGCATC TCGGCATCCC GGCCGGGCCG 
CACGGAAGGA GTTTTCTGTG A

Protein sequence

MARAFLFVLD SFGIGGAPDA AAYGDEGADT LGHIAEFCAA GAGDRAGLRE GPLSLPNMSE 
LGLMQIARSA SGRFPAGMPV PEKVYGIYGA ATEISRGKDT PSGHWEIAGT PVSFDWGYFP 
IEGDAFPAEF IEALCREADV PGILGNCHAS GTEIIARLGE DHIRTGKPIC YTSSDSVFQV 
AAHEEHFGLD RLLAFCRLAR GLLDPYNIGR VIARPFIGQS ASTFQRTGNR RDFSVVPPEP 
TLLDRLIEHG RHVHAVGKID DIFAHQGISK VIKANGNEAL MDASLAALDE AGDGDLVFTN 
FVDFDMIYGH RRDVPGYAAA LEAFDARLPE VHKKLKPGDL VVLTADHGCD PTWRGTDHTR 
ERVPVIAYGP GIRSRSIGVR RSYADIGESI ARHLGIPAGP HGRSFL