Gene Rleg_5051 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_5051
Symbol
ID	8007644
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012848
Strand	-
Start bp	434378
End bp	435550
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	62%
IMG OID	644821966
Product	glycosyl hydrolase family 88
Protein accession	YP_002973226
Protein GI	241113391
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.659777
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCCG TCTCGTCCGT CGCCCCACAG CCGATCACCG ATCCGGAGGT CAAAGCCGCG 
CTCGATCTTG CCGTCGAGCA GATCAGGCGC AACCTCCCCC AATTCACCCA TGCCTCGCAG 
AACCATTCGA GCGTCGGAAA TTTCTATCCC GCGGTGGCGA ACGACCAATG GACAGCGGGC 
TTCTGGCCCG GCGAGCTGTG GCTCGCTTTC GAGCACAGCG GCGAGGCGGT TTTCCGCGAT 
GCCGCGCAGG TCCAAGTCCA GTCATTCCTG CATCGGATCG TGAACCGCAT CGAGACCGAT 
CATCACGACA TGGGCTTTCT CTATTCGCCC TCTTGCATCG CCGCCTGGAA GCTCGTCGGA 
GACGAGGATG GCCGCAGGGC CGCCATCCTG GCCGCCGACC AGCTGATCGA GCGCTTCCAG 
CCCGTCGGTC AGTTCATCCA GGCCTGGGGC CGCAAGGGCA AGGCGGAGGA ATACCGCTAC 
ATCATCGACT GCCTCTTGAA CCTGCCGCTT CTCTACTGGG CAAGCCGCGA GACCGGCAAT 
CCGAAATACC GCGAGATCGC GCTCATTCAC GCCCGCACAA CGCTTGCCAA CTCGGTTCGG 
CCGGATGATT CCACCTATCA CACCTTCTAT CTGGACCCGG TCACCGGGGC GCCGGTGCGC 
GGCGCCACCA AACAGGGTTA CAAAGACGAT AGCGCCTGGG CGCGCGGACA GGCCTGGGCA 
ATCGCTGGCA TGGCGCTCTC CTATCGCTAT GAGCGGATCG AGGAATATCG CCAAACCTTC 
GACAGGTTGC TTGCCTTCTA TCTCAACCGG CTGCCGGCCG ACATGGTGCC CTATTGGGAT 
CTCGTCTTTT CGGATGGCGA TGGCGAGCCG CGCGACAGCT CGTCGGCCTC GATCGCCGCC 
TGCGGCCTTC TGGAGATGGC CGATCTCGTC GAACCGGAAC CGGCCTCACG CTATCGCACG 
CTGGCGCGCC GCATGATGAA GAGCCTTGCG GATCATTATG CGGTCAAGGA TCCCACCGTC 
TCCAACGGCC TGGTGCTGCA CGCCACCTAT TCGAAGAAAT CGCCGTTCAA CACCTGCCGC 
GGCGAGGGCG TCGATGAATG CGTCTCCTGG GGAGATTATT ATTACATGGA AGCTTTGACG 
CGCCTTTCGC GCAACTGGTC TTCCTATTGG TGA

Protein sequence

MNAVSSVAPQ PITDPEVKAA LDLAVEQIRR NLPQFTHASQ NHSSVGNFYP AVANDQWTAG 
FWPGELWLAF EHSGEAVFRD AAQVQVQSFL HRIVNRIETD HHDMGFLYSP SCIAAWKLVG 
DEDGRRAAIL AADQLIERFQ PVGQFIQAWG RKGKAEEYRY IIDCLLNLPL LYWASRETGN 
PKYREIALIH ARTTLANSVR PDDSTYHTFY LDPVTGAPVR GATKQGYKDD SAWARGQAWA 
IAGMALSYRY ERIEEYRQTF DRLLAFYLNR LPADMVPYWD LVFSDGDGEP RDSSSASIAA 
CGLLEMADLV EPEPASRYRT LARRMMKSLA DHYAVKDPTV SNGLVLHATY SKKSPFNTCR 
GEGVDECVSW GDYYYMEALT RLSRNWSSYW