Gene Rleg2_5334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_5334
Symbol
ID	6978428
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	-
Start bp	959225
End bp	960397
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	63%
IMG OID	643394436
Product	glycosyl hydrolase family 88
Protein accession	YP_002279254
Protein GI	209547336
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACGCCG TTTCAACAGT CGCCCCGCAG CCGATTACCG ATGAGGAAGT AAACGCCGCG 
CTCGATATCG CCGTCGAGCA GGTCAGGCGC AACCTCCCCG ACTTCACCCA CGCCGCGCAG 
AACCATTCCA GTATCAAGAA TTTTTATCCC CCAGTGGCGA ACGACCAGTG GACCGCCGGC 
TTCTGGCCCG GCGAACTGTG GCTCGCCTTC GAACACAGCG GCGACGCGGC CTTCCGGGAT 
GCTGCGCAGA TCCAGGTTCA ATCGTTCCTG CATCGGATCG TCAATCGCAT CGAGACCGAT 
CATCACGATA TGGGCTTTCT CTATTCGCCC TCCTGCATCG CCGCCTGGAA GCTCGTTGGA 
GACGCGGATG GCCGCAGGGC CGCGATCCTG GCCGCCGACC AGCTGATAGA GCGCTTCCAG 
CCGATCGGCC AGTTCATCCA GGCTTGGGGC CGCAAGGGAA AGGCGGAGGA ATATCGCTAT 
ATCATCGACT GCCTTTTAAA CCTGCCGTTG CTCTACTGGG CAAGCCGCGA GACCGGCGAT 
CCGAAATACC GCGAGATCGC GCTCACCCAC GCCCGCACCA CGCTCGCCAA TTCGGTGCGG 
CCGGATGATT CCACCTATCA CACCTTCTAC ATGAACCCGG TGACCGGCGC GCCGGTGCGC 
GGCGCCACCA AACAGGGCTA CCGGGACGAC AGCGCCTGGG CGCGCGGACA GGCCTGGGCA 
ATCGCGGGCA TGGCGCTCTC CTACCGCTAC GAGCGGATCG AGGAATATCG CAGCACCTTC 
GACCGGCTGC TCGCCTTCTA TCTCAACCGG CTGCCGGCCG ACATGGTCCC CTATTGGGAC 
CTCGTCTTTT CCGACGGCGA CGGCGAGCCG CGCGACAGTT CGTCGGCCTC GATCACCGCC 
TGCGGCCTGC TTGAAATGGC CGAGCTAGTC GAAGCCGAAC ACGCCGAGCG CTACCGCACG 
CTGGCGCGCC GCATGATCAA GAGCCTGGCC GACCACTATG CGGTGAAGGA TCCCACCGTT 
TCCAACGGCC TGGTGCTGCA CGCCACCTAT TCGAAGAAAT CGCCCTTCAA CACCTGCCGC 
GGCGAGGGCG TCGATGAGTG CGTCTCCTGG GGAGACTATT ATTACATGGA AGCTTTGACG 
CGCCTTTCGC GCCGCTGGTC TTCCTATTGG TGA

Protein sequence

MNAVSTVAPQ PITDEEVNAA LDIAVEQVRR NLPDFTHAAQ NHSSIKNFYP PVANDQWTAG 
FWPGELWLAF EHSGDAAFRD AAQIQVQSFL HRIVNRIETD HHDMGFLYSP SCIAAWKLVG 
DADGRRAAIL AADQLIERFQ PIGQFIQAWG RKGKAEEYRY IIDCLLNLPL LYWASRETGD 
PKYREIALTH ARTTLANSVR PDDSTYHTFY MNPVTGAPVR GATKQGYRDD SAWARGQAWA 
IAGMALSYRY ERIEEYRSTF DRLLAFYLNR LPADMVPYWD LVFSDGDGEP RDSSSASITA 
CGLLEMAELV EAEHAERYRT LARRMIKSLA DHYAVKDPTV SNGLVLHATY SKKSPFNTCR 
GEGVDECVSW GDYYYMEALT RLSRRWSSYW