Gene Rleg_4334 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_4334
Symbol
ID	8015915
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	4455242
End bp	4456210
Gene Length	969 bp
Protein Length	322 aa
Translation table	11
GC content	61%
IMG OID	644826910
Product	putative polysaccharide degradation protein
Protein accession	YP_002978113
Protein GI	241207017
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4124] Beta-mannanase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00591589
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.00216824
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGAAGC TGATGAAAAA AAACCTCTCG ACCGCCGCGT TAGCGCTGTT GCTGTTGTGC 
GTCGCGGATC TGCCGGGCCG AAGCGAAGTG CAATATGCCG GCATTGCCCC GAACCCGGCG 
GCGGCCGTGC GGACGATCAT CGATAAGCGC CCCGTCCTTC ACACCGACGG CATTAAGTTC 
GGGGCCTACG ATCCGCACGG CGATTTCGGC GCGCAGGCGA ATGTCGCGAC CGAAGCCCTG 
TTTCTGCCAT GGGAGGACGT CGATCTCGAG ACGTTGCGCG TCGCCGATGC CTATGCGCAG 
GCCAGAGGCC GCAACCTGCT GATCACCGTG GAGCCATGGT CTTGGGACGT CGATTGGCGG 
CTGACCTCCG CAGAGCTTCG CGCCAAGGTT CTGCGCGGTG ACTATGATGT CAACATGCGT 
TCGATCGCGC ATATGATATC TGAGCTGAAA AGCCCGGTGA TCGTCCGCTG GGGACAGGAG 
ATGGAGGACA AGTCAGGGCG GTTCTCATGG TCCGGCTGGA GCCCGCAGGA CTATATCACG 
GCCTACAAGC GGATGATGGA CATCGTCCGC CAGGAGGCGC CCAGCACCGA GCTCATGTGG 
TCGCCAAAGG GAGAGCCTGG CCTTGAGGCC TATTATCCCG GCGACGATTA TGTCGACCTC 
GTTGGGCTCT CGGTCTTCGG CCTGCAGCGC TACGACGAAC TCGCCTACAA TGAGCACCGA 
ACATTCTCGG AAGCGCTGAA GCAGGGATAT GATCTCGTCG CCGGCTACGG AAAGCCAATC 
TGGGTGGCGG AGCTGGGCTA TGAAGGCGGC GACGCCTATA TCAGGCCGTG GATCGAAACT 
GCCACACTGA AGCAGAGCGC CTTCCCGAAT CTGCAGGAGG TCGTCTATTT CAACGACCGG 
GATGTGCATG CATGGCCGTT CGATCTTGGC CGGCCGGACT GGCGCGTGGC CGAAAACCTG 
GGCAACTGA

Protein sequence

MKKLMKKNLS TAALALLLLC VADLPGRSEV QYAGIAPNPA AAVRTIIDKR PVLHTDGIKF 
GAYDPHGDFG AQANVATEAL FLPWEDVDLE TLRVADAYAQ ARGRNLLITV EPWSWDVDWR 
LTSAELRAKV LRGDYDVNMR SIAHMISELK SPVIVRWGQE MEDKSGRFSW SGWSPQDYIT 
AYKRMMDIVR QEAPSTELMW SPKGEPGLEA YYPGDDYVDL VGLSVFGLQR YDELAYNEHR 
TFSEALKQGY DLVAGYGKPI WVAELGYEGG DAYIRPWIET ATLKQSAFPN LQEVVYFNDR 
DVHAWPFDLG RPDWRVAENL GN