Gene Rleg2_2090 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_2090
Symbol
ID	6980829
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011369
Strand	-
Start bp	2148541
End bp	2150154
Gene Length	1614 bp
Protein Length	537 aa
Translation table	11
GC content	63%
IMG OID	643396812
Product	Alpha-N-arabinofuranosidase
Protein accession	YP_002281600
Protein GI	209549683
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3507] Beta-xylosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.00759162
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	0.572245
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCGCA ATCCCATCCT GCCCGGGTTC AACCCCGATC CGTCGATCTG CCGCGTGGGC 
GCGGACTATT ATATCGCGAC CTCGACCTTC GAATGGTATC CCGGCGTGCA GATCCACCAT 
TCGCGCGACC TGGTGAACTG GACGCTGGTG CGCCGGCCGC TGGAACGCCG GTCGCAGCTC 
GACATGCGCG GCAATCCCGA CAGCTGCGGC ATCTGGGCGC CGTGTCTTTC CTATGCCGAC 
GGGCAGTTCT GGCTTGTTTA TACCGACGTC AAGCGCTTCG ATGGCAGTTT CAAGGACGCG 
CCGAACTATA TCGTCACCGC GCCTGCCATC GAGGCCGAAT GGTCCGAGCC GGTGTACGTC 
AATTCCTCCG GCTTCGATCC CTCGCTGTTC CACGACGATG ACGGCCGCAA GTGGTTCCTC 
AACATGCAGT GGAACCACCG CACCGAAAGC TATGGCGGCT CGCCGAAATC GCCGGCCTTC 
GACGGTATCC TGCTGCAGGA ATGGGACCCG GTGACGAAGG CCCTGAAAGG CCCGCTCCGC 
AATATTTTCG CCGGCAGTCC GCTCGGCCTG GTCGAGGGCC CGCACCTCTT CAAGCGCAAT 
GGCTGGTACT ATCTGACGAC CGCGGAAGGC GGTACCGGCT ATGACCACGC CGTCACCATG 
GCGCGCTCGC GCCGCATCGA AGGCCCTTAC GAGATGCATC CTAACATGCA TCTCATCACC 
TCCAAGGATC ATCCGGGCGC GGTGCTGCAG CGGGCAGGGC ACGGCCAATA TGTCGAGACG 
CCGGACGGTG AGGCCTATCA CACCCATCTC TGCGGCCGGC CTCTACCGCC GAAGCGGCGC 
TGCACGCTGG GGCGAGAGAC GAGCCTGCAG AAATGCGTCT GGCGCGACGA TGACTGGCTC 
TATCTCGAAA ATGGCACCTC GGTGCCCGAT GTCGATGTGC CCGGCCTCTT CGGCGCCGTG 
CCTGCGGAAA AGCCGATGCG CAGCGAATAC AGCTTCGATG GCGGCACCCT GCTGGCCGAT 
TTCCAATGGC TGCGCACGCC CGAGCCCGAG CGCATCTTCA ACCTGACGGA CCGCCCCGGC 
CATCTCAGGC TGATTGCGCG CGAAAGCATC GGCTCCTGGT TCGAGCAGGC TTTGGTTGCC 
CGCCGGCAGG AGCATCACAG CTTCCGCGCC GAGACCGTGG TCGAGTTCTC GCCCGACACT 
TATCAGCAGG TCGCGGGGCT GACGCATTAT TACAACCGGC ATAAATTCCA TGCCGTTGCC 
GTGACGCTGC ACGAAACACT CGGCCGCTGC GTGACGATCC TCTCCTGCAA TGGCGATTAT 
CCGAACGGAC GCCTGAGCTT CCCCGCCGAA AGCGATGTGG CGATCGCTGC TGAGGGCCGT 
GTCCAGCTCG CCATGGAAAT TCGCGAGAAC GATCTGCAAT TCTTCTGGCA GACCGAAGGC 
AAGGGCGCCT GGCAGCCGAT CGGCCCGATC CTCGACGCCG GCATGATTTC CGACGAGGGC 
GGGCGCGGCG AACACGGTTC CTTCACCGGC GCCTTCGCTG GCGTGTTTGC CTTCGATACG 
TCGGGACGCG GGAAGATCGC GGATTTCGAC TGGTTCAACT ATGACGAATT GTGA

Protein sequence

MIRNPILPGF NPDPSICRVG ADYYIATSTF EWYPGVQIHH SRDLVNWTLV RRPLERRSQL 
DMRGNPDSCG IWAPCLSYAD GQFWLVYTDV KRFDGSFKDA PNYIVTAPAI EAEWSEPVYV 
NSSGFDPSLF HDDDGRKWFL NMQWNHRTES YGGSPKSPAF DGILLQEWDP VTKALKGPLR 
NIFAGSPLGL VEGPHLFKRN GWYYLTTAEG GTGYDHAVTM ARSRRIEGPY EMHPNMHLIT 
SKDHPGAVLQ RAGHGQYVET PDGEAYHTHL CGRPLPPKRR CTLGRETSLQ KCVWRDDDWL 
YLENGTSVPD VDVPGLFGAV PAEKPMRSEY SFDGGTLLAD FQWLRTPEPE RIFNLTDRPG 
HLRLIARESI GSWFEQALVA RRQEHHSFRA ETVVEFSPDT YQQVAGLTHY YNRHKFHAVA 
VTLHETLGRC VTILSCNGDY PNGRLSFPAE SDVAIAAEGR VQLAMEIREN DLQFFWQTEG 
KGAWQPIGPI LDAGMISDEG GRGEHGSFTG AFAGVFAFDT SGRGKIADFD WFNYDEL