Gene Rleg2_6250 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6250
Symbol
ID	6983323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011370
Strand	-
Start bp	191326
End bp	192807
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	54%
IMG OID	643399259
Product	Alpha-N-arabinofuranosidase
Protein accession	YP_002284015
Protein GI	209552099
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG3534] Alpha-L-arabinofuranosidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.522312
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGGAAA ACTTGACAGG TGGTTTTGCG CAAGTGAGAG CGTCGAAGCA GCAGGAGTCT 
CGGAGATGGA ATCCGATGAT ACTCGGGCAT TTTGTCGAAC ATTTTCACAA TCAAATCTAT 
GGCGGCGTCT TCGATCCGGG TTCGCATCTA GCGGACGACC GAGGTTTCCG TCTCGACGTC 
ATCGAAGCGT TGAAAGAATT ACGGCCCCCG ATTGTTAGGT GGCCCGGCGG CAATTTCGTT 
TCGGATTACC ATTGGTATGA GGCCGTGGGT GCAAACCGGC TGCCAAGCTA CAATAAGGCT 
TGGCGTGTGG CCGAGCCCAA CACTTTTGGG ACCGACGAAT TTATTGAGTG GTGCCGGAGA 
CTAAATTGCG AGCCCTACAT CTGCACCAAT GCGGGTAGTG GCACGCCCGA AGAAATGAGC 
AATTGGCTCG AATACTGCAA CGGGCATCTC GAAACCCGAT ACGCAAATTT GCGTCGAAAG 
AGCGGATATG AACGTCCACA CGCAGTAAAG TATTGGGGAA TCGGAAACGA GAGTTATGCA 
GATTTCCAGA TCGGCGCCAA AACTATAGGG GAGTGGGGTC CTTATGTCGC CGAAGCGGCA 
AAAATGATGC GTTCGGTGGA CGACACTATC GTCCTTTCAG CGGCTGCGGT ACCCGATACG 
GAATGGACCC TAAACCTCCT GAAACACGCA GGTCGCTATC TCGACCTGGT TTCGATACAC 
GGCTACTGGG ATGATCTGGA ACACCACGAC GAGCCGTCCG ACTATCTGAC GGCGGTCCTT 
CGCTCTCACG AGCCGGAGAA GATGATCGAC GGCGCACGTG AGATCATCGC ACTGGCGGGG 
CTGGAAGGAC AAATTCAAAT AGCATTTGAT GAGTGGAACC TTCGCGGGTG GCATCACCCT 
CGTGGGACGC ATGAAGAAAA GATAAGGGCT CGTGACAGGA ACGACCGAGC TGAAACCTAC 
ACGATGGCGG ATGCTCTGTT CACAGCCTCG TTCCTGAATT CATGCCTTCG TAACAGCGAT 
ATCGTGTCGA TGGCGAACGT TTCGCCGAGC ATCAATGCAA GAGGACCGCT GTACGTCCAT 
GGCGGCGGCG TTGTACGCCG CTCGACATTC TACGTTTTAA AAGCCTATAA CGATCACTTG 
AAACCGTGGA TCGGATCGAC AAGCGTAAAT GGCCCGACAC TGCGTCATGC AGGGGCCGAA 
ATAGCAACGA TCGAGGCACT GACCTCGTCC GACGGGGCTT CTCGCAACTT ATTCATTGTC 
AATCGCGACC CTCACGACGC GATCCTTTGC GAACTATATT TCGACAATCA CCGGTTGGAT 
GGCGACCGAG TAGTCACTGT TATCTCGGGC CTAACGGCCG ACTCCTTTAA CACGGTAGAA 
GCCCCTGACA TGGTGTCACC GAGGGCTCAA CCTCTGGTGA GGCAAGGCGG AGGTTACTAC 
ATTCCTCCTC ATTCTCTCTG CGTGCTGGAA GTTCCCGGCT GA

Protein sequence

MEENLTGGFA QVRASKQQES RRWNPMILGH FVEHFHNQIY GGVFDPGSHL ADDRGFRLDV 
IEALKELRPP IVRWPGGNFV SDYHWYEAVG ANRLPSYNKA WRVAEPNTFG TDEFIEWCRR 
LNCEPYICTN AGSGTPEEMS NWLEYCNGHL ETRYANLRRK SGYERPHAVK YWGIGNESYA 
DFQIGAKTIG EWGPYVAEAA KMMRSVDDTI VLSAAAVPDT EWTLNLLKHA GRYLDLVSIH 
GYWDDLEHHD EPSDYLTAVL RSHEPEKMID GAREIIALAG LEGQIQIAFD EWNLRGWHHP 
RGTHEEKIRA RDRNDRAETY TMADALFTAS FLNSCLRNSD IVSMANVSPS INARGPLYVH 
GGGVVRRSTF YVLKAYNDHL KPWIGSTSVN GPTLRHAGAE IATIEALTSS DGASRNLFIV 
NRDPHDAILC ELYFDNHRLD GDRVVTVISG LTADSFNTVE APDMVSPRAQ PLVRQGGGYY 
IPPHSLCVLE VPG