Gene Rleg_2037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_2037
Symbol
ID	8013068
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	+
Start bp	2031039
End bp	2032256
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	64%
IMG OID	644824623
Product	protein of unknown function UPF0118
Protein accession	YP_002975854
Protein GI	241204758
COG category	[R] General function prediction only
COG ID	[COG0628] Predicted permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0579571
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGGTGTGT TCGACCGTCA GAAAAGCAAT CATGAACCGC GATGGCTCGG ATCGTCGGCG 
CAAACGCGCA CGCCTCTGAT TCCCTCCATT TCGGCGGCGC GCTGGTTGCT GGTCCTGGTC 
GTTGCTGCCG GCGTCTATTT CTTCTACGGC TTCCTCGTGC CGGTGCTCGC AGCCCTCGTC 
ATCGGCTTTG CCAGCTGGCC GCTCTACCGC AAACTTCTTG CCCGCGTCGG CGGCAATACG 
ACGATCGCCG CGACCATCGC GATCATCATG ATCATCACCT TCCTGGTCAT CCCGATCGGG 
CTTGCGGTCA CCTATACGAC GGGCGAAGTG CGCACCTGGG TCACCTGGGC GATCCATGCC 
AACCGCGTCG GCGCCCCGAC GCCCGACTGG ATCGTCGCAC TGCCTTGGGC CGGTGCCTAT 
CTCAATGAAG TCTGGACGAG ATATATCGGC AGCCCCGGCG CCCTCGGCGA AGTCATCCAG 
GCGGTCAGCG GCGCCAATAT CGGCAACATA TACCGCGCCG TGCTCGCGGC CGGGGGCGGC 
GCCTTCCATC TGCTGCTGAC CCTGCTCTTC ATGCTGATCG CGCTGTTCTT CGTCTATCGC 
GACGGTTTTT CCTTTTCCAA GCAGATCGAC ATGCTGGGCG AGCGCATCCT GCCCAACCGC 
TGGGAGCGCA TTTCCCGCGT CGTGCCGGCG ACGATCAGCT CCACCGTCAT GGGCATGACG 
CTGATCGCGA TCGGAGAAGG CATCGTGCTC GGCCTTGCCT ACTGGATTGC CGGCGTGCCC 
TCGCCGGTGA CGCTCGGCGT TTTGACCGGT GTGATGGCGC TGATACCGGG CGGTGCGCCG 
CTCTCCTTCA CGCTGGTCTC CATCTATCTG CTGGCGAGCG GCTCGCATGT CGCCGGCATC 
GGTCTCTTCG TCTGGGGGAC GGTCGAGCTC TTCATCGTCG ACAAGACCTT GCGGCCGAAA 
CTCGTCGGCG GTCCGATCAA GCTGCCCTTC CTACCGACCT TCTTCGGCCT CGTCGGCGGC 
GTCAAGACGA TGGGTTTCCT CGGCCTCTTC ATCGGCCCGG TGCTGATGGC GCTGATCGTC 
GCCATCTGGC GCGAGTGGAT CCACGAGGCC CGCAACGCCG ATAAGAGCGA AACCGGGCCG 
CAGATCATCA TCGACGAACA GGCCCCGCCG CCGGTCCCCG GTTCACCGAA AACCATGCCG 
CGCGTCGCCG AAGGCTGA

Protein sequence

MGVFDRQKSN HEPRWLGSSA QTRTPLIPSI SAARWLLVLV VAAGVYFFYG FLVPVLAALV 
IGFASWPLYR KLLARVGGNT TIAATIAIIM IITFLVIPIG LAVTYTTGEV RTWVTWAIHA 
NRVGAPTPDW IVALPWAGAY LNEVWTRYIG SPGALGEVIQ AVSGANIGNI YRAVLAAGGG 
AFHLLLTLLF MLIALFFVYR DGFSFSKQID MLGERILPNR WERISRVVPA TISSTVMGMT 
LIAIGEGIVL GLAYWIAGVP SPVTLGVLTG VMALIPGGAP LSFTLVSIYL LASGSHVAGI 
GLFVWGTVEL FIVDKTLRPK LVGGPIKLPF LPTFFGLVGG VKTMGFLGLF IGPVLMALIV 
AIWREWIHEA RNADKSETGP QIIIDEQAPP PVPGSPKTMP RVAEG