Gene Rleg2_6261 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_6261
Symbol
ID	6983334
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011370
Strand	+
Start bp	203740
End bp	205473
Gene Length	1734 bp
Protein Length	577 aa
Translation table	11
GC content	57%
IMG OID	643399270
Product	5-oxoprolinase (ATP-hydrolyzing)
Protein accession	YP_002284026
Protein GI	209552110
COG category	[E] Amino acid transport and metabolism [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0146] N-methylhydantoinase B/acetone carboxylase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0857847
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.425917
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAACA GAAATATCGA TCCTATCAGC TTCGCGGTCA TAAAGAGCGC GCTGGACACA 
ATCGTCGACG ACATGGCCTA CGCGGTGATG CGCACTGCCC GCTCGCCGAT CGTACGTGAC 
ATTCTGGATT ACTCGGCGAC GCTTTGCGAT CGCGAAGGCC GGATCCTGAC CCAGGCGAAA 
ACAGTAGCTC TACATCTCGG TGCGGTACCG GACGCGATGG AAGTTATCAC CAGCCGCTTC 
TCGGCGACTG CCCGACCTGG TGACGTATTC ATCTTGAATG ATCCCTATCA GGGTGGCATG 
CACCTCCCCG ACATCTTCAT GTTTAAGCCG CTGTTCTTCC GGGACAAGCT TGAAGGGTTC 
TCCGTGGTCA TCTTCCATCA CTGCGACGTC GGTGGCCGTG TCCCAGGTTC CAACGCGGCA 
GATTCTACCG AAATCTTCCA GGAAGGCATC CGGATTCCGC CTGTGAAGCT CTACGACAAA 
GGTGAGCCCA ACAACTGGAT CTTCGACATC ATCAGGGAGA ACGTTCGTCT TCCCGATCTC 
GTTATCGGCG ACCTAGAATC GCAGCTTGCC ACCTGCAATA TTGGCGAGCG TGAATATCTA 
AAGCTCTTCG AACGCCACGG ATCTGAGGTT CTCAATGAGT ACTTCGACGA GCTCATGGAC 
TATGGCGAGC AGATGACCCG GAAGGCGATC TCTTCTTGGC CGGACGGCGA CTACGAGTTC 
ACCGACTATG TCGATGGCGA TGGTTTTAGC ACCGCACCGA TCCCTATCAA GTGCAAGATG 
ACGGTTGCAG GCGATCATCT GACGGTGGAT TTCGAAGGCA CATCGCCGCA GGTTCGCGGC 
GCAATCAATC CGACCTTCTC TTTTACGAAG TCTGCCACTT ACCTCACCAT CCGATGCGCC 
CTCGATCAAG ACGTTCCGAA CAATGCTGGC GTTTATCGCG CGATCACCGT CAAGGCTCCG 
CTCGGGACTA TCCTCAATCC AATCTCCCCG GCGCCAGTCG CGGCCCGCGC TCTGACCGGA 
TACCGTGTCA TGGATACCGT GATGGGCGCC TTGGCTCAGG TGGCTCCGAA AAAGGTGATC 
GCCGCCAGTG AGGGGGGGAA CACCGTTATT GCGTTCGGCG GCTACGACAA GAAGTCCGGA 
GAGCCCTTCA TCCTCGTTGA TATGATCAAC GGAGCTTGGG GCGGCCGCTT CAATAAGGAC 
GGTATCGAAG GCGTGACCAA CCCGGGGCAA AACCTCTCAA ACCTGCCTGT CGAGAGCCTC 
GAGGCACGGT ACCCTCTGCG CATTGACGAA TACTGCCTCC GTGACGACTC CTGTGGTGCG 
GGCGAATTTC GTGGCGGACT TGGTCTCGCC CGACAGTATC GGTTCCTGGC CGACGAAGCG 
ATTCTTCAAA TTCGTGCGGA CCGATACGCC CATGCTCCAT ACGGGTTGTT CGGAGGGGAA 
GCGGCAGCAT TCACCCGAAA CCTGCTCGAC CCGGGTAGCG AAGGCGAAGT CCTCCTTCCA 
TCGAAGGTCA CACGGCAGGT TGAAAAAGGT CTCGTCTTCC GTCACGAGCA GTCGGGTGGT 
GGTGGTTACG GCGACCCGCT GAAGCGCTCC CTTGAGCTGA TCTCCAAGGA TCTCGGCAAC 
GGAAAGATCT CGCGTCGTTA CGCAGAGGAA AAGCATGCTG TTGTCTTTGT CGGAGATGGC 
TTTGAGATCG ATCGCGCCGG AACAGAAGCG GCCCGCGACG TACGCTCCGC ATAG

Protein sequence

MTNRNIDPIS FAVIKSALDT IVDDMAYAVM RTARSPIVRD ILDYSATLCD REGRILTQAK 
TVALHLGAVP DAMEVITSRF SATARPGDVF ILNDPYQGGM HLPDIFMFKP LFFRDKLEGF 
SVVIFHHCDV GGRVPGSNAA DSTEIFQEGI RIPPVKLYDK GEPNNWIFDI IRENVRLPDL 
VIGDLESQLA TCNIGEREYL KLFERHGSEV LNEYFDELMD YGEQMTRKAI SSWPDGDYEF 
TDYVDGDGFS TAPIPIKCKM TVAGDHLTVD FEGTSPQVRG AINPTFSFTK SATYLTIRCA 
LDQDVPNNAG VYRAITVKAP LGTILNPISP APVAARALTG YRVMDTVMGA LAQVAPKKVI 
AASEGGNTVI AFGGYDKKSG EPFILVDMIN GAWGGRFNKD GIEGVTNPGQ NLSNLPVESL 
EARYPLRIDE YCLRDDSCGA GEFRGGLGLA RQYRFLADEA ILQIRADRYA HAPYGLFGGE 
AAAFTRNLLD PGSEGEVLLP SKVTRQVEKG LVFRHEQSGG GGYGDPLKRS LELISKDLGN 
GKISRRYAEE KHAVVFVGDG FEIDRAGTEA ARDVRSA