Gene Rleg_6366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6366
Symbol
ID	8016980
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012854
Strand	+
Start bp	77729
End bp	78724
Gene Length	996 bp
Protein Length	331 aa
Translation table	11
GC content	65%
IMG OID	644828161
Product	urea amidolyase related protein
Protein accession	YP_002979361
Protein GI	241554148
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCGAGA TCATGGAAAG CGGTCCGTTC AACACAGTGC AGGATCTTGG CCGCCCCGGC 
TATCGCGACA TCGGCGTATC GGCGAGCGGC GCGATGGATC CGCTTGCGGT CCGGATCGGC 
AACATTCTCG TCGGCAACGA CGAAAACGCA GCCGCGATAG AGGTGCAGAC CTTCCCGTTC 
AGCCTGCGTT TCGAACGGCG CATCGCCTTT GCCGTGACCG GCGCGGACGG CAATTCTCAT 
CTCGACGGAT CGGAACTGCT TGCCTGGTGC GCTTATATCG CGGAGCCCGG ACAGCTTCTC 
GAACTGAAAC AGCCGCCGCT ACTGGCGCGC TCCTATATTT CGCTCGGAGG CGGGCTGGAC 
ATCCCCGTTG TCATGGGTTC GCGAAGCACG TCGCTGCGCG GCAGCTTCGG GGGCAATGCA 
GGCCGGCCTC TGGCGAAGGG CGATCGGATC GCGGTCGGGG AGGACGCAGA AATGATTATG 
CTGCCGGCCT CCGGGCTCGC CGTCGTCGAA CCGGCCGTGG CGCTGCGCGA AGTCTTCCCG 
GCTGCTGTCG ACGGCACACT GCCGATCCGC GCCCTACCGG CCGGCGAGCA TGATCTTTTC 
GCCGGAGATG GCGAAGCCTT CTGGAGCCAG ACCTGGAGGA TTTCCTCGCG AAGCGACCGG 
ACGGGCTATC GCCTGTCCGG CGAGCCGATC AAGCCGACAG CGTCCATCGA GATGCGCTCC 
CACGGTGTCG TGCCCGGCGT GATCCAGGTT CCGCCCGGCG GCGAACCGAT CGTGCAGATG 
AGCGATGCCA ACACCGCCGG CGGATATCCG AAGATCGCCG GCGTGATCGA ATGCGATCTC 
TGGCGGCTCG GCCAAGCCCG GATCGGCGCC CGGCTGAAGT TCGTTCGCTC GACGCATGCG 
GAGGCGCGCT CAGTTGAACA GGCTGTCGCC GGCTATGTCG AGGACGTCAG GCAGACATCC 
CGACTGGTCA AGCGCGCCTT GAAGGCGATG GCCTAA

Protein sequence

MIEIMESGPF NTVQDLGRPG YRDIGVSASG AMDPLAVRIG NILVGNDENA AAIEVQTFPF 
SLRFERRIAF AVTGADGNSH LDGSELLAWC AYIAEPGQLL ELKQPPLLAR SYISLGGGLD 
IPVVMGSRST SLRGSFGGNA GRPLAKGDRI AVGEDAEMIM LPASGLAVVE PAVALREVFP 
AAVDGTLPIR ALPAGEHDLF AGDGEAFWSQ TWRISSRSDR TGYRLSGEPI KPTASIEMRS 
HGVVPGVIQV PPGGEPIVQM SDANTAGGYP KIAGVIECDL WRLGQARIGA RLKFVRSTHA 
EARSVEQAVA GYVEDVRQTS RLVKRALKAM A