Gene Rleg_1977 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_1977
Symbol
ID	8013014
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012850
Strand	-
Start bp	1977704
End bp	1978666
Gene Length	963 bp
Protein Length	320 aa
Translation table	11
GC content	64%
IMG OID	644824564
Product	urea amidolyase related protein
Protein accession	YP_002975796
Protein GI	241204700
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1984] Allophanate hydrolase subunit 2
TIGRFAM ID	[TIGR00724] biotin-dependent carboxylase uncharacterized domain

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0301643
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAAG CCGTCCTTGC AATCAACTTC GCGGGTCCTC ACGTCGCGGT CCAGGACGGA 
GGACGCCACG GATTGATGCG TTACGGCGTT CCGGCCTCTG GTCCGATGGA TAGGATCTCG 
TTTGCCGCCG CTAACGTCGC CGTCGGCAAT CCTGCCGGTC AGCCCGCAAT CGAAGTCTCC 
ATGGGCGGCC TGGTTCTCGA CTGCCTGTCG GGAGACGTTA CGTTTGCCGT CGCCGGAGGA 
GGCTTCATCG TAGAGCATGC CGGCGACAAG CGCGGCGCAT GGATGGTCGC CACGCTGAGG 
GCCGGGGAGC GGCTGGCAAT CCGTCCGGGA CACTGGGGAA GCTGGACATA TCTGGCCTTC 
GTCGGTCATA TCGAGGCGAA GACCTGGCTA GGCAGCATGT CGACGCACAG TCTCTCCGGT 
CTCGGCGGTG GGCGCCTTAC GGCCGGTCAG ATGGTCACCG TCGCCGATCC GGAAGTGCGG 
GATGATCGAC ATGGTCCGAT CACATGTCCA GTCATCGCAA GACCGCGATC CGAGCTGCGT 
GTGGTGATCG GTCCACAGGA TCGGTTCTTC TCGAAAGAAA CCCTGTCGAA TTTCCTTTCG 
TCGCCTTTCC GCCTGAGTGA CGCCTACGAC CGCATGGGCG TACGCCTACA AGGTCCGTCG 
CTTGCGCCAA GCGTTGCGCT GGACATGCCG TCGGAAGCGA TCGTGCGGGG CTCGGTGCAG 
GTGGCCGGAG ACGGTGTTCC CACCATTCTG CTGGCCGACC ACCAGACGAC CGGAGGGTAT 
CCCAAGATCG CCACGGTGGT GGATTCGGAT CTGGACGCCT TCGTCCAGCT ACGCCCCCGC 
GACCATGTCG GCTTCCTGGC CGTGACGCCG CAGCAGGCGA TCGAGCACAT CCGGCTTCGG 
GCTGCGACTA TGTCCCGTTA CCTCGCGGCG GTCTGCGACG GACCATGGAA CGTCCGAACA 
TAG

Protein sequence

MSQAVLAINF AGPHVAVQDG GRHGLMRYGV PASGPMDRIS FAAANVAVGN PAGQPAIEVS 
MGGLVLDCLS GDVTFAVAGG GFIVEHAGDK RGAWMVATLR AGERLAIRPG HWGSWTYLAF 
VGHIEAKTWL GSMSTHSLSG LGGGRLTAGQ MVTVADPEVR DDRHGPITCP VIARPRSELR 
VVIGPQDRFF SKETLSNFLS SPFRLSDAYD RMGVRLQGPS LAPSVALDMP SEAIVRGSVQ 
VAGDGVPTIL LADHQTTGGY PKIATVVDSD LDAFVQLRPR DHVGFLAVTP QQAIEHIRLR 
AATMSRYLAA VCDGPWNVRT