Gene Rleg2_4872 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg2_4872
Symbol
ID	6977966
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM2304
Kingdom	Bacteria
Replicon accession	NC_011368
Strand	+
Start bp	510397
End bp	511452
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	56%
IMG OID	643394030
Product	agmatinase
Protein accession	YP_002278848
Protein GI	209546930
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	0.739258
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.617113
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAATC CGGAAAAACT GGCACGCCTT CGGGAAAGAT ACGCGAACGC GTCAGGCGGC 
GACATCTTCG ACACGGAATT TGCCGTCGTC GCACGATCAC AGTTTACGAC TGGTGACAAG 
CGAAAGTGGC CATTCGCTGG GATCCCGACC TTGCTGGACG CTCCATGTCG TCCGGAGTTC 
CAGGATCTTC CCGATTTTGG CGGTCTGGAT ATTGCGCTCT TGGGCGTTCC GATGGATCTC 
GGAGTGACGA ACCGCAATGG CAGTCGATTT GGTCCTCGCG CCGTTCGAAC AGTCGAACGC 
ATCGGGCCCT ATGACCACGT CCTCAAATGC GCTCCCTTTG GAATGAGAAA AATCGCCGAC 
ATAGGCGATG TTCCAATGCA AAGCAGGTAC GATCTTGCCC AATGCCATCA TGATATCGAA 
CAGTTTTACA AGAAGCTAAT TGCGGCTGGC GTCAGTCCGC TTTCTGTGGG GGGCGACCAT 
TCCATCACGT CGTCAATACT CAGGGCCCTT GGCGAAAAAC AGCCGGTTGG AATGATCCAC 
ATCGATGCCC ATTGCGATAC CGCGGGTCCT TACGAGGGGG CGAAGTTTCA GCATGGCGGT 
CCGTTTCGGC TTGCCGTTCT CGATGGCGTC CTTGATCCTG ATCGTACAAT CCAGATTGGG 
ATTCGTGGCG GTGCGGAGTA TCTCTGGGAG TTCTCCTACG AAAGCGGGAT GACCGTCATT 
CATGCCGAGG AAATCAAAGG TATCGGCATG GAAGCACTCA TCGCTCGCGC TCGCCAGATC 
GTTGGTACTG GCCCAACCTA TATTTCCTTC GACATCGACA GCATCGATCC GGGATTCGCA 
CCGGGCACCG GTACGCCGGA GGTTGGGGGA TTGATGCCGC GCGAGGTTCT CGAGCTTTTG 
CGTGGCCTCA AGGGGCTTAA CGTGGTGGGC GCTGACGTCG TCGAGGTGGC TCCCCAATAC 
GATGCAACGA CAAACACTGC CCAGATCGCT GCGCAGATGC TGTTCACCAT CTTATGTCTG 
ATGGTGCATG CGAAGAGCGA ACCGGCAGGA GGTTGA

Protein sequence

MNNPEKLARL RERYANASGG DIFDTEFAVV ARSQFTTGDK RKWPFAGIPT LLDAPCRPEF 
QDLPDFGGLD IALLGVPMDL GVTNRNGSRF GPRAVRTVER IGPYDHVLKC APFGMRKIAD 
IGDVPMQSRY DLAQCHHDIE QFYKKLIAAG VSPLSVGGDH SITSSILRAL GEKQPVGMIH 
IDAHCDTAGP YEGAKFQHGG PFRLAVLDGV LDPDRTIQIG IRGGAEYLWE FSYESGMTVI 
HAEEIKGIGM EALIARARQI VGTGPTYISF DIDSIDPGFA PGTGTPEVGG LMPREVLELL 
RGLKGLNVVG ADVVEVAPQY DATTNTAQIA AQMLFTILCL MVHAKSEPAG G