Gene Rleg_6439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rleg_6439
Symbol
ID	8017052
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhizobium leguminosarum bv. trifolii WSM1325
Kingdom	Bacteria
Replicon accession	NC_012854
Strand	-
Start bp	158595
End bp	159650
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	59%
IMG OID	644828234
Product	agmatinase
Protein accession	YP_002979434
Protein GI	241554221
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	0.0137522
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGTGGG ATAAAACGCG GCTCGAGCAA CTGCGCGCAG AATTTGCAGA CGCCAATGGC 
GGCGAGATAT TCGATGAGAA GTTTCGCAAA GTAGCGGAGA AGATCATCTC CAAGAGCGGC 
ACGAGACTGG CGCCATACGC CGGAGTGCCG ACCTTCCTCA GCGCACCCTA CATGCAGGTC 
GCGGCCGATG ATCCGGATTT CGGCAATCTC CAGGTTGCGA TCACCGGGAT CCCCATGGAT 
CTTGGCGTCA CCAATCGTCC AGGCTCGCGT TTCGGACCGA GAGCACTTCG CGCCATCGAA 
AGGATCGGCC CCTACAATCA TGTTCTCGCT ACGGCGCCGG TCTTCGATCT TCGGGTCGCC 
GATATCGGCG ACATATCGTT CCAAAGCCGT TACCGGTTGG AACTCAGCCA CGACGACATC 
GAAAAGCGGA TCGGCCAGAT CGTCGATGCC GGCGTGGCCC CGCTTTCCGT CGGAGGCGAT 
CATTCCATCA GCCACCCGAT ATTGAAGGCC ATCGGCCGGC ACCAACCGGT CGGCCTCATC 
CATATTGATG CCCATTGCGA TACAAGCGGC GCTTTCGATC AGACGAAGTT TCATCACGGT 
GGGCCGTTCC GCAATGCGGT GCTTGACGGC GTGCTCGATC CGACACGGAC TATCCAGATC 
GGCATCCGCG GTTCAGCGGA ATATTTGTGG GAATTCTCCT ACGCTTCGGG AATGACCGTG 
ATCCACGCAG AGGACATCAG CGGAATGGGG ATTGCGGCCG TCATTGCCAA GGCAAAATCC 
ATCGTCGGCG ACGGCCCCAC CTATCTTTCC TTCGACGTCG ACAGCCTCGA TCCGAGCTTT 
GCGCCCGGCA CGGGCACGCC CGAGGTCGGT GGATTGACCA CGCGTGAAGT CCTTGAACTG 
ATACGCGGAC TGAAGGGGAT AAATCTGGTG GGTGGTGACG TCGTCGAAGT CGCCCCGCAA 
TATGACGCAA CGACCAACAC GGCGCACGCC GCAGCACAGG TGCTCTTTGA GGTCCTGAGC 
CTCATGGTGT TTAGTCCATC GATCGGCAGG CGCTAA

Protein sequence

MVWDKTRLEQ LRAEFADANG GEIFDEKFRK VAEKIISKSG TRLAPYAGVP TFLSAPYMQV 
AADDPDFGNL QVAITGIPMD LGVTNRPGSR FGPRALRAIE RIGPYNHVLA TAPVFDLRVA 
DIGDISFQSR YRLELSHDDI EKRIGQIVDA GVAPLSVGGD HSISHPILKA IGRHQPVGLI 
HIDAHCDTSG AFDQTKFHHG GPFRNAVLDG VLDPTRTIQI GIRGSAEYLW EFSYASGMTV 
IHAEDISGMG IAAVIAKAKS IVGDGPTYLS FDVDSLDPSF APGTGTPEVG GLTTREVLEL 
IRGLKGINLV GGDVVEVAPQ YDATTNTAHA AAQVLFEVLS LMVFSPSIGR R