Gene Smed_5202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_5202
Symbol
ID	5319504
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009621
Strand	+
Start bp	162271
End bp	163500
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	57%
IMG OID	640776980
Product	arginine deiminase
Protein accession	YP_001313912
Protein GI	150377317
COG category	[E] Amino acid transport and metabolism
COG ID	[COG2235] Arginine deiminase
TIGRFAM ID	[TIGR01078] arginine deiminase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTACTG TCGGTGTCCA TTCGGAAGTC GGTAAGCTTA GAACGGTGAT GGTCTGCAGA 
CCATCCTTGG CTCATCAACG GCTGACGCCG GGCAACTGTC ACGACTTGCT TTTCGATGAT 
GTCGTCTGGG TGCATGAGGC GCAGAAGGAC CATTACGATT TCGTTCTGAA AATGCAGGAA 
CGAGGTGTGG AGGTCCTAGA GTTGCACGAC CTTCTAACCG ACACTCTGAT GGATGCCGAA 
GCGCGCAAGT TCGTGCTTGA TCGCCGGGCC ACACCCAATG TCATGGGATC CCAAATCGCC 
GAACTCGTCC GTCCTTGGAT GGAGGAAATG GATCCCAAGC GCCTGGCTGC TTTCCTGATC 
GGTGGAATCT CTGTTGCAGA CCTCCCGGAG GGACAGGGCA AGACCCTGAT GGCATCAGCC 
TTCGGAGCCA CCGAATTTGT CCTTCCCCCG ATACCCAACA CCCTGTTTCA GCGCGATCCG 
TCCTGCTGGA TTTACAACGG AGTGACGTGC AACCCCATGT TCTGGCCGGC GCGGCGCGCA 
GAAACTCTGG TTCAAAGGGC GATCTACAAG TTTCACCCTT CCTTCAAGAG TGCGAGCTTC 
GATATTTGGT GGGGCGACTC CGACGAGCAG TTTGCCAACG CCACGATCGA AGGCGGCGAC 
GTTATGCCTA TCGGCAATGG TACCCTTCTG GTGGGAATGG GGGAACGGAC CACTTACCAA 
GCGGTTGGCC AGGTTGCCAA AACCTTGTTC AAGTCGGGAG CCGCTACGCG CGTCATCGGC 
TGCCTTATGC CGAGGAGCCG CGCGGCGATG CACCTCGACA CGGTATTCAC ATTCTGTGAT 
CGCGACGTAG TGACGCTATT CGCCGAGGTT GTAGATCGGA TCCGCTGCTA CAGCATGATC 
CCTCTCGACG ATGAGGGAAA TTTCGAGGTG CGGCAGGAAG ATCGACCCAT GCTTGAAGTT 
GTTGCCGAAG CATTAGGCGT CGACAAGCTT CGCACTATCG CAACCGGCGG CAACACCTAT 
GAGGCTGAGC GCGAACAATG GGACGACGGA AACAATGTCG TCGCGCTCGA GCCGGGAGTA 
GTCGTTGCTT ATGATCGGAA CACCTATACC AACACCCTGC TCCGCAAGGC AGGCATCGAG 
GTCATCACAA TCCGTGGCTC CGAATTGGGC CGAGGACGCG GCGGCGGTCA TTGCATGACG 
TGTCCGATCT GGCGAGAGCC GACTGAATGA

Protein sequence

MRTVGVHSEV GKLRTVMVCR PSLAHQRLTP GNCHDLLFDD VVWVHEAQKD HYDFVLKMQE 
RGVEVLELHD LLTDTLMDAE ARKFVLDRRA TPNVMGSQIA ELVRPWMEEM DPKRLAAFLI 
GGISVADLPE GQGKTLMASA FGATEFVLPP IPNTLFQRDP SCWIYNGVTC NPMFWPARRA 
ETLVQRAIYK FHPSFKSASF DIWWGDSDEQ FANATIEGGD VMPIGNGTLL VGMGERTTYQ 
AVGQVAKTLF KSGAATRVIG CLMPRSRAAM HLDTVFTFCD RDVVTLFAEV VDRIRCYSMI 
PLDDEGNFEV RQEDRPMLEV VAEALGVDKL RTIATGGNTY EAEREQWDDG NNVVALEPGV 
VVAYDRNTYT NTLLRKAGIE VITIRGSELG RGRGGGHCMT CPIWREPTE