Gene Smed_2366 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Smed_2366
Symbol
ID	5323227
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Sinorhizobium medicae WSM419
Kingdom	Bacteria
Replicon accession	NC_009636
Strand	+
Start bp	2444076
End bp	2445326
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	64%
IMG OID	640791304
Product	allantoate amidohydrolase
Protein accession	YP_001328033
Protein GI	150397566
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID	[TIGR01879] amidase, hydantoinase/carbamoylase family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.291014
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	0.850534
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGCAC CTGGCGAGAA TAGGCGCGTC AATGCCGATC GCCTGTGGGA TTCGTTGATG 
GAAATGGCGA AGATCGGCCC CGGCGTTGCC GGCGGCAATA ACCGCCAGAC CTTGACGGAT 
GCGGACGGTG AAGGCCGCCG GCTTTTCCAG TCCTGGTGCG AAAAGGCGGG GCTCTCCATG 
GGTGTCGACA AGATGGGCAC CATGTACATG ACCCGCCCGG GTACCGATTC GGATGCGCTG 
CCCGTCCATA TCGGCTCTCA CCTCGACACG CAGCCGACGG GCGGCAAGTT CGACGGTGTG 
CTCGGCGTTC TGAGCGGTCT CGAAGTCGTA CGCACGATGG ACGACCTCGG GATCAGGACG 
AAGCACCCGG TCGTCGTGAC CAACTGGACC AACGAGGAAG GCGCCCGCTT CGCGCCTGCC 
ATGCTCGCCT CCGGCGTCTT TGCCGGCGTC CACACGCTTG ATTACGCCTA TGCCCGAAAG 
GACCCGGAAG GGAAGAGCTT CGGCGACGAA TTGAAGCGCA TCGGCTGGTC CGGCGACGAA 
GAGGTGGGCG CGCGCAAGAT GCACGCCTAT TTCGAATACC ACATCGAACA AGGCCCGATT 
CTCGAGGCCG AGAACAGGCA GATCGGCGTC GTCACACACT GCCAGGGCCT CTGGTGGCTG 
GAGTTCACGC TGACGGGCAA GGAGGCGCAT ACGGGCTCGA CGCCGATGGA GATGCGCGTC 
AATGCGGGCC TTGCCATGGC GCGCATTCTC GAAATGGTTC AGACCGTCGC GATGGAAAAC 
CAGCCGGGCG CTGTCGGCGG TGTCGGCCAG ATGTTCTTTT CGCCAAATTC CCGCAACGTG 
CTGCCCGGCA AAGTGGTGTT CACGGTCGAT ATCCGCTCGC CCGACCAGAC CAAGCTCGAC 
CGCATGCGGG CCCGGATCGA AGCCGAAGCG CCCAAAATCT GCGAGCGGCT CGGGGTTGGC 
TGTTCGATCG AGGCGGTCGG GCACTTCGAT CCCGTCACCT TCGATCCGAA GCTGGTCGAA 
ACCGTGCGCG GCGCCGCCGA GAAGCTCGGC TACAGCCACA TGAACCTCGT CTCGGGCGCG 
GGCCACGATG CCTGCTGGGC CGCGAAGGTC GCGCCGACCA CCATGATCAT GTGCCCCTGC 
GTCGATGGGC TCAGTCATAA CGAGGCGGAG GACATCTCCA AGGATTGGGC GGCCGCCGGC 
GCGGACGTCC TCTTTCATGC CGTCCTCGAG ACGGCGGAAG TCGTGGAATG A

Protein sequence

MAAPGENRRV NADRLWDSLM EMAKIGPGVA GGNNRQTLTD ADGEGRRLFQ SWCEKAGLSM 
GVDKMGTMYM TRPGTDSDAL PVHIGSHLDT QPTGGKFDGV LGVLSGLEVV RTMDDLGIRT 
KHPVVVTNWT NEEGARFAPA MLASGVFAGV HTLDYAYARK DPEGKSFGDE LKRIGWSGDE 
EVGARKMHAY FEYHIEQGPI LEAENRQIGV VTHCQGLWWL EFTLTGKEAH TGSTPMEMRV 
NAGLAMARIL EMVQTVAMEN QPGAVGGVGQ MFFSPNSRNV LPGKVVFTVD IRSPDQTKLD 
RMRARIEAEA PKICERLGVG CSIEAVGHFD PVTFDPKLVE TVRGAAEKLG YSHMNLVSGA 
GHDACWAAKV APTTMIMCPC VDGLSHNEAE DISKDWAAAG ADVLFHAVLE TAEVVE