Gene SeD_A3420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A3420
Symbol	speB
ID	6872134
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	-
Start bp	3286612
End bp	3287532
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	56%
IMG OID	642786417
Product	agmatinase
Protein accession	YP_002217055
Protein GI	198246071
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	0.0247827
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCT TAGGTCATCA GTACGATAAC TCACTGGTTT CTAATGCGTT TGGTTTTTTA 
CGTCTGCCAA TGAACTTCCA GCCGTATGAC AGCGATGCCG ACTGGGTGAT CACTGGCGTA 
CCGTTTGATA TGGCAACGTC CGGTCGCGCT GGCGGCCGTC ATGGCCCGGC GGCGATCCGT 
CAGGTGTCGA CCAACCTCGC CTGGGAACAT CACCGTTTCC CGTGGAGTTT TGACATGCGC 
GAGCGCCTGA ACGTCGTGGA CTGCGGCGAT TTGGTGTATG CGTTTGGCGA TGCCCGTGAG 
ATGAGTGAAA AATTACAGGC GCACGCTGAA AAACTGCTGT CTGCAGGCAA GCGTATGCTC 
TCTTTCGGCG GCGACCACTT CGTCACGCTG CCGCTGCTGC GCGCCCACGC GAAACATTTT 
GGCAAAATGG CGCTGGTACA TTTTGATGCG CATACCGATA CCTACGCTAA CGGCTGCGAA 
TTCGATCACG GCACGATGTT CTACACCGCG CCGAAAGAAG GCCTGATCGA TCCGCATCAT 
TCGGTACAGA TCGGTATTCG TACTGAGTTT GACAAAGACA ATGGCTTTAC CGTGCTGGAT 
GCCTGCCAGG TCAACGATCG CGGCGTGGAT GATATTCTCG CTCAGGTGAA ACAGATCGTC 
GGCGATATGC CGGTCTATCT GACCTTTGAT ATCGACTGTC TGGACCCGGC GTTTGCGCCT 
GGCACCGGTA CGCCGGTGAT CGGCGGTTTG ACCTCCGATC GCGCCATTAA ACTGGTACGC 
GGTCTGAAAG ATCTGAACAT TGTCGGTATG GATGTAGTGG AAGTCGCGCC GGCTTACGAT 
CAGTCGGAGA TCACCGCTCT GGCGGCCGCG ACGCTGGCAT TAGAAATGCT CTATATCCAG 
GCGGCGAAGA AAGGCGAGTA A

Protein sequence

MSTLGHQYDN SLVSNAFGFL RLPMNFQPYD SDADWVITGV PFDMATSGRA GGRHGPAAIR 
QVSTNLAWEH HRFPWSFDMR ERLNVVDCGD LVYAFGDARE MSEKLQAHAE KLLSAGKRML 
SFGGDHFVTL PLLRAHAKHF GKMALVHFDA HTDTYANGCE FDHGTMFYTA PKEGLIDPHH 
SVQIGIRTEF DKDNGFTVLD ACQVNDRGVD DILAQVKQIV GDMPVYLTFD IDCLDPAFAP 
GTGTPVIGGL TSDRAIKLVR GLKDLNIVGM DVVEVAPAYD QSEITALAAA TLALEMLYIQ 
AAKKGE