Gene SNSL254_A3324 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A3324
Symbol	speB
ID	6483592
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	3228877
End bp	3229797
Gene Length	921 bp
Protein Length	306 aa
Translation table	11
GC content	56%
IMG OID	642738616
Product	agmatinase
Protein accession	YP_002042337
Protein GI	194443030
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0010] Arginase/agmatinase/formimionoglutamate hydrolase, arginase family
TIGRFAM ID	[TIGR01230] agmatinase

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0546446
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	66
Fosmid unclonability p-value	0.86641
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCACCT TAGGTCATCA GTACGATAAC TCACTGGTTT CTAATGCGTT TGGTTTTTTA 
CGTCTGCCAA TGAACTTCCA GCCGTATGAC AGCGATGCCG ACTGGGTGAT CACTGGCGTA 
CCGTTTGATA TGGCAACGTC CGGTCGCGCT GGCGGTCGTC ATGGCCCGGC GGCGATCCGT 
CAGGTGTCGA CCAACCTCGC CTGGGAACAT CACCGTTTCC CGTGGAATTT TGACATGCGC 
GAGCGCCTGA ACGTCGTGGA CTGCGGCGAT TTGGTGTATG CGTTTGGCGA TGCCCGTGAG 
ATGAGTGAAA AATTACAGGC GCACGCTGAA AAACTGCTGT CTGCAGGCAA GCGTATGCTC 
TCTTTCGGCG GCGACCACTT CGTCACGCTG CCGCTGCTGC GCGCCCACGC GAAACATTTT 
GGCAAAATGG CGCTGGTACA TTTTGACGCG CATACCGATA CCTACGCTAA CGGCTGCGAA 
TTCGATCACG GCACGATGTT CTACACCGCG CCGAAAGAAG GCCTGATCGA TCCGCATCAT 
TCGGTACAGA TCGGTATTCG CACTGAGTTT GACAAAGACA ATGGCTTTAC CGTGCTGGAT 
GCCTGCCAGG TCAACGATCG CGGCGTGGAT GATATTCTCG CTCAGGTGAA ACAGATCGTC 
GGCGATATGC CGGTCTATCT GACCTTTGAT ATCGACTGTC TGGATCCGGC GTTTGCGCCT 
GGCACCGGTA CGCCGGTGAT CGGCGGTTTG ACCTCCGATC GCGCCATTAA ACTGGTACGC 
GGTCTGAAAG ATCTGAACAT TGTCGGTATG GATGTAGTGG AAGTCGCGCC GGCTTACGAT 
CAGTCGGAGA TCACCGCTCT GGCGGCCGCG ACGCTGGCAT TAGAAATGCT CTATATCCAG 
GCGGCGAAGA AGGGCGAGTA A

Protein sequence

MSTLGHQYDN SLVSNAFGFL RLPMNFQPYD SDADWVITGV PFDMATSGRA GGRHGPAAIR 
QVSTNLAWEH HRFPWNFDMR ERLNVVDCGD LVYAFGDARE MSEKLQAHAE KLLSAGKRML 
SFGGDHFVTL PLLRAHAKHF GKMALVHFDA HTDTYANGCE FDHGTMFYTA PKEGLIDPHH 
SVQIGIRTEF DKDNGFTVLD ACQVNDRGVD DILAQVKQIV GDMPVYLTFD IDCLDPAFAP 
GTGTPVIGGL TSDRAIKLVR GLKDLNIVGM DVVEVAPAYD QSEITALAAA TLALEMLYIQ 
AAKKGE