Gene SNSL254_A0476 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A0476
Symbol	phnS
ID	6482449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	486545
End bp	487558
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	57%
IMG OID	642735897
Product	2-aminoethylphosphonate ABC transporter 2-aminoethylphosphonate binding protein
Protein accession	YP_002039671
Protein GI	194443954
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID	[TIGR03227] 2-aminoethylphosphonate ABC transporter, periplasmic 2-aminoethylphosphonate binding protein

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	0.547307
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACTTT CCCGACTTGC TCTGCTGTCT GTCTTCGCTC TCGCCAGCGC CCCGTCATGG 
GCGGAATCGG TGGTCACGGT GTACTCCATC GACGGGCTGC ACGATGGCGA TAACAGCTGG 
TACCAGGTGC AGTTTGACGC GTTCACCAAA GCGACCGGCA TTACCGTACG CTATGTTGAA 
GGCGGTGGTG GCGTGGTAGT GGAACGTCTG GCAAAAGAGC ATACGAATCC GCAGGCCGAC 
GTGCTGGTAA CCGCGCCGCC ATTCATTCAG CGCGCCGCCG CCGAAAAGCT GCTGGCGAAC 
TTTAACACCG ACGCCGCATC GGCTATCCCC GATGCCAACA ACCTTTATTC GCCGCTGGTA 
AAGAACTATC TGAGCTTTAT CTACAACAGC AAGCTGCTGA AAACTGCCCC GGCGAGCTGG 
CAGGATCTGC TTGACGGTAA CTTCAAAAAT AAACTCCAGT ATTCCACGCC AGGTCAGGCC 
GCTGACGGCA CGGCGGTGAT GCTGCAGGCT TTCCACAGCT TCGGCAGTAA AGATGCCGGT 
TTTGCGTATC TCGGCAAGCT GCAGGCCAAT AACGTCGGGC CATCTGCCTC TACCGGCAAG 
CTAACCGCGC TGGTTAATAA AGGTGAAATC TACGTCGCTA ACGGCGACCT GCAAATGAAC 
CTCGCGCAGA TGGAACGTAA CCCGAACGTG AAAATCTTCT GGCCGGCCAA CGACAAAGGC 
GAGCGCAGCG CGCTGGCCAT CCCTTATGTC ATTGGCCTGG TCCAGGGGGC GCCGCAGAGT 
GAAAATGGTA AAAAGCTGAT TAACTTCCTG CTGAGTAAAG AAGCGCAGAC TCGCGTCAGC 
GAACTCTCCT GGGGAATGCC GGTACGCAGC GACGTGACGC CGAGCGACGA ACATTACAAG 
ACCGCCACTG CCGCGTTAGA AGGCGTGCAG AGCTGGCAGC CAAATTGGGA TGACGTAGCC 
GTTTCGCTGT CGGCAGATAT TAGCCGTTGG CACAAAGTGA CCGAAAGCGA GTAA

Protein sequence

MKLSRLALLS VFALASAPSW AESVVTVYSI DGLHDGDNSW YQVQFDAFTK ATGITVRYVE 
GGGGVVVERL AKEHTNPQAD VLVTAPPFIQ RAAAEKLLAN FNTDAASAIP DANNLYSPLV 
KNYLSFIYNS KLLKTAPASW QDLLDGNFKN KLQYSTPGQA ADGTAVMLQA FHSFGSKDAG 
FAYLGKLQAN NVGPSASTGK LTALVNKGEI YVANGDLQMN LAQMERNPNV KIFWPANDKG 
ERSALAIPYV IGLVQGAPQS ENGKKLINFL LSKEAQTRVS ELSWGMPVRS DVTPSDEHYK 
TATAALEGVQ SWQPNWDDVA VSLSADISRW HKVTESE