Gene SNSL254_A1816 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A1816
Symbol
ID	6483696
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	1780034
End bp	1781683
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	54%
IMG OID	642737192
Product	peptide transport periplasmic protein SapA
Protein accession	YP_002040944
Protein GI	194443730
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.440252
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	0.00000000112139
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGCCTGG TTTTATCGTC TCTGATCGTG ATAGCGGGTC TACTAAGTAG TCAGGCTACG 
GCTGCGGCTG CGCCCGAACA AACTGCGAGT GCAGATATTC GCGATAGCGG CTTTGTGTAT 
TGTGTCAGCG GGCAGGTCAA CACCTTTAAT CCGCAAAAAG CGAGCAGCGG CCTTATCGTC 
GATACCCTGG CAGCCCAGTT ATATGACCGC CTGTTGGATG TCGATCCCTA TACTTATCGT 
TTAGTCCCAG AGCTGGCAGA AAGCTGGGAA GTGCTGGATA ACGGGGCAAC GTACCGTTTT 
CACCTGCGCC GCGACGTTTC CTTTCAAAAA ACCGCCTGGT TTACGCCGAC CCGAAAACTC 
AATGCTGATG ATGTCGTCTT TACCTTTCAG CGGATTTTTG ATCGTCGGCA TCCGTGGCAT 
AACATCAACG GCAGTAGCTT CCCCTACTTT GATAGCCTAC AGTTCGCCGA CAATGTAAAA 
AGCGTGCGTA AGCTGGACAA TAACACCGTT GAGTTTCGCC TGACGCAGCC AGACGCCTCC 
TTTTTATGGC ATCTGGCTAC ACACTACGCT TCCGTCATGT CCGCTGAGTA CGCCGCGCAG 
CTTAGCCGAA AAGATCGTCA GGAACTGCTA GACCGCCAAC CGGTCGGCAC CGGGCCTTTC 
CAGCTTTCGG AGTACCGTGC CGGACAGTTT ATTCGTCTCC AGCGCCACGA TGGGTTTTGG 
CGCGGCAAAC CGCTGATGCC GCAAGTGGTA GTGGATTTAG GCTCCGGCGG TACCGGGCGT 
TTATCGAAAT TACTGACCGG TGAATGCGAT GTTCTGGCCT GGCCCGCCGC CAGCCAGCTA 
ACTATTTTAC GCGACGATCC GCGTTTGCGC CTGACGTTGC GCCCGGGGAT GAATATCGCC 
TATCTGGCCT TTAACACCGA TAAGCCGCCG TTGAATAATC CCGCAGTGCG CCATGCGCTG 
GCCTTATCGA TCAACAACCA GCGTCTGATG CAGTCGATTT ATTACGGCAC GGCGGAAACC 
GCAGCCTCCA TTTTACCGAG AGCCTCATGG GCTTACGATA ACGATGCCAA AATTACGGAG 
TACAATCCGG AAAAATCGCG CGAACAGCTA AAAGCGCTGG GCATTGAGAA TCTTACGCTG 
CATCTCTGGG TGCCGACCAG TTCTCAGGCC TGGAACCCAA GTCCGCTAAA AACGGCGGAG 
CTTATTCAGG CGGATATGGC GCAGGTTGGC GTAAAAGTGG TCATTGTGCC GGTTGAAGGT 
CGTTTTCAGG AGGCGCGCCT GATGGATATG AATCACGATC TGACCTTATC CGGCTGGGCC 
ACGGACAGCA ACGATCCGGA TAGCTTTTTC AGACCGCTGT TAAGCTGTGC GGCCATCAAT 
TCGCAAACCA ATTTCGCCCA CTGGTGTAAC CCTGAATTTG ACAGCGTGCT GCGTAAGGCA 
CTGTCGTCGC AGCAGTTGGC TTCGCGCATA GAAGCGTATG AGGAAGCGCA GAATATCCTG 
GAGAAAGAGC TGCCGATACT GCCGCTGGCA TCATCACTAC GCCTGCAGGC TTACCGCTAC 
GATATTAAAG GGCTGGTGTT AAGCCCGTTC GGCAATGCGT CTTTTGCCGG CGTCTCCCGC 
GAAAAACACG AAGAGGTGAA AAAACCATGA

Protein sequence

MRLVLSSLIV IAGLLSSQAT AAAAPEQTAS ADIRDSGFVY CVSGQVNTFN PQKASSGLIV 
DTLAAQLYDR LLDVDPYTYR LVPELAESWE VLDNGATYRF HLRRDVSFQK TAWFTPTRKL 
NADDVVFTFQ RIFDRRHPWH NINGSSFPYF DSLQFADNVK SVRKLDNNTV EFRLTQPDAS 
FLWHLATHYA SVMSAEYAAQ LSRKDRQELL DRQPVGTGPF QLSEYRAGQF IRLQRHDGFW 
RGKPLMPQVV VDLGSGGTGR LSKLLTGECD VLAWPAASQL TILRDDPRLR LTLRPGMNIA 
YLAFNTDKPP LNNPAVRHAL ALSINNQRLM QSIYYGTAET AASILPRASW AYDNDAKITE 
YNPEKSREQL KALGIENLTL HLWVPTSSQA WNPSPLKTAE LIQADMAQVG VKVVIVPVEG 
RFQEARLMDM NHDLTLSGWA TDSNDPDSFF RPLLSCAAIN SQTNFAHWCN PEFDSVLRKA 
LSSQQLASRI EAYEEAQNIL EKELPILPLA SSLRLQAYRY DIKGLVLSPF GNASFAGVSR 
EKHEEVKKP