Gene SeAg_B1458 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeAg_B1458
Symbol
ID	6793797
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Agona str. SL483
Kingdom	Bacteria
Replicon accession	NC_011149
Strand	-
Start bp	1417806
End bp	1419455
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	54%
IMG OID	642775701
Product	peptide transport periplasmic protein SapA
Protein accession	YP_002146337
Protein GI	197249778
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.483006
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGCCTGG TTTTATCGTC TCTGATCGTG ATAGCGGGTC TACTGAGTAG TCAGGCTACG 
GCTGCGACTG CGCCCGAACA AACTGCGAGT GCAGATATTC GCGATAGCGG CTTTGTGTAT 
TGTGTTAGCG GGCAGGTCAA CACCTTTAAT CCGCAAAAAG CGAGCAGCGG CCTCATCGTC 
GATACCCTGG CCGCCCAGTT ATATGATCGC CTGTTGGATG TCGATCCCTA TACTTATCGT 
TTAGTCCCAG AGCTGGCAGA AAGCTGGGAA GTGCTGGATA ACGGGGCAAC GTACCGTTTT 
CACCTGCGCC GCGACGTTTC CTTTCAAAAA ACCGCCTGGT TTACGCCGAC CCGAAAACTC 
AATGCTGATG ATGTCGTCTT TACCTTTCAG CGGATTTTCG ATCGTCGACA TCCGTGGCAT 
AACATCAACG GCAGTAGCTT CCCCTACTTT GATAGCCTAC AGTTCGCCGA CAATGTAAAA 
AGCGTGCGTA AGCTGGACAA TAACACCGTT GAGTTTCGCC TGACGCAGCC AGACGCCTCC 
TTTTTATGGC ATCTGGCCAC ACACTACGCT TCCGTCATGT CCGCTGAGTA CGCCGCGCAG 
CTTAGCCGAA AAGATCGTCA GGAACTGCTA GACCGCCAAC CGGTTGGCAC CGGGCCTTTC 
CAGCTTTCGG AGTACCGTGC CGGGCAGTTT ATTCGTCTCC AGCGCCACGA TGGGTTTTGG 
CGCGGCAAAC CGCTGATGCC GCAAGTGGTG GTGGATTTAG GCTCCGGCGG TACCGGGCGT 
TTATCGAAAT TACTGACCGG TGAATGCGAT GTTCTGGCCT GGCCCGCCGC CAGCCAGCTA 
ACTATTTTAC GCGACGATCC GCGTTTACGT CTGACGTTGC GCCCGGGGAT GAATATCGCC 
TATCTGGCCT TTAACACCGA TAAGCCGCCG TTGAATAATC CCGCAGTGCG CCATGCGCTG 
GCCTTATCGA TCAACAACCA GCGTCTGATG CAGTCGATTT ATTACGGCAC GGCGGAAACC 
GCAGCCTCCA TTTTACCGAG AGCCTCATGG GCTTACGATA ACGATGCCAA AATTACGGAG 
TACAATCCGG AAAAATCGCG CGAACAGCTA AAAGCGCTGG GCATTGAGAA TCTTACGCTG 
CATCTCTGGG TGCCGACCAG TTCTCAGGCC TGGAACCCAA GTCCGCTAAA AACGGCGGAG 
CTTATTCAGG CGGATATGGC GCAGGTTGGC GTAAAAGTGG TCATTGTGCC GGTTGAAGGT 
CGTTTTCAGG AGGCGCGCCT GATGGATATG AATCACGATC TGACCTTATC CGGCTGGGCC 
ACGGACAGCA ACGATCCGGA TAGCTTTTTC AGACCACTGT TAAGCTGTGC GGCCATCAAT 
TCGCAAACCA ATTTCGCCCA CTGGTGTAAC CCTGAATTTG ACAGCGTGCT GCGTAAAGCA 
CTGTCGTCGC AGCAGTTGGC TTCGCGCATA GAAGCATATG AGGAAGCGCA GAATATCCTG 
GAGAAAGAGC TGCCGATACT GCCGCTGGCA TCATCACTAC GCCTGCAGGC TTACCGCTAC 
GATATTAAAG GGCTGGTGTT AAGCCCGTTC GGCAATGCGT CTTTTGCCGG CGTCTCCCGC 
GAAAAACACG AAGAGGTGAA AAAACCATGA

Protein sequence

MRLVLSSLIV IAGLLSSQAT AATAPEQTAS ADIRDSGFVY CVSGQVNTFN PQKASSGLIV 
DTLAAQLYDR LLDVDPYTYR LVPELAESWE VLDNGATYRF HLRRDVSFQK TAWFTPTRKL 
NADDVVFTFQ RIFDRRHPWH NINGSSFPYF DSLQFADNVK SVRKLDNNTV EFRLTQPDAS 
FLWHLATHYA SVMSAEYAAQ LSRKDRQELL DRQPVGTGPF QLSEYRAGQF IRLQRHDGFW 
RGKPLMPQVV VDLGSGGTGR LSKLLTGECD VLAWPAASQL TILRDDPRLR LTLRPGMNIA 
YLAFNTDKPP LNNPAVRHAL ALSINNQRLM QSIYYGTAET AASILPRASW AYDNDAKITE 
YNPEKSREQL KALGIENLTL HLWVPTSSQA WNPSPLKTAE LIQADMAQVG VKVVIVPVEG 
RFQEARLMDM NHDLTLSGWA TDSNDPDSFF RPLLSCAAIN SQTNFAHWCN PEFDSVLRKA 
LSSQQLASRI EAYEEAQNIL EKELPILPLA SSLRLQAYRY DIKGLVLSPF GNASFAGVSR 
EKHEEVKKP