Gene SNSL254_A2410 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A2410
Symbol
ID	6486635
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	+
Start bp	2327441
End bp	2329246
Gene Length	1806 bp
Protein Length	601 aa
Translation table	11
GC content	52%
IMG OID	642737749
Product	extracellular solute-binding protein
Protein accession	YP_002041491
Protein GI	194442375
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4166] ABC-type oligopeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	42
Fosmid unclonability p-value	0.00115101
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGATTGCGC GCGTAATGCT TCTGCTTGTC GCACTGGTTA GCGCTGGCGC CCAGGCCCAG 
GAAATCAAAG AAAGCTACGC TTTCGCCGTA CTCGGCGAAC CTAAGTATGC TTTTAACTTT 
GATCACTTTG ATTATGTGAA TCCTGCTGCG CCGAAAGGCG GTCAGATGAC GCTTTCCGCC 
ATTGGTACGT TCGATAATTT CAATCGCTAT TCGCTGCGCG GCAATCCCGG CGTACGTACC 
GAAGCCCTTT ACGATACGCT TTTTACCACC TCGGATGATG AGCCCGGAAG CTATTACCCG 
CTGATTGCCG ACCATGCCCG CTATGCCGCC GACTATTCCT GGGTGGAAAT CTCGATTAAC 
CCCCGCGCTC GTTTTCACGA TGGCACGCCC ATTACCGCCC GCGATGTGGC TTTTACCTTT 
CATAAGTTCA TGACCGAAGG CGTACCGCAG TTCCGTCTGG TCTATAAAGG TACTACCGTG 
AAGGCGATTG CGCCTTTAAC CGTGCGAATT GAGCTGGCGA AGCCTGGTAA AGAAGACATG 
CTTAGTCTGT TTTCACTACC GATCATGCCC GAAAAATTCT GGAAAAATCA CAAACTCAGC 
GATCCACTTT CAACGCCGCC CTTAGCCAGC GGGCCATACC GGATTACTCA GTGGAAAATG 
GGCCAGTACA TTGTCTATTC ACGCGTCAAA AACTACTGGG CGGCTAATCT GCCGGTCAAT 
CGTGGACGTT TTAACCTCGA CACTATCCGC TACGATTACT ACCTTGATGA CAATGTCGCT 
TTCGAGGCGT TTAAAGCGGG CGCATTTGAT CTACGGCTGG AAAACGACGC TAAAAACTGG 
GCAACGCGCT ATATCGGTAA AAATTTCGAT AATCATTACA TCATTAAAGA AGAGCAGAAA 
AACGAGTCGG CGCAGGACAC ACGCTGGCTG GCCTTTAATA TTCAGCGCCC GGTATTTAAA 
GACCGGCGGG TACGTGAAGC TGTCACCCTG GCCTTCGATT TTGAGTGGAT GAATAAAGCG 
CTGTTCTATA ATGCCTGGAG CCGAACCAAC AGTTACTTCC AGAATACCGA GTACGCCGCC 
AGAAATTACC CTGACGCCGA TGAGCTGGTA TTACTCGCGC CGATGAAAAA AGATCTTCCT 
CCTGAAGTCT TCACCCAGAT CTATCAGCCG CCGGTCTCTA ACGGCGACGG CTACGATCGC 
GAAAATCTTC TTAAAGCTGA CGCCTTGTTG ACGCAGGCCG GATGGGTGAT CAACGGACAG 
CAACGGGTCA ATAGCGTCAC CGGTAAGCCT CTGACGTTTG AACTTCTCCT TCCTGCCAGC 
AGTAATAGCC AGTGGGTTCT GCCCTTCCAG CATAATCTTC AGCGTCTGGG CATTACGATG 
ACTATCCGTC AGGTTGATAA TTCTCAACTC ACCAACCGGA TGCGTAGCCG CGACTATGAC 
ATGATGCCGA GGCTATGGCG GGCGATGCCC TGGCCCAGCT CCGATCTACA AATCTCATGG 
GCGTCGGAAT ACATTGACTC CAGTTATAAC GCTCCCGGCG TACAAAGCCC GGTGGTGGAT 
AAACTGATCG CGCAAATTAT CGCAGCGCAG GGTGATAAAG CGAAACTGGT GCCGCTGGGA 
CGGGCGCTGG ATCGCGTGCT GACCTGGAAC TATTACATGC TGCCGATGTG GTATATGGCG 
CAAGACAGGC TCGCCTGGTG GGATAAATTC TCCCATCCGG CGATTCGCCC GGTATATACC 
ATCGGGTTAG ATACCTGGTG GTATGATGTC AACAAAGCCG CCAAACTACC GGCAGCCAGG 
AGGTAG

Protein sequence

MIARVMLLLV ALVSAGAQAQ EIKESYAFAV LGEPKYAFNF DHFDYVNPAA PKGGQMTLSA 
IGTFDNFNRY SLRGNPGVRT EALYDTLFTT SDDEPGSYYP LIADHARYAA DYSWVEISIN 
PRARFHDGTP ITARDVAFTF HKFMTEGVPQ FRLVYKGTTV KAIAPLTVRI ELAKPGKEDM 
LSLFSLPIMP EKFWKNHKLS DPLSTPPLAS GPYRITQWKM GQYIVYSRVK NYWAANLPVN 
RGRFNLDTIR YDYYLDDNVA FEAFKAGAFD LRLENDAKNW ATRYIGKNFD NHYIIKEEQK 
NESAQDTRWL AFNIQRPVFK DRRVREAVTL AFDFEWMNKA LFYNAWSRTN SYFQNTEYAA 
RNYPDADELV LLAPMKKDLP PEVFTQIYQP PVSNGDGYDR ENLLKADALL TQAGWVINGQ 
QRVNSVTGKP LTFELLLPAS SNSQWVLPFQ HNLQRLGITM TIRQVDNSQL TNRMRSRDYD 
MMPRLWRAMP WPSSDLQISW ASEYIDSSYN APGVQSPVVD KLIAQIIAAQ GDKAKLVPLG 
RALDRVLTWN YYMLPMWYMA QDRLAWWDKF SHPAIRPVYT IGLDTWWYDV NKAAKLPAAR 
R