Gene SNSL254_A4689 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SNSL254_A4689
Symbol
ID	6482285
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Newport str. SL254
Kingdom	Bacteria
Replicon accession	NC_011080
Strand	-
Start bp	4572666
End bp	4573928
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	51%
IMG OID	642739907
Product	inner membrane protein YjeH
Protein accession	YP_002043588
Protein GI	194442613
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0531] Amino acid transporters
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	81
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGCCGG ATAATGAGCT GATGAATGAA CTAAAAAAAG AGCTTGGGTT GGTTCAGGGC 
GTTATCTTGT TAACCACATC ATTATTAGGG ACTGGCGTTT TTGCGCTTCC GGAGCTGGCT 
GCGCTGGCGG CAGGCGACAT CAGCCTTTGG GCATGGCCGC TGCTCATTAT TTTGATTTTC 
CCTATTGCGA TTGTCTTTGC TGTGCTGGGG CGTCACTTTC CACACGCTGG CGGCGTAGCG 
CATTTTGTCG GGATGGCATT TGGCCCGCGT CTGCAACGAG TGATCAGTTG GCTGTTTTTA 
TCAGTCATTC CTGTTAGTTT TCCCGCAGCC TTGCATATTG CGGTGGGTTT CGGCCAGGCG 
CTGTTTGGCT GGCAAAGCGA ACAGCTCTTA TTTGGGGAGC TGGGTACTCT AGGTTTACTA 
TGGTTTATGG GATCGCGCGG CGCCAGCTCC AGCGCCAACC TGCAAGCCAT TATCGCTGGA 
TTAATTATCG CGCTTATTGC CGCCATTCTG TGGAAAGGCG CGATTAAACC TGCAGATATC 
ACCTTCCCAG CCGCAAACGA AATCACCTTT TCCCGGCTGT GTACCGCCCT GGCGATCATG 
TTCTGGGGAT TTGTGGGAAT TGAGGCTTTT ACGCATTTGT CGTCTGAATT TAAAAATCCT 
GAACGTGATT TTCCGCGCGC ATTGATCATT GGCCTGATGC TGGCCGGCTC CATTTATTGG 
ACCTGTACCG CCGTGGTGCT GCATTTTGGC GTCTATAGCG ACAAGATAGC GGCAACAGCA 
TCGCTACCGC TTATTATTGT TCATCTCTTC GGTATCCAGG CGTTGTGGAT AGCCTGCATT 
ATTGGTTATC TCACCTGCTT TGCCAGCCTG AATGTGTATG CTCAGAGTTT TGCGCGTCTG 
ATATGGACGC AAATGCAATA TCAGCCCGAT CACTATCTGG CTCAACTCTC TCCCGGGCGC 
CTTCCCTTGC ACGCGTTAAA CGTTATTCTG GCCTGTTGTT GCGTGAGTTC CCTGGTCGTC 
TACGCCCTGA AGATTAACCT CAATGCGCTG ATCGTCTATG CTAACGGTAT TTTTATTATG 
CTCTATCTGC TTTGTATGCT GGCGGGCTGT CGACTATTGA AAGGGCGCTG CTATGCACTG 
GCGGTGACGG GTTGTCTACT GTGCCTGTTA TTGCTGGTAA TGCTGGGGTG GAAAAGCTTA 
TATGCCATTA TCATGCTGGC AGCATTATGG CTGTTTTTAC CGAAGCGAAA ACGCATGGCG 
TAA

Protein sequence

MPPDNELMNE LKKELGLVQG VILLTTSLLG TGVFALPELA ALAAGDISLW AWPLLIILIF 
PIAIVFAVLG RHFPHAGGVA HFVGMAFGPR LQRVISWLFL SVIPVSFPAA LHIAVGFGQA 
LFGWQSEQLL FGELGTLGLL WFMGSRGASS SANLQAIIAG LIIALIAAIL WKGAIKPADI 
TFPAANEITF SRLCTALAIM FWGFVGIEAF THLSSEFKNP ERDFPRALII GLMLAGSIYW 
TCTAVVLHFG VYSDKIAATA SLPLIIVHLF GIQALWIACI IGYLTCFASL NVYAQSFARL 
IWTQMQYQPD HYLAQLSPGR LPLHALNVIL ACCCVSSLVV YALKINLNAL IVYANGIFIM 
LYLLCMLAGC RLLKGRCYAL AVTGCLLCLL LLVMLGWKSL YAIIMLAALW LFLPKRKRMA