Gene SeHA_C0500 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C0500
Symbol	proY
ID	6487660
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	+
Start bp	501727
End bp	503157
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	54%
IMG OID	642740767
Product	putative proline-specific permease
Protein accession	YP_002044434
Protein GI	194448252
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1113] Gamma-aminobutyrate permease and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.968025
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	87
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTACACCA CGGGGCTTAA CGCCCCGTGG TTTTTTATTG TGTTGATAGG TCAGAAATTG 
ATGGAAAGCA ATAATAAGCT AAAGCGTGGG CTGAGCACCC GGCACATTCG CTTTATGGCA 
TTAGGTTCGG CAATCGGCAC CGGCCTGTTT TACGGCTCGG CGGACGCCAT CAAAATGGCG 
GGGCCGAGCG TGCTGTTGGC CTATATTATT GGCGGGGTCG CGGCATATAT CATTATGCGC 
GCATTGGGGG AAATGTCCGT TCACAACCCT GCCGCCAGCT CATTTTCGCG CTATGCGCAG 
GAAAACCTCG GCCCGCTTGC GGGCTACATT ACCGGCTGGA CCTACTGTTT TGAGATCCTG 
ATCGTCGCCA TTGCCGACGT GACCGCGTTC GGCATTTACA TGGGAGTCTG GTTCCCCGCC 
GTGCCGCACT GGATTTGGGT GCTTAGCGTG GTGCTGATCA TTTGCGCCAT CAACCTGATG 
AGCGTCAAGG TGTTCGGTGA GCTGGAGTTT TGGTTCTCCT TCTTCAAAGT CGCCACCATT 
ATTATCATGA TTATCGCGGG TATCGGCATC ATTGTGTGGG GAATTGGCAA CGGCGGGCAG 
CCCACCGGCA TTCATAACCT GTGGAGCAAC GGCGGCTTCT TCAGCAATGG CTGGCTGGGA 
ATGATCATGT CGCTGCAAAT GGTAATGTTC GCTTACGGCG GGATTGAGAT TATCGGTATC 
ACCGCCGGGG AAGCGAAAGA CCCGGAGAAA TCCATTCCGC GCGCCATTAA CTCAGTACCG 
ATGCGTATCC TGGTATTTTA TGTCGGCACG CTGTTCGTCA TTATGTCTAT CTATCCGTGG 
AATCAGGTCG GCACAAACGG CAGCCCATTT GTGCTGACGT TCCAGCATAT GGGGATTACC 
TTTGCCGCCA GCATTCTGAA CTTTGTGGTA TTGACCGCCT CGCTTTCCGC TATCAACTCC 
GATGTGTTTG GCGTAGGCCG TATGCTGCAT GGTATGGCGG AGCAGGGGAG CGCGCCGAAA 
GTCTTTGCCA AAACGTCACG CCGTGGTATT CCGTGGGTTA CTGTGCTGGT GATGACGATT 
GCGCTGCTGT TTGCGGTTTA CCTGAACTAC ATCATGCCGG AAAACGTCTT CCTGGTGATT 
GCTTCGCTGG CGACGTTTGC GACGGTATGG GTATGGATTA TGATCCTGCT GTCGCAAATC 
GCCTTCCGTC GTCGTTTACC GCCGGAAGAG GTAAAAGCGC TGAAATTTAA GGTGCCGGGC 
GGTGTCGTAA CGACGATAGC GGGTCTGATT TTCCTGGTCT TCATTATTGC GCTTATCGGC 
TACCATCCGG ATACCCGCAT CTCACTGTAT GTGGGCTTCG CCTGGATAGT TCTGCTGTTG 
ATTGGCTGGA TATTTAAACG CCGTCGCGAC CGTCAATTGG CGCAGGCGTA G

Protein sequence

MYTTGLNAPW FFIVLIGQKL MESNNKLKRG LSTRHIRFMA LGSAIGTGLF YGSADAIKMA 
GPSVLLAYII GGVAAYIIMR ALGEMSVHNP AASSFSRYAQ ENLGPLAGYI TGWTYCFEIL 
IVAIADVTAF GIYMGVWFPA VPHWIWVLSV VLIICAINLM SVKVFGELEF WFSFFKVATI 
IIMIIAGIGI IVWGIGNGGQ PTGIHNLWSN GGFFSNGWLG MIMSLQMVMF AYGGIEIIGI 
TAGEAKDPEK SIPRAINSVP MRILVFYVGT LFVIMSIYPW NQVGTNGSPF VLTFQHMGIT 
FAASILNFVV LTASLSAINS DVFGVGRMLH GMAEQGSAPK VFAKTSRRGI PWVTVLVMTI 
ALLFAVYLNY IMPENVFLVI ASLATFATVW VWIMILLSQI AFRRRLPPEE VKALKFKVPG 
GVVTTIAGLI FLVFIIALIG YHPDTRISLY VGFAWIVLLL IGWIFKRRRD RQLAQA