Gene SeD_A0439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A0439
Symbol	proY
ID	6874549
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	457916
End bp	459346
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	54%
IMG OID	642783668
Product	putative proline-specific permease
Protein accession	YP_002214355
Protein GI	198244611
COG category	[E] Amino acid transport and metabolism
COG ID	[COG1113] Gamma-aminobutyrate permease and related permeases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.37513
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	85
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTACACCA CGGGGCTTAA CGCCCCGTGG TTTTTTATTG TGTTGATAGG TCAGAAATTG 
ATGGAAAGCA ATAATAAGCT AAAGCGTGGG CTGAGCACCC GGCACATTCG CTTTATGGCA 
TTAGGTTCGG CAATCGGCAC CGGCCTGTTT TACGGCTCGG CGGACGCCAT CAAAATGGCG 
GGGCCGAGCG TGCTGTTGGC CTATATTATT GGCGGGGTCG CGGCATATAT CATTATGCGC 
GCATTGGGGG AAATGTCCGT TCACAACCCT GCCGCCAGCT CATTTTCGCG CTATGCGCAG 
GAAAACCTCG GCCCGCTTGC GGGCTACATT ACCGGCTGGA CCTACTGTTT TGAGATCCTG 
ATCGTCGCCA TTGCCGACGT GACCGCGTTC GGCATTTACA TGGGAGTCTG GTTCCCCGCC 
GTGCCGCACT GGATTTGGGT ACTTAGCGTG GTGCTGATCA TTTGCGCCAT CAACCTGATG 
AGCGTCAAGG TGTTCGGCGA GCTGGAGTTT TGGTTCTCCT TCTTCAAAGT CGCCACCATT 
ATTATCATGA TTGTCGCGGG TATCGGCATC ATTGTGTGGG GAATTGGCAA CGGCGGGCAG 
CCGACCGGCA TTCATAACCT GTGGAGCAAC GGCGGCTTCT TCAGCAATGG CTGGCTGGGA 
ATGATCATGT CGCTGCAAAT GGTGATGTTC GCTTACGGCG GGATTGAGAT TATCGGTATC 
ACCGCCGGGG AAGCGAAAGA CCCGGAGAAA TCCATTCCGC GCGCCATTAA CTCAGTACCG 
ATGCGTATCC TGGTATTTTA TGTCGGCACG CTGTTCGTCA TTATGTCTAT CTATCCGTGG 
AATCAGGTCG GCACAAACGG CAGCCCATTT GTGCTGACGT TCCAGCATAT GGGGATTACC 
TTTGCCGCCA GCATTCTGAA CTTTGTGGTA TTGACCGCCT CGCTTTCCGC TATCAACTCC 
GATGTGTTTG GCGTAGGCCG TATGCTGCAT GGTATGGCGG AGCAGGGGAG CGCGCCGAAA 
GTCTTTGCCA AAACGTCACG CCGTGGTATT CCGTGGGTTA CTGTGCTGGT GATGACGATT 
GCGCTGCTGT TTGCGGTTTA CCTGAACTAC ATCATGCCGG AAAACGTCTT CCTGGTGATT 
GCCTCGCTGG CGACGTTTGC GACGGTATGG GTATGGATCA TGATCCTGCT GTCACAAATC 
GCCTTCCGCC GTCGTTTACC GCCGGAAGAG GTAAAAGCGC TGAAGTTTAA GGTGCCGGGC 
GGTGTCGTAA CGACGATAGC GGGTCTGATT TTCCTGGTCT TCATTATTGC GCTTATCGGC 
TACCATCCGG ATACCCGCAT CTCACTGTAT GTGGGCTTCG CCTGGATAGT TCTGCTGTTG 
ATTGGCTGGA TGTTTAAACG CCGTCGCGAC CGTCAATTGG CGCAGGCGTA G

Protein sequence

MYTTGLNAPW FFIVLIGQKL MESNNKLKRG LSTRHIRFMA LGSAIGTGLF YGSADAIKMA 
GPSVLLAYII GGVAAYIIMR ALGEMSVHNP AASSFSRYAQ ENLGPLAGYI TGWTYCFEIL 
IVAIADVTAF GIYMGVWFPA VPHWIWVLSV VLIICAINLM SVKVFGELEF WFSFFKVATI 
IIMIVAGIGI IVWGIGNGGQ PTGIHNLWSN GGFFSNGWLG MIMSLQMVMF AYGGIEIIGI 
TAGEAKDPEK SIPRAINSVP MRILVFYVGT LFVIMSIYPW NQVGTNGSPF VLTFQHMGIT 
FAASILNFVV LTASLSAINS DVFGVGRMLH GMAEQGSAPK VFAKTSRRGI PWVTVLVMTI 
ALLFAVYLNY IMPENVFLVI ASLATFATVW VWIMILLSQI AFRRRLPPEE VKALKFKVPG 
GVVTTIAGLI FLVFIIALIG YHPDTRISLY VGFAWIVLLL IGWMFKRRRD RQLAQA