Gene SeD_A1200 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeD_A1200
Symbol	putP
ID	6874229
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Dublin str. CT_02021853
Kingdom	Bacteria
Replicon accession	NC_011205
Strand	+
Start bp	1190480
End bp	1191988
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	54%
IMG OID	642784382
Product	sodium/proline symporter
Protein accession	YP_002215055
Protein GI	198243177
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family [TIGR02121] sodium/proline symporter

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.133838
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	68
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTATTA GCACACCGAT GTTGGTGACA TTCTGTGTCT ATATTTTTGG CATGATATTG 
ATTGGGTTTA TCGCCTGGCG CTCAACCAAA AACTTTGATG ACTATATTCT TGGCGGTCGC 
AGCCTGGGGC CGTTTGTTAC GGCTTTATCA GCCGGCGCGT CGGATATGAG CGGCTGGCTG 
TTAATGGGGC TGCCTGGCGC TATCTTTCTG TCGGGGATCT CTGAAAGCTG GATCGCCATT 
GGCCTGACGT TAGGCGCATG GATTAACTGG AAGCTGGTGG CCGGGCGCCT GCGCGTGCAT 
ACCGAATTTA ACAATAACGC GCTCACGCTA CCGGACTATT TTACCGGTCG GTTTGAAGAT 
AAGAGCCGAG TCCTGCGTAT TATTTCCGCG CTGGTCATTC TGCTGTTTTT CACTATCTAT 
TGCGCATCAG GTATTGTCGC TGGGGCACGA CTGTTCGAAA GCACCTTCGG TATGAGCTAT 
GAAACCGCAC TGTGGGCGGG GGCCGCGGCA ACCATTATTT ATACCTTTAT CGGCGGGTTT 
CTTGCCGTTA GCTGGACGGA TACCGTTCAG GCCAGCCTGA TGATTTTTGC GTTAATCCTG 
ACGCCGGTGA TGGTTATTGT CGGCGTAGGC GGTTTTAGCG AGTCGCTGGA GGTGATCAAG 
CAAAAGAGCA TCGAGAATGT CGACATGCTC AAGGGGCTGA ATTTTGTCGC TATTATTTCT 
CTGATGGGCT GGGGACTGGG TTACTTCGGT CAGCCGCATA TCCTGGCGCG CTTTATGGCG 
GCGGATTCCC ATCACAGTAT TGTTCATGCG CGTCGTATCA GTATGACCTG GATGATTCTG 
TGTCTGGCGG GCGCGGTGGC GGTGGGCTTC TTTGGCATTG CGTACTTTAA CAATAACCCC 
GCGCTGGCCG GGGCGGTGAA CCAAAACTCA GAACGCGTAT TTATTGAACT GGCGCAGATC 
CTGTTTAACC CGTGGATTGC CGGTGTTCTG CTGTCTGCTA TCCTGGCGGC GGTGATGTCG 
ACGTTGAGCT GTCAGTTGCT GGTATGCTCC AGCGCGATTA CGGAAGATTT ATATAAGGCT 
TTTCTGCGTA AAAGCGCCAG CCAGCAAGAG CTGGTATGGG TAGGGCGAGT GATGGTGCTG 
GTGGTAGCGC TGATCGCCAT TGCGCTGGCG GCGAACCCCG ATAACCGTGT GCTGGGGCTG 
GTGAGCTACG CCTGGGCTGG ATTCGGCGCG GCATTTGGGC CTGTTGTCCT GTTTTCTGTG 
ATGTGGTCGC GTATGACACG TAACGGCGCG CTGGCGGGAA TGATTATTGG CGCGGTGACG 
GTTATCGTCT GGAAACAATA TGGCTGGCTG GATCTGTATG AGATTATCCC TGGCTTCATT 
TTCGGCAGCC TGGGGATCGT AATCTTTAGC CTGCTTGGCA AAGCGCCGAC AGCAGCGATG 
CAGGAACGCT TTGCAAAAGC GGACGCGCAT TATCATTCCG CGCCGCCGTC GAAGCTACAG 
GCGGAATAA

Protein sequence

MAISTPMLVT FCVYIFGMIL IGFIAWRSTK NFDDYILGGR SLGPFVTALS AGASDMSGWL 
LMGLPGAIFL SGISESWIAI GLTLGAWINW KLVAGRLRVH TEFNNNALTL PDYFTGRFED 
KSRVLRIISA LVILLFFTIY CASGIVAGAR LFESTFGMSY ETALWAGAAA TIIYTFIGGF 
LAVSWTDTVQ ASLMIFALIL TPVMVIVGVG GFSESLEVIK QKSIENVDML KGLNFVAIIS 
LMGWGLGYFG QPHILARFMA ADSHHSIVHA RRISMTWMIL CLAGAVAVGF FGIAYFNNNP 
ALAGAVNQNS ERVFIELAQI LFNPWIAGVL LSAILAAVMS TLSCQLLVCS SAITEDLYKA 
FLRKSASQQE LVWVGRVMVL VVALIAIALA ANPDNRVLGL VSYAWAGFGA AFGPVVLFSV 
MWSRMTRNGA LAGMIIGAVT VIVWKQYGWL DLYEIIPGFI FGSLGIVIFS LLGKAPTAAM 
QERFAKADAH YHSAPPSKLQ AE