Gene VC0395_0171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	VC0395_0171
Symbol	putP
ID	5134262
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Vibrio cholerae O395
Kingdom	Bacteria
Replicon accession	NC_009456
Strand	+
Start bp	202270
End bp	203760
Gene Length	1491 bp
Protein Length	496 aa
Translation table	11
GC content	51%
IMG OID	640530494
Product	sodium/proline symporter
Protein accession	YP_001215012
Protein GI	147672079
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family [TIGR02121] sodium/proline symporter

Plasmid Coverage information

Num covering plasmid clones	38
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAAAATA GCTTCGCTAT TACAACCACC TTTATCGTCT ACCTCATTTT GATGTTGGCG 
ATTGGGGTTT ACGCTTATCA GCGAACGAAA AACTCAGCCG ATTACTTTCT GGGTGGCCGT 
TCATTAGGGC CATGGCCTGC AGCACTCTCT GCTGGCGCAT CCGACATGAG TGGCTGGTTA 
CTGCTCGGTC TGCCGGGTTA CGCGTATGCC GCCGGCATTG AATCATTCTG GTTGGCTGGC 
GGCTTGCTCG TCGGTACTTG GGCTAACTGG TTAGTGAATG CTAAGCGTCT GCGCACCTAC 
AGCATCACCA CGGACTCTCT GACTTTACCT GAGTTTTTGT CACGCCGTTT TAACGATAAC 
TCAAAACTCA TCCAAACCAT TTCTGCGTTC TTTATTCTGC TGTTCTTCCT CTTCTATACC 
AGTTCGGGTT TGGTGGCAGG CGGTAAACTG TTTGAAACCG TATTCGGCTT GGATTACTCC 
ACCGCGGTGA TCATAGGTAC GGTTTGTGTG GTGTCGTACA CCCTGTTTGG TGGCTTCTTA 
GCGGTCTCTT GGACGGACTT GGTGCAAGGC TTGCTCATGG CAGCGGCACT GATGATCGTG 
CCGATTGCGG CAATGAATGG TGGCTTTACT CAGCTTAATC ACGATTTGGC AGCGATTAAC 
CCTGAACTGC TGACCTTGTG GAATGACGCG AAAGGCGAAC CTCTGTCGGC GATTGCCATC 
ATCTCTTTAG TGGCTTGGGG CTTGGGCTAT TTTGGTCAGC CGCACATTCT GGCGCGTTTC 
AAAGCCTCAC GTTCCAATAA AGATCTGACC ACGGCGCGCC GTATCGCAGT AGTGTGGACT 
GGGCTTTCAA TGGCTGGCGC GATTCTGGTC GGTTTAACGG GTCTGATTTT CGTTACTCAA 
TCAGGCACGA TTGGTCTGGA TGATGGCGAA AAAATCTTCA TGCTATTAGT GAACTCGCTG 
TTCCACCCAG TCATCGCTGG TATTTTGCTG GCCGCCATTT TGGCGGCAAT CATGAGTACT 
GCGGATTCGC AGCTGCTGGT CTCTTCATCG GCACTCGCGG AAGATTTCTA CAAGCAAGTG 
TTCAAAACCG ATGCTAGCTC CGAAGACATT GTCCGCGTTG GTCGCATCGC GGTGATTTTG 
ATCTCGCTGA TTGCCCTGTT TTTAGCGATG ACGCCAGATA GCTCAGTGCT GGGTTTGGTG 
TCCTACGCTT GGGCTGGCTT TGGTGCGGCG TTTGGTCCTG CTCTGGTCTT GAGCCTGTAC 
TGGCCGCGTA TGAACCGTCA TGGTGCGCTA TCGGGGATCA TTGTCGGTGG TGTGACGATT 
GTGGTTTGGA AACAACTGTC TGGCGGTTGG TTTGATGTGT ACGAAATCGT ACCGGGAATT 
ATCCTTTCAA CCCTGTCGAT TGTTGTGGTC AGCCTGCTCA CCGGCGAACC GGATGAGAAG 
GTAAAAGCGC AACACGCCAC CTTCAAAAAG CAGTTGATTG AACTGGAATA A

Protein sequence

MENSFAITTT FIVYLILMLA IGVYAYQRTK NSADYFLGGR SLGPWPAALS AGASDMSGWL 
LLGLPGYAYA AGIESFWLAG GLLVGTWANW LVNAKRLRTY SITTDSLTLP EFLSRRFNDN 
SKLIQTISAF FILLFFLFYT SSGLVAGGKL FETVFGLDYS TAVIIGTVCV VSYTLFGGFL 
AVSWTDLVQG LLMAAALMIV PIAAMNGGFT QLNHDLAAIN PELLTLWNDA KGEPLSAIAI 
ISLVAWGLGY FGQPHILARF KASRSNKDLT TARRIAVVWT GLSMAGAILV GLTGLIFVTQ 
SGTIGLDDGE KIFMLLVNSL FHPVIAGILL AAILAAIMST ADSQLLVSSS ALAEDFYKQV 
FKTDASSEDI VRVGRIAVIL ISLIALFLAM TPDSSVLGLV SYAWAGFGAA FGPALVLSLY 
WPRMNRHGAL SGIIVGGVTI VVWKQLSGGW FDVYEIVPGI ILSTLSIVVV SLLTGEPDEK 
VKAQHATFKK QLIELE