Gene Phep_0525 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Phep_0525
Symbol
ID	8251612
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Pedobacter heparinus DSM 2366
Kingdom	Bacteria
Replicon accession	NC_013061
Strand	+
Start bp	635288
End bp	636856
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	43%
IMG OID	644934175
Product	SSS sodium solute transporter superfamily
Protein accession	YP_003090811
Protein GI	255530439
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.692758
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000000137784
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGAACTCAT CACTGCATGT ATTAGATTAC ATCATTATTA TAGTATTTTT GATAGGAACG 
CTCGTGTTCG GACTGGTATT TGCCAGGGGA CAGAAAACGA CAAAAAATTA TTTCCTTGCG 
AAAGGCAAGA TCCCTTCCTG GGCAATAGGG ATCTCGCTGC TCGCCACATT GATCAGCAGT 
GTAACATTCC TGGCTTACCC GGGTACGGGA TATTCTTCTA ACTGGATCTT ACTGGTTCAG 
GGCTTAATGG TACCTGTAGT GCTGCTTGGC GTAATCTGGT TTATTGTTCC CTTATACCGG 
AAAGTGATCA ATTTGAGTAC TTACGAATAT TTTGAGCAGA GATTTGGTTC TTTTGCCCGA 
TATTACAGTT CACTGGCCTT TGTGCTGAGG CAGTTTTCTG GTATGGGCAC AGTTTTTTTT 
CTGCTTGCGG TGGCCTTAGG TAGTATGATC CATGTCAATA CCGCTATAAT TATTCTGGTT 
GTGGGGGCTA TAATTATCAT TGTCAATTTA CTGGGAGGAA TTGAGGCAGT AATCTGGCTG 
GATGTATTTC AGGGCTTTAT GCTTTTTGCC AGCGGGATCA TTTGCATCAG TATATTGCTC 
TTTTCTGTAG ACGGAGGTCC GGCTGAAGTC TGGAAAATTG CTTCTGCTAA CGGCAGAACA 
GGTTTTGGAC CTTATGAATG GGACCTTACC AAATTGACTT TTCTGGTGAT GGCTATAAAC 
GGGGCTTTTT ATGCGGTACA GAAGTACGCA ACAGATCAGA CGGTGGTGCA GCGTTACCTG 
ACTGCAAAAA CTGACCGGTC GGCCATCCGC GCATCACTGC TGGGTATCTT GTTAACCGTT 
CCGGTATGGA TCTTGTTTAT GTTTATAGGA ACTGCATTGT TTGTGTTTTA TAAGCAAAAC 
CCAATTCCGG CAGATATAAG ACCTGATGCT GTTTTCCCTT ATTTTATTAT GACCAAACTG 
CCAACAGGTG TCATAGGGTT AATTCTTTCC GCAATGATTT CTGCAGCCAT CTGTAGTTTA 
AGCGCCGATC TGAATTCTCT TGCTGCAGTG GGGGTAGAAG ACTATTATAA GAAATTAAGG 
CCCGGCAAAA CAGATAAGGC TTATTTAAAG GCATCGAAAT ATATTGTTGC CTTATCTGGG 
CTGATCTCTA TAGGAATAGC CATGTTGTAT CTGAATGCCG GAAATGAAGG GGTGCTGGGG 
ATCGTATTTA CGCTGTACGC CATATTTTCA GGCGGCATTG TAGGTATGTT TTTACTGGGT 
TTATTTAGTG CCAGGGCCAA TAATCAAGGA ATTACCATTG CCATTGTAGT CTGCATTCTT 
TTTACGGCAT ATGCATTTTT AACTTCTACA GAAATCGGAA TTGGGGCAAA TAAATCGCTG 
TTGTTAGATT TTGGTAAGTA TAACTTTACA CACCATAAGC TGATGCTGGG TGTATACAGC 
CATCTCATCG TTATTGTTGT GGGTTATGTG GCCAGCTTAT TTTTTCCAAA ACCGGTTCTG 
GATACCAATT TGCTTTATAG TGGCTGGCTG GCGGTTAGAC GGGAAGAAAG GGCAAGGGCA 
GACAAATAG

Protein sequence

MNSSLHVLDY IIIIVFLIGT LVFGLVFARG QKTTKNYFLA KGKIPSWAIG ISLLATLISS 
VTFLAYPGTG YSSNWILLVQ GLMVPVVLLG VIWFIVPLYR KVINLSTYEY FEQRFGSFAR 
YYSSLAFVLR QFSGMGTVFF LLAVALGSMI HVNTAIIILV VGAIIIIVNL LGGIEAVIWL 
DVFQGFMLFA SGIICISILL FSVDGGPAEV WKIASANGRT GFGPYEWDLT KLTFLVMAIN 
GAFYAVQKYA TDQTVVQRYL TAKTDRSAIR ASLLGILLTV PVWILFMFIG TALFVFYKQN 
PIPADIRPDA VFPYFIMTKL PTGVIGLILS AMISAAICSL SADLNSLAAV GVEDYYKKLR 
PGKTDKAYLK ASKYIVALSG LISIGIAMLY LNAGNEGVLG IVFTLYAIFS GGIVGMFLLG 
LFSARANNQG ITIAIVVCIL FTAYAFLTST EIGIGANKSL LLDFGKYNFT HHKLMLGVYS 
HLIVIVVGYV ASLFFPKPVL DTNLLYSGWL AVRREERARA DK