Gene Sbal223_1588 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_1588
Symbol
ID	7089989
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	-
Start bp	1856507
End bp	1857958
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	48%
IMG OID	643460489
Product	sodium/proline symporter
Protein accession	YP_002357516
Protein GI	217972765
COG category	[E] Amino acid transport and metabolism [R] General function prediction only
COG ID	[COG0591] Na+/proline symporter
TIGRFAM ID	[TIGR00813] transporter, SSS family [TIGR02121] sodium/proline symporter

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.0000493204
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.00000000000453194
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGACGATTG AAACCCCGAT TTTAATCACA TTTGTTGGTT ACTTAGTATT GATGATGGGC 
ATAGGTTTTT GGGCTTACCG TGCTACCGAT ACTGTTGATG ATTATATTTT AGGTGGCCGC 
AAAATGGGCC CCGCTGTGAC CGCACTCAGT GTGGGTGCAT CCGATATGTC AGGTTGGCTG 
TTACTGGGTT TACCCGGCGC GGTTTACTTA GGCGGCTTAG GTGAAGCTTG GATTGGCATA 
GGGTTAATTT TTGGCGCTTG GCTGAACTGG CTTTTTGTTG CCAGACGACT GCGTATTTAC 
ACTCAACTCG CCGATAACGC CCTCACCTTA CCGGATTTCT TCGAGAAACG TTTCCACGAT 
ACCCAAGGCT ATCTAAAGCT AGTCTCCGCA ATCACTATTT TAGTGTTTTT CACTTTCTAT 
GCTTCCTCAG GCATGGTCGG TGGCGCGATT CTATTTGAAA AAGTCTTTGG TCTCGATTAC 
ACAGTGGCGC TGGTGATTGG CTCAGCCATC ATAGTCGGTT ACACCTTTAT TGGCGGCTTC 
TTTGCCGTGT GTTGGACAGA CTTTTTCCAA GGCTGTTTGA TGCTTGTCGC CCTCTTAATC 
GTCCCCTTTG CCGTTTTCTC TCACCCTGAA AGCCACGCCG GAATTGAAAC TATCGATCCT 
GCGATGTTAG CCTTGGTCAG CGACAAAACC ACAGTGATAG GCATGTTGTC TTTACTCGCA 
TGGGGTCTTG GCTATTTTGG TCAGCCGCAT ATTTTGTCGC GCTTTATGGC GATAGGCAGT 
GCCGACGCCC TTCCCTTATC GCGCCGTATT GCCATGAGCT GGATGGTCTT ATCTTTAATT 
GGCGCTTTAG CCACAGGTAT TGCCGGTTCT CTGTATTTCG CTAACGCCCC ACTAGCGAAT 
TCAGAAACGG TATTTATTCA TTTAGCCCAA GCCGCGTTTA ATCCGTGGAT TGGTGGTCTA 
CTCATTGCAG CCATTTTGTC GGCCATCATG AGTACTATCG ATTCACAGTT ACTGGTGTGC 
TCAAGCGTGA TCACTGAAGA TTTCTACCGT AAATGGTTAC GCCCACAAGC GGATGATCGC 
GAGTTGATGA TGGTCGGCCG CATGGGTGTG CTGGCGATTG CCGTGATCGC AGGCATCATT 
GCCCTCAATC CTGAAAGCAG TGTATTAAGC CTTGTGAGTT ATGCATGGGC TGGCTTTGGT 
GCGGCCTTTG GTCCTGTGGT CTTGTTATCG CTATTTTGGA AGCAATACAG CCGTAATGGT 
GCCATAGCTA CTATTATTGT CGGCGCATTA ACGGTCGTAA TTTGGAAGCA ACTGACGGGG 
GGGATTTTCG AGTTATACGA AATCCTGCCA GGATTTGTAT TCGCCACATT CGCCGGTATT 
TTGGTGAGCA AATTGTCTGC ACCGAGTGAA AATGTAACAA CAGAGTTCGA ACAATTTAAG 
TCTGCACTTT AG

Protein sequence

MTIETPILIT FVGYLVLMMG IGFWAYRATD TVDDYILGGR KMGPAVTALS VGASDMSGWL 
LLGLPGAVYL GGLGEAWIGI GLIFGAWLNW LFVARRLRIY TQLADNALTL PDFFEKRFHD 
TQGYLKLVSA ITILVFFTFY ASSGMVGGAI LFEKVFGLDY TVALVIGSAI IVGYTFIGGF 
FAVCWTDFFQ GCLMLVALLI VPFAVFSHPE SHAGIETIDP AMLALVSDKT TVIGMLSLLA 
WGLGYFGQPH ILSRFMAIGS ADALPLSRRI AMSWMVLSLI GALATGIAGS LYFANAPLAN 
SETVFIHLAQ AAFNPWIGGL LIAAILSAIM STIDSQLLVC SSVITEDFYR KWLRPQADDR 
ELMMVGRMGV LAIAVIAGII ALNPESSVLS LVSYAWAGFG AAFGPVVLLS LFWKQYSRNG 
AIATIIVGAL TVVIWKQLTG GIFELYEILP GFVFATFAGI LVSKLSAPSE NVTTEFEQFK 
SAL