Gene Sbal223_3017 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal223_3017
Symbol
ID	7088926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS223
Kingdom	Bacteria
Replicon accession	NC_011663
Strand	+
Start bp	3566571
End bp	3568112
Gene Length	1542 bp
Protein Length	513 aa
Translation table	11
GC content	49%
IMG OID	643461901
Product	major facilitator superfamily MFS_1
Protein accession	YP_002358925
Protein GI	217974174
COG category	[E] Amino acid transport and metabolism
COG ID	[COG3104] Dipeptide/tripeptide permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.227562
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.425104
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAGA ATAGTCCAAA TGCAGGCAAC GACCTGCGGG AAGTCAAACA GCTCGGTATG 
TGGGCCTCCA TTACTAGCTT AGGTTATGTG TTTTGGCTGG TCGGCGGGAT GGAGTTAGTC 
GAGCGTATCG CTTACTACGG CGTCAAAGCC AGTGCGGGAC TGTACGCTAA AGCGCCTGAG 
TCTGCGGGCG GCCTTGGGAT CAGCCTAAGC GACTACGGCA TTATTATTTC CCTCTGGGCG 
ATCATGCAAA CCTTTGTGCC CGTGTTCACG GGTGGCATGT CTGACCGCGT CGGCTACAAA 
GAAACCATCT TTGGCTCCAC CATCATTAAA ATATTTGGCT ATCTGGTGAT GGCATTCTTC 
CCCAGTTTTT GGGGCTTTCT TGCAGGCGCA TTACTCCTCG CCATCGGTAC TGGGATATTT 
AAACCGGGCA TTCAAGGCAC CTTAGTGCTG TCTACCAATC GCAATAATAC CTCGATGGCT 
TGGGGCATTT TTTACCAAGT CGTCAACATT GGTGGTTTCC TCGGGCCGTT AGTGGCCGTA 
CATATGCGCC AATTGTCGTG GGACAATGTG TTTTTCGCCT GCGCCGCGAT TATCTCACTC 
AACTTCTTAT TTTTACTGAC CTATACAGAA CCAGGCAAAG CCGAGCGACT CGCACGTAAT 
AAACAAATCA AGTCGGGTGA AGTCAAACAA GAAGCCCTGT GGCGTGATGC TTGGCGTGAG 
CTGAAAAAGC CGATTGTGAT CTACTACATG TTGGTATTTG CAGGCTTTTG GTTCTTGTAC 
AATGCCCTAT TCGATGTGTT GCCTATCCAT ATTTCCGAAT GGGTCGATAC CAGCGTAATC 
GTCACGTCCC TTTTTGGCAG CGAAGGCACC AGTAACGGCA TTCTGCAATT TTGGCTTGGC 
CTCAATAACG AAGGCACTAA GGTGATGCCC GAAGGCATGC TCAACCTTAA TGCCGGTATG 
ATCATGACCA GCTGTTTTAT CGTCGCCGCA CTGACGGCTA AATACCGCAT CACTACCGCC 
ATGTTTATTG GTTGTTTGCT GAGTATTTTG GCCTTTGTGT TTATCGGCGC CTTCCATGCG 
GCTTGGTTTA TCATGCTCGC AATTGCCATG TTCTCCATTG GCGAAATGAT GATTAGCCCG 
AAGAAAAATG AGTTTATGGG CAACATTGCC CCTGAAGGTA AAAAAGCCAT GTACTTGGGC 
TTTGTGATGT TACCCCAAGG GATTGGCTGG GGATTAGAAG GCTACTTTGG CCCTAAACTC 
TATGAGATTT ATGCATCGAA AGAATTGTTT TCGAGGGATT TATTGTTAGA GCGCGGCATG 
AACAGCACTG AGGTTAGCGC CATTCCCCAA GGTGAAGCCT TTACTACCTT GGTGAGCTAC 
ACAGGTGAAA GCGCCCAGGA TCTTACCCAA CTGCTGTACC ACAGCCATAA CATTGGCATG 
GCGTGGTACA TCATCGCCGC CATAGGGACT ATCTCAGCAG TGGGGATTTT TATCTATGGT 
AAGTGGTTAC TCACACTGCA AAGAGCCCAG CAAGCCGCCT AA

Protein sequence

MSQNSPNAGN DLREVKQLGM WASITSLGYV FWLVGGMELV ERIAYYGVKA SAGLYAKAPE 
SAGGLGISLS DYGIIISLWA IMQTFVPVFT GGMSDRVGYK ETIFGSTIIK IFGYLVMAFF 
PSFWGFLAGA LLLAIGTGIF KPGIQGTLVL STNRNNTSMA WGIFYQVVNI GGFLGPLVAV 
HMRQLSWDNV FFACAAIISL NFLFLLTYTE PGKAERLARN KQIKSGEVKQ EALWRDAWRE 
LKKPIVIYYM LVFAGFWFLY NALFDVLPIH ISEWVDTSVI VTSLFGSEGT SNGILQFWLG 
LNNEGTKVMP EGMLNLNAGM IMTSCFIVAA LTAKYRITTA MFIGCLLSIL AFVFIGAFHA 
AWFIMLAIAM FSIGEMMISP KKNEFMGNIA PEGKKAMYLG FVMLPQGIGW GLEGYFGPKL 
YEIYASKELF SRDLLLERGM NSTEVSAIPQ GEAFTTLVSY TGESAQDLTQ LLYHSHNIGM 
AWYIIAAIGT ISAVGIFIYG KWLLTLQRAQ QAA