Gene Sbal195_1199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sbal195_1199
Symbol
ID	5752926
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Shewanella baltica OS195
Kingdom	Bacteria
Replicon accession	NC_009997
Strand	+
Start bp	1422454
End bp	1423554
Gene Length	1101 bp
Protein Length	366 aa
Translation table	11
GC content	44%
IMG OID	641287468
Product	extracellular solute-binding protein
Protein accession	YP_001553634
Protein GI	160874318
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.000384833
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTAT TTAATAAGAT GACCACTCTA GCTCTGGTAA CTGCGAGCGT ATTAGCGAGC 
GCAGCGGCCC AAGCGGAAGA AGTGGTTCGC GTGTATAACT GGTCAGATTA TATCGCGGAA 
GATACCTTAG AAAACTTCAA GAAAGAAACG GGCATTCGGG TTATTTACGA TGTGTTCGAT 
AGTAACGAAG TGCTTGAGGC TAAATTATTG TCTGGTCGAA GTGGCTACGA TATTGTTGTC 
CCTTCTAACC ACTTTCTCGC TAAGCAAATC AAAGCGGGTG CTTTCAAACC TTTAGACCGC 
GCTAAGCTAT CTAATTTCAA AAATTTAAAT CCCGCCCTGA TGAAGCTACT TGAGAAAGCC 
GATCCGGGTA ACCAGTATGC AGTGCCTTAT TTATGGGGAA CCAATGGTAT TGGTTACAAC 
ATCGATAAAG TGAAAGCGGC TGTGGGTGAA GATGCGCCAT TCAACTCAAT GGAACTGATC 
TTCAATCCTA AATATGCTGA AAAAATCTCT AAGTGTGGCT TTGCTATGCT GGACTCTGCC 
GACGATATGG TGCCCCAAGC ACTGATTTAT TTAGGTTTAG ATCCTAACAG TTCCAACCCA 
AGCGATTATG AAAAAGCCGG TGAGTTACTG GAAAAAATCC GTCCTTACGT GACCTATTTC 
CACTCATCTC GCTATATTTC TGACTTAGCA AACGGTGACA TTTGTGTGGC CTTTGGTTTT 
TCTGGTGACG TATTCCAAGC TAAAGCGCGT GCTGAAGAGG CGGGTAATGG CAATAAGATT 
GGTTACTCGA TTCCAAAAGA AGGCGCTAAC CTGTGGTTTG ATATGTTAGC TATCCCAGCC 
GATTCGACTA ACGCAGATAA TGCACTGACG CTGATTAACT ATTTCCTCCG TCCAGAAGTC 
ATAGCGCCTA TCTCTAACTA TGTGGCCTAT GCTAACCCGA ACGATCCTGC ACAACCTCTG 
GTTGATGAGG CTATCCGCAC CGATCCCGCG ATTTATCCAC CGCAAGAAGT GTTAGATAAA 
CTTTATATTG GTGAAATCCG TCCTTTGAAA ATCCAACGCG TATTAACCCG TGTTTGGACC 
AAAGTGAAGT CAGGACAATA G

Protein sequence

MKLFNKMTTL ALVTASVLAS AAAQAEEVVR VYNWSDYIAE DTLENFKKET GIRVIYDVFD 
SNEVLEAKLL SGRSGYDIVV PSNHFLAKQI KAGAFKPLDR AKLSNFKNLN PALMKLLEKA 
DPGNQYAVPY LWGTNGIGYN IDKVKAAVGE DAPFNSMELI FNPKYAEKIS KCGFAMLDSA 
DDMVPQALIY LGLDPNSSNP SDYEKAGELL EKIRPYVTYF HSSRYISDLA NGDICVAFGF 
SGDVFQAKAR AEEAGNGNKI GYSIPKEGAN LWFDMLAIPA DSTNADNALT LINYFLRPEV 
IAPISNYVAY ANPNDPAQPL VDEAIRTDPA IYPPQEVLDK LYIGEIRPLK IQRVLTRVWT 
KVKSGQ