Gene Snas_0173 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_0173
Symbol
ID	8881350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	174918
End bp	176249
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	68%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003508986
Protein GI	291297708
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAACGT CGCCACATCG CCCACCCGCG GGCCTGAGTC GCCGGTCGCT GCTGGGTGGT 
GCGGCGGCGC TGGCGGCGGT TCCGCTGTTG TCGTCCTGCG TGGGTTTCAA CACCAGCGGC 
GGCAAGGCCG GCAGCCTCGA CTTCCTGTCC ACCCAGTTCA CGCCGGTGGA GGAGAAGCAG 
CGGTTCGAGA AGGTCCTGGC CGACGCGAAG GTCAACGCGG CGTACAACGC GGTGGAGGGG 
AACGTGTTCG CGTCCACGCT GACCTCGCAG GCCGAGGCCG GGAGCGTGCA GGTGAGCCTG 
GCCGGGGCCA TGCACGGCGA ACTGGCGCCG TTGGCCGACC GGTTCACCGA CGTAGACGGG 
CTGTTGAAGG GGAAGCTGGC GCAGGCCGAG TATCCGAAGG ACCTGCTGGA GTTGGCCAAG 
GCCGGGGGTT CGACCGCGAA GTACATCCCG TGGATGCAGG CGTCCTATGT GGTCGCCGTC 
CACAAGCGGG CGCTAGAGTG GCTGCCCTCG GGGGCCGACG TCAACTCGCT GACCTACGAC 
CAGTACCTGG ACTGGGCGAT CGCGGCGCGA AAGGCCAACG GCAGCCCGGT CTTCGGGTTC 
CCCGCCGGGC CGGACGGGCT GTACGCCCGC TTCGTCCAGG GGCATCTGCT GCCGAGCTTC 
ACCGGTGGGC AGGTCACGAC GTTCCGCAGC GCGGACGCCA TCGACGCGTG GAAGTACATG 
AAGGAGCTGT GGGCGAACTT CGTCCCCGCC TCCACCAACT ACGACAACAT GCAGGAGCCG 
TTGGCCAAGG GCGAGGTCAT GGTCGCCTGG GACCACATCG CCCGCATCAT CGAGGCGCCC 
AAGGGCAATC CGGACGAGTG GCTGCTGGTG CCGTCTCCGA AGGGCCCCAA GGGTTTGGGG 
TACATGCTGG TGGTCGCGGG GTTGGCGATC CCCGACGGCG CCCCCGATCC TGACGGCGCC 
ACCGACGCGA TCCTGTCACT GTCCGAACCG GACGTACAGA TCGAGGTGCT GAAGCAGAAC 
ACCTTCTTCC CGGTGTCCGT CACGGAACTG CCCGACGACC TGGAGGGCGC GACGAAGCTG 
GCCGCCGAGG CGATCACCGC GCAGCGGGAG GCCAAGGACG CGATCATGGC GCTGCCGCCG 
GTGGGAACCG GGGAACGCGA CGGCGAGGTC ACCGCGGTGT TCCAGAACTC GTTCCGGCAG 
ATCTGCCTGG ACGACCGATC GATCAAGTCC GTCGTGGACG AACAGGCGGC CGAGTTGCAG 
TCCATTCTCG ATGACCTCAA GATCCCCTGC TGGGCACCCG ATCCGGCCGA AGCCGTCTGC 
GAGGTGGGCT GA

Protein sequence

MATSPHRPPA GLSRRSLLGG AAALAAVPLL SSCVGFNTSG GKAGSLDFLS TQFTPVEEKQ 
RFEKVLADAK VNAAYNAVEG NVFASTLTSQ AEAGSVQVSL AGAMHGELAP LADRFTDVDG 
LLKGKLAQAE YPKDLLELAK AGGSTAKYIP WMQASYVVAV HKRALEWLPS GADVNSLTYD 
QYLDWAIAAR KANGSPVFGF PAGPDGLYAR FVQGHLLPSF TGGQVTTFRS ADAIDAWKYM 
KELWANFVPA STNYDNMQEP LAKGEVMVAW DHIARIIEAP KGNPDEWLLV PSPKGPKGLG 
YMLVVAGLAI PDGAPDPDGA TDAILSLSEP DVQIEVLKQN TFFPVSVTEL PDDLEGATKL 
AAEAITAQRE AKDAIMALPP VGTGERDGEV TAVFQNSFRQ ICLDDRSIKS VVDEQAAELQ 
SILDDLKIPC WAPDPAEAVC EVG