Gene Snas_3508 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_3508
Symbol
ID	8884707
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	3717699
End bp	3719225
Gene Length	1527 bp
Protein Length	508 aa
Translation table	11
GC content	67%
IMG OID
Product	extracellular solute-binding protein family 5
Protein accession	YP_003512264
Protein GI	291300986
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0424359
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACCAG CTTCGCGATT CGGTCGCCGC CTGACGGCGG TGATCGGTGC TCTCGCCACC 
CTGTCGCTGC TCCTGGCGGG CTGTTCCGGC TCGCAGGCGG AGCCGGGCAA GCTGGTGATC 
GGTGTCACCA CTGACGCGAA CGCGCTGTTC CCCTGGAAGG CGACCCAGTT CCAGTCGATC 
GCGGTGCTGC AGAACCTGTA CGGCACCCTC ACCGAGTTCG ACAAGGACCT CAAGGTGGTG 
CCCGGCCTGG CCGAGTCCTG GGACACCTCG AAGGACGGCC GCACCCTGAC CTTCCACCTG 
CGTTCCGGGG TGACCTTCGC CGACGGCAGC GCGTTCGACT CCGCCGACGT CAAGGACTCG 
CTCGACAAGA TCCGCGACCC CAAGACCGCG GCGGTCGCGG CCTCGACGCT GGCGTCGGTG 
AAGAAGGTGA CGGCACCCGA CGCCGACACC GTGACCCTGA AACTGTCCGG GCCCGACGCG 
GCACTGCCGT CGAACCTCGC CTCGGTGAAC ACGGCGATGC TGTCGTCCGA CGACACCGAG 
AAGCAGCTGG CCGCCAAACC CAACGGGACC GGGCCGTTCG CGTTCGACTC CCGCAAACCC 
AGCCAGACGT TGAAGTTGAA GAAGAACGAC GCGTACTGGG GCGAGGCCCC CAAGCTCGAC 
AGCGTCGAGT TCCGGGTGAT CCCCGACGAC GACTCCATCC TGGCCGCGAT GCAGGCGGGC 
AACGTGCAGT TCGCGGTGTT CGACAACCCC GTCGTCGGTC AGACCGCCGA GGACCTCGGC 
CTGAACGTCG CCAAGACCTC GCAGCTGAGC TACCACGCGC TGCAACTCAA CGCGAAACGC 
GACGTGTTGT CCGATGTGAA CACCCGGTTG GCGGTGCAGT GCGCCATCGA CCGGTCCGCC 
GTCCTGGACA CCGCCGGATT CGGCGAGGGC AAGGTCACCG GTCCGATCAC CTCGCCGGAC 
TATCTCTCCG ACCCCGACGA CCGGCCCTGC CCGACACGCG ACCTCGACAA GTCGGCCGAG 
TACCTGCGCA AGGCGGGCAA GGACAGTCTC ACGCTGAAGA CCATCGTGTC GCAGGGCGAG 
TACGCCACCT CGGTGGACGA GGCGCAGAAC CTCAAGTCGC AACTGGCCGA CGCCAACATC 
GAGCTCGACC TGGAGGTGCT GGAGTCCGGG GCGTTCGTGG ACGCGTGGGT CGGCGCCGAC 
TTCGACGCGG CGGTGGCGCT CAACGGCGGC CGCGAGGACC CCGACGGCAT GTATGGCCGC 
TACTTCACCA GCACCGGCAA CCTCAACAAG GTCGCCGGGT ACAGCTCGCC CACGCTCGAC 
AAGCTGTTCG CCGAGGGACG TTCCACCAGC GACCTCGCGA AGCGGGAGGA GATCTACACG 
AAGGTCGGCC GGGAACTGGA GGACAACGCG GCCTGGATCT GGTTGTTCTC CGGGTTCACC 
TACACCGCGA CCACCGCGAA CGTCCACGGG TTCACACCCC TGGAAAGCGG TTCGCTGCAA 
TACCTACGCA CCACGTCCGT CGATTAA

Protein sequence

MSPASRFGRR LTAVIGALAT LSLLLAGCSG SQAEPGKLVI GVTTDANALF PWKATQFQSI 
AVLQNLYGTL TEFDKDLKVV PGLAESWDTS KDGRTLTFHL RSGVTFADGS AFDSADVKDS 
LDKIRDPKTA AVAASTLASV KKVTAPDADT VTLKLSGPDA ALPSNLASVN TAMLSSDDTE 
KQLAAKPNGT GPFAFDSRKP SQTLKLKKND AYWGEAPKLD SVEFRVIPDD DSILAAMQAG 
NVQFAVFDNP VVGQTAEDLG LNVAKTSQLS YHALQLNAKR DVLSDVNTRL AVQCAIDRSA 
VLDTAGFGEG KVTGPITSPD YLSDPDDRPC PTRDLDKSAE YLRKAGKDSL TLKTIVSQGE 
YATSVDEAQN LKSQLADANI ELDLEVLESG AFVDAWVGAD FDAAVALNGG REDPDGMYGR 
YFTSTGNLNK VAGYSSPTLD KLFAEGRSTS DLAKREEIYT KVGRELEDNA AWIWLFSGFT 
YTATTANVHG FTPLESGSLQ YLRTTSVD