Gene Snas_3121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_3121
Symbol
ID	8884320
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	3295555
End bp	3296892
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	68%
IMG OID
Product	extracellular solute-binding protein family 1
Protein accession	YP_003511885
Protein GI	291300607
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.00116931
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCTCCTG GGTTTGGGGA GTCCCGGCTC TCCCGTCGCG GACTGCTGCG GGCCTCGGCG 
CTGGGCCTGG GTGCCCTGGG CGCGGGCTCG CTGACGGCCT GCGCGGGCTC GAACCCCGAT 
GAGCTGGTGT TCTGGCATTT CGTCGGGCCC AGCAGCCCGC AGGGCAAGTG GCAGACCACG 
ATGGTCGACG ACTGGAACAA GCACAACAAG GTCCGCATCA CCGAACGGTT CGTCCCGTTC 
GGCGACTACG CCAGCGGCCC GACCCTGCAG ACCTCGTTCA GCGCCGACTC CGGCCCGGAC 
ATCTTCCTGC TCAGCCCCGG CGACTTCCTG CGCTACCACA ACGCGGGCGT CCTGATGGAC 
CTCACGCCGT ACCTGCCCCA GTCGGTGCGC GACGACTACC TTCCCGGCAC TTTGGACAGC 
CGCAGCTTCG ACGGCAAGGT GTACGGTCTG CCCATCGAAA GCGAACCGTT GGCGCTGTTC 
TACAGCCACG ACGCCTTCGA GAAGGCCGGA CTGTCCGAAG CCGACGTTCC CGCCAACTGG 
GACCAGATGC TGGACGTGGC CGACAAACTC ACCACCGACC GCCGCTTCGG GCTGCTGTTC 
GAGACCAACC CCGGCTACTA CCAGAACTTC ACCTGGTACC CGTTCCTGTG GCAGGGCGGC 
GGATCGCCGG TGTCCAAGGA CCAGAAGAGC GGCCGCTTCG ACTCCAAGGC CACCGTGGAC 
GCGCTCGCGC TGTGGCAGGA CAGCATCAAC CGCCGGGTCG CTCCCACCCT GCCGCAGGGC 
TCGGGCGGCA TGGACACCAT CAGCAACCTC GGCAACGGCT ACTGCGCCAT GCAGCAGACC 
GGCGTGTGGG GAGTCGGCGA GCTCGGCATC CAGTTGCCGG ACTTCAAGTT CGGGGTGGCG 
CCGCTGCCGA AACCGCCGGG CGGCAAGGAC ATCACCACCG CGGGCGGCTG GGCCCTGGTC 
GCCAACGTGC GCGGCCGCAA CCCCGAGGCC GCCGCCGAGT TCATCGCCTG GGCGCTGGGC 
AGCGACGAGG ACGACTGCGT CGAACGGGGA CGCCAGCTCA ACACCGTCAT CAAGAAGAAC 
CTGCCGGTGC GCCGCAGCGT CCGCGACCTC GCCGAGAAGT CCGGCGACAT CGACACCGAC 
AACTACCGGA AGTTCGTGGA GGAGATCGCC CCGATCGCGG TCGGCGAACC CCGCTACCCG 
GTGGAGATCT ACCGGAGCAT CTCGGACGCC ATCCAGGCCT GCCAGCTGGA CGGCGCCGAC 
CCGGCCACCG TCGCGGCGGA CACGGACGAG CAGATCCAGA CGTTCGTGTC CACATACGAA 
GGAGCGTCGA TCCTGTGA

Protein sequence

MSPGFGESRL SRRGLLRASA LGLGALGAGS LTACAGSNPD ELVFWHFVGP SSPQGKWQTT 
MVDDWNKHNK VRITERFVPF GDYASGPTLQ TSFSADSGPD IFLLSPGDFL RYHNAGVLMD 
LTPYLPQSVR DDYLPGTLDS RSFDGKVYGL PIESEPLALF YSHDAFEKAG LSEADVPANW 
DQMLDVADKL TTDRRFGLLF ETNPGYYQNF TWYPFLWQGG GSPVSKDQKS GRFDSKATVD 
ALALWQDSIN RRVAPTLPQG SGGMDTISNL GNGYCAMQQT GVWGVGELGI QLPDFKFGVA 
PLPKPPGGKD ITTAGGWALV ANVRGRNPEA AAEFIAWALG SDEDDCVERG RQLNTVIKKN 
LPVRRSVRDL AEKSGDIDTD NYRKFVEEIA PIAVGEPRYP VEIYRSISDA IQACQLDGAD 
PATVAADTDE QIQTFVSTYE GASIL