Gene Snas_5835 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5835
Symbol
ID	8887051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	6199606
End bp	6200784
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	70%
IMG OID
Product	Exo-alpha-sialidase
Protein accession	YP_003514558
Protein GI	291303280
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGACTGC TCCGTCCGCT CGTCATCGCG GCCGTGGCCG CGCTGACCGT CACCGCCGGT 
CTGCTCACCG CAGGCCCCGC CTCCGCCGCC CCCGACGTCC AGACCATCTT CACCAAGGGC 
GAGAACGGCT ACGGCTGCCA CCGCATCCCC GCCATCCTGC GGGCCGGGAA CGGCGACCTG 
CTGGCCTTCG CCGAAGCCCG CACCGAGTTC TGCGGCGACA CCGGCCACAT CGACCTGGTC 
ATGAAACGCT CCACCGACGA CGGAGCGACC TGGGGCAAGT CCCAGATCGT GCTACAGGGC 
ACCGACGACG ACCCCGACGC GGCCGCCACC CGCGGCAACC CGGTGCCGAT CCTCGACGAG 
AGCACCGGCC GCATCGTGCT GCTGTCCACA CACAACCCGT CCAACGCCGA CCAGCCCCGC 
ACCCCGTACG TCCAACACAG CGACGACGAC GGCCAGACCT GGAGCACCGC CAAGAGCCTC 
GGCGACGTCA TCGACGAACC CGACTGGGGC TGGTATGCCA CCGGCCCCGG CGGCGGCATC 
CAGCTCACCC GGGGCGAACA CGCCGGACGG CTGGTCGTGG GCGTCAACTT CTCCGACGGC 
TCCGGCAAGA ACGGCGCCGC CCTGGTCTAC AGCGACGACG GCGGCGAGAC CTGGACCCGC 
GGTGCCACCG ACGTCCCCGC GACCGACGAC ATCATCCCGC AGGAACTGAA CCTCTTCGAG 
CGCACCGACG GCGGCATCTA CGCCGCGGCG CGGGAGAACG CGGGCACCAA CACCCAGACC 
CGCGCCTTCG CCGTCAGCAC CGACGCCGGA GCCAGCTTCG AGGCGCCGTT CAAGCTGATT 
CCCGACCTCG TCGGCACACC CAAGGTCCAG GGCTCGATCC TTCGCCTGCG CGCCACCGAC 
TCCGGCGACT CCTACGACCG GGTGCTGTTC GCGTCCCCTG TGCACTCCAA GCTGCGCATG 
ACCATGACGA TCCGCTCGTC CTTCGACGAG GGGAAGACCT GGCAGAGCGT CGACGAGGGC 
ACCGTCATCG ACGAGGACCG CGCCGGTTAC TCCAACATGG CCGTTCTGGG CAACGGCGAC 
ATCGGACTCC TCTACGAAGC GGGTGCCTAC CCCGACGGCG ACGCCCGCGA CGACATCCGC 
TTCGCCCGCA TCAGCGAGTC GGATCTGGGT GTGCCGTAA

Protein sequence

MRLLRPLVIA AVAALTVTAG LLTAGPASAA PDVQTIFTKG ENGYGCHRIP AILRAGNGDL 
LAFAEARTEF CGDTGHIDLV MKRSTDDGAT WGKSQIVLQG TDDDPDAAAT RGNPVPILDE 
STGRIVLLST HNPSNADQPR TPYVQHSDDD GQTWSTAKSL GDVIDEPDWG WYATGPGGGI 
QLTRGEHAGR LVVGVNFSDG SGKNGAALVY SDDGGETWTR GATDVPATDD IIPQELNLFE 
RTDGGIYAAA RENAGTNTQT RAFAVSTDAG ASFEAPFKLI PDLVGTPKVQ GSILRLRATD 
SGDSYDRVLF ASPVHSKLRM TMTIRSSFDE GKTWQSVDEG TVIDEDRAGY SNMAVLGNGD 
IGLLYEAGAY PDGDARDDIR FARISESDLG VP