Gene Snas_3902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_3902
Symbol
ID	8885102
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	4169415
End bp	4170983
Gene Length	1569 bp
Protein Length	522 aa
Translation table	11
GC content	65%
IMG OID
Product	sulfatase
Protein accession	YP_003512650
Protein GI	291301372
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCTGC GCAAGAGTCT GCTGGCGGTG GCGATCGCCG TGTTCGCGAT CGTGTCCGCC 
ACCGTCGGTG CCGTCGTCGT CTTCGGCGAC GACGCGACGT CCAACAAGGA CAAACCGAAC 
ATCATCTACT TCCTCGTCGA CGACATGTCG GCGGATCTGC TGCCGTACAT GGACACGGTG 
AGCTCGCTGG CCGACGGCGG CACCAAGTTC GACAACTATT TCGTGTCGAA CTCGCTGTGC 
TGCACCTCGC GGGCGACCAT GTTCACCGGC CAGCACCCCC ACAACTCCGG CGTGCTGGGC 
AACACCCCCG AGGACCACGG CGGCTACGAG TACTTCGAAC CCCTGGAGGA CGAGACCTAC 
GCCAAGCAGA TACAGGACAC AGGGGACTAC CACACCGCCT ACCTCGGCAA GTACCTCAAC 
GGGTACAAGA TGAAGGAGGG CTACAAGGTC CCGGCCGGTT GGGACGAATG GCACGTCGCC 
GACGGCGGCG GCTACAACGA ATACGACTAC AAGCTCAGCG AGTACACCGG CGGCGACGAC 
AAACCCATCA GCGACGGCGA CGGGAAGTAC CTGGTGGACC TGATGGCCGA CCGCGCCGTC 
GAGTCCATCG ACCGCTCCCG CGACGCCGAG AAGTCGTTCT TCGTACAGGT GGCACCGTTC 
TCACCGCACT CCGGCGTCGG CAAGGACGGC GGCCCGCGGT TCCCACCGGC CAAACGCGAC 
CGCCCCGGTG CCGACGAGAA GCACGGCGAC TGCGGCAAGG TCGACTGCGC CGACCTCGAC 
GTCACAAAGC TTCCGGGATT CAACGAGGAC ACGAAGGACA AACCCGACTG GGTTCGCCAG 
AAACCACTCA CCGACAAGGA GATCAAGGAA CTCAACCGCG ACTTCCGCAA CCGCGCCCGG 
ATGGTGCAGT CGGTGGACGA CATGGTGGAG AAGGTGACCA AGTCGCTGTC ACAGTCCGAA 
CTGGACAACA CCTACATCAT GTTTGGCTCC GACAACGGAT TCCACCTCGG ACAGCACCGG 
CTCATGCGCG GCAAGACCAC CGCCTACGAC CACGACGTGC GCACCCCGTT CCTGGTGAAA 
CGCCCCGGCT CCTCCGGCGG CGACTCGATC AAGAGCGACG AGATCGTCCA GAACGTCGAC 
CTGTACCCGA CGCTGATCGA CATCGCCAAC GGCGACGAGG ACGGCCCGAC CGACCGCGAC 
GGCCGCAGCC TGCGGCGGCT CATAGACGGC GAGAAGGAAC CCGACTGGCG AAACGCGGCA 
TACGTCGAGC ACTACAAGTC CCCGAAACCG GGAACCGGCG ACCCCGACGC CGAGGACCTC 
GGTCCCAAGA AGGGCAACTC GTCTCCGCCG ACCTACGACG CGATCCGCAC CGCCCAGGAC 
CTGCTCGTCG ACTACAAGGG ATACGAGCAA CCGGAGTTCT ACGACCTGGA CGCCGACCCC 
TACCAGCTCG ACAACAAACC GGACGACCCC CGAGCCGACG AGCTGAAGGA CCCGCTCGCC 
GATCTGGCCA ACTGCGGCAA GAAGGGCCAC CCCGACTGCT GGGAGGCCGC CCACATCGGA 
GCCGACTGA

Protein sequence

MRLRKSLLAV AIAVFAIVSA TVGAVVVFGD DATSNKDKPN IIYFLVDDMS ADLLPYMDTV 
SSLADGGTKF DNYFVSNSLC CTSRATMFTG QHPHNSGVLG NTPEDHGGYE YFEPLEDETY 
AKQIQDTGDY HTAYLGKYLN GYKMKEGYKV PAGWDEWHVA DGGGYNEYDY KLSEYTGGDD 
KPISDGDGKY LVDLMADRAV ESIDRSRDAE KSFFVQVAPF SPHSGVGKDG GPRFPPAKRD 
RPGADEKHGD CGKVDCADLD VTKLPGFNED TKDKPDWVRQ KPLTDKEIKE LNRDFRNRAR 
MVQSVDDMVE KVTKSLSQSE LDNTYIMFGS DNGFHLGQHR LMRGKTTAYD HDVRTPFLVK 
RPGSSGGDSI KSDEIVQNVD LYPTLIDIAN GDEDGPTDRD GRSLRRLIDG EKEPDWRNAA 
YVEHYKSPKP GTGDPDAEDL GPKKGNSSPP TYDAIRTAQD LLVDYKGYEQ PEFYDLDADP 
YQLDNKPDDP RADELKDPLA DLANCGKKGH PDCWEAAHIG AD