Gene Snas_3353 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_3353
Symbol
ID	8884552
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	3553446
End bp	3554927
Gene Length	1482 bp
Protein Length	493 aa
Translation table	11
GC content	69%
IMG OID
Product	Propeptide PepSY amd peptidase M4
Protein accession	YP_003512112
Protein GI	291300834
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.765099
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATCC CTGCCAGCCC GTCGCCGGCC GCGCCCACGG CGCCCGCTGA CGCCCCGGTC 
TCACCCCCGC CGTCACGCCG CGCCGCCCGC CGATCGATCG TGCCGTTGCT GACGCGGCTG 
CACTTCTACG CCGGAGTACT GGTCGCCCCG TTCCTGGCGA TCGCGGCGCT GAGCGGCCTG 
GCCTTCGTCT TCTCGCCGCA ACTCGACGAC GTCGTCTACG CCGACGAGCT GTACGTCGAC 
GACATCGGCG AGACCACCCA ACCGCTCGCC GACCAGGTCG CGGCGGCCCG CGAAGCGCAC 
CCGGACGGCG ACCTGGCCAC GGTCATCCCA CCCGTCGAAC CCGACGAGAC CACGAAGGTC 
GTGTTCTCAC TGCCGAAACT GGGCGAGAAG CAGCACACCG TGTACGTCGA CCCCTACGAC 
AACAAGGTGA AAGGCACCTT GACAACCTGG TTCGGAGAAA CCCCACTCAT GACCTGGCTC 
GACGACCTGC ACCGCAACCT GCACCTGGGC GCGCTGGGCC GCCACTACTC GGAACTGGCC 
GCGTCCTGGC TGTGGGTGAT CGTGCTGGCA GGCGTATTCC TGTGGATCCG TCGGCAGTGG 
ACCGGCCGCC GCAAACTGCG CCGCACCGTC CTGCCGGACA CCAACGCTGG CAAGGGAGTC 
CGCCGCACCC GCAGCTGGCA CGCCGCCACC GGAATCTGGC TCGCCGTCGG CCTGCTGGCC 
CTGTCCGCGA CCGGCCTGAC CTGGTCGCGA TACGCGGGCG GCAACTTCGA CATAGTCCAA 
GAGCAGCTCA GCGCCCAACG CCCCGTCCTG GACACCACAC TCCCCGGGAC CGACACCGGG 
GGAGAGGAAT CCGGCGGCGG CCACCACGGC TCCCACACCG GCAACAGCGG CGACGCGGCC 
TACGACCCGT CCAACGTCGA CAACGTGGTG GAAGTCGCCC GAAAAGCCGG ACTGACCGGC 
AAGATCGAAG TGACCCCACC CACCGAAGCG GGCACCGCCT GGACAGTCGC GCAGGACGAC 
GCCACCTGGC CGGTCGGCTA CGACCAGATC GCCGTCGACG CCGACACCGC CACCGTGGTT 
TCCCGCAACG ACTTCGCCGA CTGGCCCCTC CTGGCCCAGC TGTCCAAACT CGGCGTCGCA 
TTCCACATGG GATTCCTCTT CGGACTCATC AACCAGATCC TACTCGCGGC CCTGGCGATC 
GGCCTGTTGT GTGTGACCGT GTGGGGATAC CGGATGTGGT GGCAACGCCG CCCCACCCGC 
ACTGACCGCA CCGCCCCCGT GGGCGCACCC CCGACCCGAG GCACCTGGCG CCAAGTCCAC 
CCTGGAGCCT TCGCTGTCGG CATCGGCGTG GTCGTCTTCA CCTGCTGGGC CATGCCCGTC 
CTGGGCGTCT CCCTGATCGC GTTCCTGCTC TTCGACGCGA TAGCCGGACT CGTCCGACGC 
TCAACCGTCG ACGCACCGCG CCATACCGGC GACATCGTTT GA

Protein sequence

MSIPASPSPA APTAPADAPV SPPPSRRAAR RSIVPLLTRL HFYAGVLVAP FLAIAALSGL 
AFVFSPQLDD VVYADELYVD DIGETTQPLA DQVAAAREAH PDGDLATVIP PVEPDETTKV 
VFSLPKLGEK QHTVYVDPYD NKVKGTLTTW FGETPLMTWL DDLHRNLHLG ALGRHYSELA 
ASWLWVIVLA GVFLWIRRQW TGRRKLRRTV LPDTNAGKGV RRTRSWHAAT GIWLAVGLLA 
LSATGLTWSR YAGGNFDIVQ EQLSAQRPVL DTTLPGTDTG GEESGGGHHG SHTGNSGDAA 
YDPSNVDNVV EVARKAGLTG KIEVTPPTEA GTAWTVAQDD ATWPVGYDQI AVDADTATVV 
SRNDFADWPL LAQLSKLGVA FHMGFLFGLI NQILLAALAI GLLCVTVWGY RMWWQRRPTR 
TDRTAPVGAP PTRGTWRQVH PGAFAVGIGV VVFTCWAMPV LGVSLIAFLL FDAIAGLVRR 
STVDAPRHTG DIV