Gene Snas_5120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5120
Symbol
ID	8886328
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	5437362
End bp	5438648
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	63%
IMG OID
Product	peptidase M50
Protein accession	YP_003513848
Protein GI	291302570
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.949013
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.451136
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTTACG TCGTTGGGTT GGTGCTGTTC GCCCTGGGCA TCTTGATCTC GGTCAGCCTC 
CATGAGGCCG GCCATATGGG CACCGCGAAG ATGTTCGGGA TGCGGGTGAC GCGGTTCTTC 
GTCGGGTTCG GTCCGACGAT GTTCTCGTTC CGTAAGGGGG AGACCGAATA CGGCGTGAAG 
TGGATCCCGT TGGGCGGTTT CGTCAAGATC GCCGGGATGA CGCCGCAGGA GGAGGAAGAG 
GACCAGACCC CTCCCGAGGA GCAGCACCGG GTTTTCTGGC GCAAACCGGT GTGGCAGCGC 
ACGATCGTGC TCGCCGCCGG GTCGACGGTG CACTTCATCC TGGGGTTCCT GATCCTGTGG 
ATCATGGTGT CGTTCGTCGC GGCCCCGAAC CCGGCGTTCG CCAACGAGAT CAACACTTCC 
ACGAAGATCA CCGTCTCGGA CTGTCTCATC ACCGACGCCA GCCGGGCCGA GTGCTCGGAC 
GAGGACCCCG AAGCGCCCGC CAAGACGGGC GGACTGAAAT CCGGGGACAC GCTCATCAAG 
GTCGCGGGCA AGCAGGTCGC CGGTGAGGAG TGCCGGGTTC CCGGCACCAG CGAGCAGCTC 
GACCCGACGT CGTGGTCGTG CGCCATCAAC GCGATCCGGG CGCTGCCCCC CGGCAAGGAA 
GCCACCTTCA CGATCGAGCG CGACGGTAAG ACGCTGACCA AGAAGGTCGC GCCGAAGACG 
GTGGAGATCA AGGGAACCGA CGGCAAGACC CAGGAGGTCA CCCAGGTCGG CATCTCGCAG 
CAGAACCCCA CCGTCCCGGG CACCGTCACC TACGGACCTG TCGACGGCGT CGGTGCCGCG 
GTCACCATGA CCGGTGACAT GGCGGTGAAG ATGGGCGAGG CGATGACTCG CATCCCCGAG 
AAGATCCCGG CGCTGTGGAA CTCGATCTTC GGTGAGGAAC GCGACAAGGA CACTCCGGTG 
AGTGTCGTTG GCGCCAGCCG ACTCGGTGGC GAGATGGTGG AGAACGACCT GTGGGAGATG 
TTCTTCTACC TGCTCATCAC CCTGAACTTC TTCATCGGCG TTTTCAACAT GCTTCCGTTG 
CTGCCCATGG ATGGCGGCCA TATCGCGATC GCGTGGTTCG AGAAGGTCCG ATCCTGGATC 
GCCAAGAAGC GCAACAAACC CGATCCAGGG CGCGTCGATT ACATGAAACT GATGCCGCTG 
ACGTATACCG TGTTGGCGAT CATGATCGGG TTCACCGTCC TGACGGTCAC CGCTGACATC 
GTCAACCCGA TCACACTGTT CAATTAG

Protein sequence

MAYVVGLVLF ALGILISVSL HEAGHMGTAK MFGMRVTRFF VGFGPTMFSF RKGETEYGVK 
WIPLGGFVKI AGMTPQEEEE DQTPPEEQHR VFWRKPVWQR TIVLAAGSTV HFILGFLILW 
IMVSFVAAPN PAFANEINTS TKITVSDCLI TDASRAECSD EDPEAPAKTG GLKSGDTLIK 
VAGKQVAGEE CRVPGTSEQL DPTSWSCAIN AIRALPPGKE ATFTIERDGK TLTKKVAPKT 
VEIKGTDGKT QEVTQVGISQ QNPTVPGTVT YGPVDGVGAA VTMTGDMAVK MGEAMTRIPE 
KIPALWNSIF GEERDKDTPV SVVGASRLGG EMVENDLWEM FFYLLITLNF FIGVFNMLPL 
LPMDGGHIAI AWFEKVRSWI AKKRNKPDPG RVDYMKLMPL TYTVLAIMIG FTVLTVTADI 
VNPITLFN