Gene Snas_6121 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_6121
Symbol
ID	8887342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	6482355
End bp	6483563
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	70%
IMG OID
Product	Membrane dipeptidase
Protein accession	YP_003514838
Protein GI	291303560
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.99517
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCACGA CCGCATCGGC GCGCGCGGGC GCGCTCCTCG CCACCGCCCC CGTCATCGAC 
GGGCACAACG ACCTGCTGAT TCGCATGCGC GGCAAGGTCC GTTACGACTT CGACGCGATC 
GACATCGCCG TCGACCAGAC CGAGCACGGC CTGCACACCG ACATCCCCCG GATGCGCGCC 
GGCGGCATGG GCGGCCAGTT CTGGTCGGTG TTCGTCCCGG TCAGCCTCCA GGGCGAGGCG 
GCGGTCACGG CCACATTGGA ACAGATCGAC GGCGCCCACG AGATGATCGG CCGCTACGAC 
GATCTCGCCC TGGCCACCAC CGCCGACGAG ATCGACAAGG CCTTCTCCGA CGGCAGGATC 
GCCTCGCTGC TGGGAGCCGA GGGCGGCCAC TCCATCGCCG ACTCGCTGGG CACGCTGCGG 
ATGATGTACC GGCTCGGCGT CCGCTACATG ACCCTCACCC ACACCTCCAA CACCGCGTGG 
GCCGACAGCG CCACCGACGC GCCCGTCGTC GGCGGCCTGA GCGAGTTCGG CCGCGAGGTG 
GTGCGCGAGA TGAACCGCCT GGGCATGCTC GTCGACATCT CCCACGTCGC TCCCTCCACA 
ATGCACGCCG CGCTCGACGT CAGCGAGGCG CCCGCGTTCT TCTCCCACTC CAACGCACTT 
GCCTTGTGTT CCCACCCCCG CAACGTCCCC GACGACGTGC TGCGGCGCGT GAAGGACACC 
CAGGGCATCG TCATGGCCAC CTTCGTGCCC GGCTTCCTCA ACGAGGCGTG CAAGGAGTGG 
ATGGACGCGC TGGAGGCCTA CGACGACAAG GCCCAGCTCG CGGTCGCCGA GGACGCCAAC 
GAGGCGGGCT ACGAGGAGCG CAAGGCCCGC CGGGAGGCCT GGTTCGCGGC GAACCCCTGC 
CCCGGAGCGT CAGTGTCTGA TGTGGCCGAT CACATCGACC ACATCCGCGA GATCGCCGGG 
GTCGACTGCG TCGGTATCGG CGGCGACATG GACGGCATCG GCGCCACCCC CGAACAGCTC 
AACGACGTCA CCGGCTACCC CAACCTCATC GGCGAACTCG CCTCCCGGAG CTGGAGCGAC 
GACGACCTGG CCAAACTGAC CCGCCGCAAC GTGATCCGGG TGCTGCGCGA GACCGAGCGG 
GTCGCCCAGG TCGCCCGGCA GCAGCGCGGC CCGTCCAACA AGACCATCGA GCAGCTGGAC 
GGGGCCTAG

Protein sequence

MSTTASARAG ALLATAPVID GHNDLLIRMR GKVRYDFDAI DIAVDQTEHG LHTDIPRMRA 
GGMGGQFWSV FVPVSLQGEA AVTATLEQID GAHEMIGRYD DLALATTADE IDKAFSDGRI 
ASLLGAEGGH SIADSLGTLR MMYRLGVRYM TLTHTSNTAW ADSATDAPVV GGLSEFGREV 
VREMNRLGML VDISHVAPST MHAALDVSEA PAFFSHSNAL ALCSHPRNVP DDVLRRVKDT 
QGIVMATFVP GFLNEACKEW MDALEAYDDK AQLAVAEDAN EAGYEERKAR REAWFAANPC 
PGASVSDVAD HIDHIREIAG VDCVGIGGDM DGIGATPEQL NDVTGYPNLI GELASRSWSD 
DDLAKLTRRN VIRVLRETER VAQVARQQRG PSNKTIEQLD GA