Gene Snas_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_1047
Symbol
ID	8882232
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	1107089
End bp	1108252
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	73%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003509850
Protein GI	291298572
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.743504
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	25
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGTCA CGGCCGCGTT CATCGTGCAC GGACTCGTCT TCTCGTCCTG GCTGCCCCAC 
ATCCCCGCCA TCAAGGACGA CCTGCGGTTG TCGGAGGGCA CGCTCGGCCT GGTGCTGCTG 
GCGCCGCCGT TGGGCGCGAT CGTCGCGATG TCGCTGACCG GCGCCGCCTG TGCCCGCTGG 
GGCTCCGCCG CGGTCACCAG GGTCACCCTG GTGGTCTACG CGCTGGGCAT CACCGCGATC 
GGCGTCGGGG CCGGGACCAC GTGGGGTCTG TCGCTGGCGC TGCTGTGGGC CGGGGCGCTG 
GTGGGGTCCT TCGACGTGGC CATGAACGCC CAGGGCGCCA CGGTCGAGAA GGCGATGGGC 
AAGTCCATCA TGGGGTCCTT CCACGCCGCC TGGAGTCTGG CGGCGGCCGC CGGGGCCGGG 
ATCGGCGGCT GGGTGGCCGC CGTGGACGAA GACCTGTTCA CGACGCAGCT GTTCGCGGTG 
GGCATGATCG CGCTGCTGGC GGCGCTGCCG TTCTTCACCT CCTTCATCCC CGACGCGCCA 
CCCGAAGCCC ACGCGAAGGG TCGCAAGTGG AGGTTCGAGC GCGGCCTGGT GCTGCTGTCC 
ATGGTGGCCT TCGCGGGGCT GCTGGCCGAG GGCGCGGTCG CCGACTGGAG CGCGGTGTTC 
CTGTCCCAGG AACGCGGCGC CTCACCGATG GTCGCGGGCT GGGCCTACGC GGTGTTCTCG 
GTGGCGATGC TGATCGGACG GCTGGCCGGG GACAGGCTTG TCGGCCGGTT CGGACGGTCC 
CGCAGCGTCG CCGTGGCGGC CCTGACCGGT GGCGGCGGGA TGGCGGTGGG CCTGGTGGTC 
TCGCAGCTGG CCGGGGACAG TGGGCTCGGC CAGGCCTCGT TCATCGCGGG GCTTTTCATT 
CTGGGCCTGG GCATCGCGGT GATCGTGCCG GTGGCGTTCT CCTCGGCCGG GGACGGGCCG 
GGCATCGCGA CGGTGTCGAC CGGCGGCTAC ACCGGCTGGC TGCTGGGACC GGCCGTCATC 
GGCGGCCTGG GGGAGCTGAT GGGGCTGTCG GCGGCGATCT GGGTCGTGGC GGTGCTGGCC 
GTGTTCGCGG GACTGGTCGC GCCCCTGGGC ATCGGGGCGC TGCGCGGCGC GTCCGACAAG 
GAGAAGGCAG CCGCGGCGCC GTGA

Protein sequence

MAVTAAFIVH GLVFSSWLPH IPAIKDDLRL SEGTLGLVLL APPLGAIVAM SLTGAACARW 
GSAAVTRVTL VVYALGITAI GVGAGTTWGL SLALLWAGAL VGSFDVAMNA QGATVEKAMG 
KSIMGSFHAA WSLAAAAGAG IGGWVAAVDE DLFTTQLFAV GMIALLAALP FFTSFIPDAP 
PEAHAKGRKW RFERGLVLLS MVAFAGLLAE GAVADWSAVF LSQERGASPM VAGWAYAVFS 
VAMLIGRLAG DRLVGRFGRS RSVAVAALTG GGGMAVGLVV SQLAGDSGLG QASFIAGLFI 
LGLGIAVIVP VAFSSAGDGP GIATVSTGGY TGWLLGPAVI GGLGELMGLS AAIWVVAVLA 
VFAGLVAPLG IGALRGASDK EKAAAAP