Gene Snas_5214 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5214
Symbol
ID	8886423
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	5538768
End bp	5539979
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	69%
IMG OID
Product	major facilitator superfamily MFS_1
Protein accession	YP_003513942
Protein GI	291302664
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.833951
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.607033
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCATGA TGAACAGTAA GACAAGCGCG ATCAACGGCC ACACCACCGC GCGACCGGGC 
GCGGGCACCA ACCTGGCACT GGCGACGGTG GCGTTCGCGG TGACGTTCTG GGCCTGGAAC 
CTGGTCGGTC CACTGTCTAA GACATACACC GACGCGCTCG ACCTGACGCC GACGCAGACG 
TCCATTCTGG TGGCGTTTCC GGTGCTGGTC GGTTCGCTGG GCCGCATCCC CGTCGGCGTG 
CTGACCGACC GCTACGGCGG CCGGATGATG TTCACCGTCA TCTGCTTCGT CAGCATCATC 
CCGACGCTGC TGGTGGGGCT GTCGCACGGT TCGTTCACGG GACTGCTGCT GTGGGGGTTC 
TTCCTGGGTA TCGCCGGGAC CTCGTTCGCG GTCGGCATCC CGTTCGCCAA CGCCTGGTTC 
CCGCCGACGC GGCGCGGCTT CGCCACCGGC GTGTTCGGCG CGGGCATGGG CGGCACCGCG 
CTGTCGGCTT TCCTGACGCC GCAACTGGTC TCGGCCTTCG GGCTGCTGCG CACCCACCTG 
GTGATGTGCG CGGCGCTGGC CGTCATGGGC GCGGTCATGT GGCTGTTCGC CCGCGACAGC 
CCCGACTGGC GGCCCAGCAC CGAGGCGGCA CTGCCCCGGA TCCGTGACGC ACTCAAGATC 
AAGGCCACCT GGCAGCTGTC GCTGCTCTAC GCGGTGGCCT TCGGTGGTTT CGTGGCCTTC 
TCCACCTACC TGCCGACGCT GTTGACCATC TCCTACGAGT TCGTCCAGAC CGACGCGGGC 
ATGCGCGCCG CCGGGTTCTC GCTGGCGGCC GTCGTGGCCC GCCCGGTCGG CGGCATGCTG 
TCCGACCGGA TCGGGCCGGT CAAGGTCTGT CTGGCCTCGT TCTTCGGCGC GACCGGCATG 
GCGGTGGTGC TGTCGTTCCA TCCGCCCGCC GAGATCCCGG CCGGGACGTC GTTCGTGCTG 
ATGGCCGTGG CGCTGGGGCT GGGAACCGGC GGCGTGTTCG CACTGGTCGC CAAGCTCGTC 
GAACCGGCCC GGGTCGGCAC CGTCACCGGC CTGGTCGGTG CCGCGGGTGG CCTGGGCGGC 
TACTTCCCGC CGCTGTTGAT GGGCGTCATC TACCAGGCCA CCGGCGACTA CGTCATCGGC 
TTCTGGCTGC TGGCCGTCAC CGCGCTCCTG GTGGGGCTGT TCACGATGCG GGTGTTCCGG 
CAGGTGCGCT GA

Protein sequence

MSMMNSKTSA INGHTTARPG AGTNLALATV AFAVTFWAWN LVGPLSKTYT DALDLTPTQT 
SILVAFPVLV GSLGRIPVGV LTDRYGGRMM FTVICFVSII PTLLVGLSHG SFTGLLLWGF 
FLGIAGTSFA VGIPFANAWF PPTRRGFATG VFGAGMGGTA LSAFLTPQLV SAFGLLRTHL 
VMCAALAVMG AVMWLFARDS PDWRPSTEAA LPRIRDALKI KATWQLSLLY AVAFGGFVAF 
STYLPTLLTI SYEFVQTDAG MRAAGFSLAA VVARPVGGML SDRIGPVKVC LASFFGATGM 
AVVLSFHPPA EIPAGTSFVL MAVALGLGTG GVFALVAKLV EPARVGTVTG LVGAAGGLGG 
YFPPLLMGVI YQATGDYVIG FWLLAVTALL VGLFTMRVFR QVR