Gene Snas_3041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_3041
Symbol
ID	8884240
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	3207148
End bp	3208473
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	68%
IMG OID
Product	sodium:dicarboxylate symporter
Protein accession	YP_003511805
Protein GI	291300527
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0982219
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGCGT TCCTGCGAAA GATCCCGTTC TCTGCCCAAC TGCTGGCCGG TCTCGTCGTC 
GGCCTCGGCC TGGGCTACCT CGCCCGCACC GCCGACCTCG GCTGGCTGAC CACCACGCTG 
CAACAGGTCG GCGACCTGTT CGTCCAACTG CTGAAACTGG CGGTGCCGCC GCTGGTGTTC 
ACCGCGATCG TCATCAGCAT CGCCAACCTG CGCAAGGTCT CCAACGCCGC GCGCCTGGTC 
GGCAAGACCA TCGGCTGGTT CATGATCACC TCACTGATAG CCGTCGCGGT GGGTCTGGGC 
CTCGGCCTGC TCACCAACCC CGGCTCCGGT GTGGACATCT CCACCAAGGG CGCCGAGGCG 
CCCGACCACG CCGGTAGCTG GACCGACTTC ATCACCGGCA TCATCCCCAC CAACATCGTG 
GACTCCTTCG TCCAGGTCAA CGTGCTGCAG ATCGTGTTCA TCGCGATCGT CGTGGGCGCG 
GCGGCCGTCG CGGTGGGGGA CAAGGCGAAG CCGTTCCTGT CCTTCAACCA GTCGCTTCTG 
GACCTGGTGC AGAAGGTGCT GTGGTGGATC ATCCGCTTGG CGCCCATCGG CACCGCCGGA 
CTCATCGGCA CCGCCGTGGC CACCTACGGC TGGAGCCTGC TGGCCCCGCT GGCGACCTTC 
AGCATCGACG TCTACGTCGG CTGCCTCATC GTCCTGTTGG GCGTCTACCC GCTGCTGCTG 
GGCCTGGTCG GCCGGGTCAA CCCGGTGACG TTCTTCCGCA AGTCCTGGCC CGCCATCGAA 
CTGGCCTTCG CGTCGCGCTC CTCGGTGGGC ACCATGCCGC TGGCGCAGCG CATCGTCACC 
AAACGCCTCG GCGTTGACAA AGACTACGCG TCCTTCGCCT CCCCGTTCGG CGCCACCACC 
AAGATGGACG GTTGCGCCGC GATCTACCCG GCGCTGGCGG CGATCTTCGT CGCGCAGGTC 
TTCGGCGTGA ACCTGTCCAT AGGGGACTAC CTGCTGATCG CCTTCGTGTC GGTCGTGGGA 
TCGGCGGCCA CCGCCGGACT CACCGGCGCG ATCGTCATGC TCACCCTGAC GCTGAGCACG 
CTGGGCCTCC CGCTGGAGGG CGTCGGCCTG CTGCTGGCCA TCGACCCGGT GCTGGACATG 
ATCCGCACCG CCACCAACGT GGCCGGTCAG ATGGTGGTGC CGGTGCTGGT GTCGCGCGGC 
GAGAAGACCC TCGACGTGGC GGTGTTCAAC GCCCCCAACC AGCCGCTCGA CGGCTCGGAC 
GCGGTCCAGC GCCCCGAGCG TGAGACCGGC GTGGTGCGCG AACCCGAACC GGCCTTCGGT 
TCCTGA

Protein sequence

MLAFLRKIPF SAQLLAGLVV GLGLGYLART ADLGWLTTTL QQVGDLFVQL LKLAVPPLVF 
TAIVISIANL RKVSNAARLV GKTIGWFMIT SLIAVAVGLG LGLLTNPGSG VDISTKGAEA 
PDHAGSWTDF ITGIIPTNIV DSFVQVNVLQ IVFIAIVVGA AAVAVGDKAK PFLSFNQSLL 
DLVQKVLWWI IRLAPIGTAG LIGTAVATYG WSLLAPLATF SIDVYVGCLI VLLGVYPLLL 
GLVGRVNPVT FFRKSWPAIE LAFASRSSVG TMPLAQRIVT KRLGVDKDYA SFASPFGATT 
KMDGCAAIYP ALAAIFVAQV FGVNLSIGDY LLIAFVSVVG SAATAGLTGA IVMLTLTLST 
LGLPLEGVGL LLAIDPVLDM IRTATNVAGQ MVVPVLVSRG EKTLDVAVFN APNQPLDGSD 
AVQRPERETG VVREPEPAFG S