Gene Snas_5180 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5180
Symbol
ID	8886388
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	5503564
End bp	5504742
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	67%
IMG OID
Product	glycine betaine/L-proline ABC transporter ATPase subunit
Protein accession	YP_003513908
Protein GI	291302630
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.860702
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGACA CCAAAACCAC CGCGAAACCC GCATTGACCC GTGGCGCCGA GATCAAGCTC 
TGCGGTGTCA CCAAACGCTA TTCGGGCCAG AAGATCGCCG CCGTCGACAA CGTCAACCTG 
ACGATTCCGG CCGGGGAGAT CGTCGTGTTC GTCGGGCCGT CCGGCTGCGG CAAGACCACG 
ACGATGCGCA TGATCAACCG CCTGATCGAA CCCACCAGCG GTGAGATCCT CATCGGTGGC 
GAGGACGTGC GCAAGAAGGA CGCCAACGAG CTGCGCCGCC ACATCGGCTA CGTGATCCAG 
GCCGGGGGAC TGTTCCCGCA CATGACCGTC GCCGAGAACA TCGCGATCGT GCCGCGCATG 
CTGGGCTGGG ACAAGGACAA GGCCGCCGAA CGGGTGCGGG AGATGCTGAA CCTGGTCGGC 
CTGGAGCCGG GCCAGTTCGC CGACCGCTAT CCCCGGCAGC TGTCCGGCGG ACAGCAGCAG 
CGTGTCGGCG TCGCCCGGGC GCTTGCCGCC GACCCGCCGG TGATGCTCAT GGACGAGCCC 
TTCGGCGCCG TCGACCCGAT CACCCGGGCC CACCTTCAGG ACGAGCTGCT GTCGCTTCAG 
GACGAACTGT CCAAGACCAT CGTCTTCGTC ACCCACGACT TCGACGAGGC GGTCAAGCTC 
GGCGACCGGA TCGCGATCCT CGCCGAGGGC TCCAAGATCG TCCAGTACGA CGAACCCGCC 
GCGATCCTGG CCAACCCGGC CGACGACTTC GTGCGCGGGT TCATCGGCGA GGGCGGCGCG 
ATGAAGCTGC TCAACGTCAC CCGCGTGGCC GACATCGAAC TCGATGAACT CGTCACGGCG 
CGGGCCACCG ACTCGGCCGC CGACGTCAGA GAGCGCATCG GCGACCGCGA CGTTCCGTGG 
GCGATCGTTC TGGACGACGC CGACCGACCG GTCCGCTGGA TCTCGAAGGA CACGCTGGCC 
GATATGGATG GTGCGATCGG CAACGCCGGT GACAAGGTCA CCGCCACCAT CAGCGGCCGG 
GCCAACGTCC AGGAAGCCCT CGAGGCGCTG CTGAAGACCG ATTTCACCAG CGTTCCGGTG 
ACGGTGCGCC GCAAGTACGT GGGCATGGTC TCGCTGTCGA CGGTGCAGAA CGCCATCGCG 
GGTCTGCGCG AGAAGTCCAA GGCCAGGAGC CGCTCATGA

Protein sequence

MSDTKTTAKP ALTRGAEIKL CGVTKRYSGQ KIAAVDNVNL TIPAGEIVVF VGPSGCGKTT 
TMRMINRLIE PTSGEILIGG EDVRKKDANE LRRHIGYVIQ AGGLFPHMTV AENIAIVPRM 
LGWDKDKAAE RVREMLNLVG LEPGQFADRY PRQLSGGQQQ RVGVARALAA DPPVMLMDEP 
FGAVDPITRA HLQDELLSLQ DELSKTIVFV THDFDEAVKL GDRIAILAEG SKIVQYDEPA 
AILANPADDF VRGFIGEGGA MKLLNVTRVA DIELDELVTA RATDSAADVR ERIGDRDVPW 
AIVLDDADRP VRWISKDTLA DMDGAIGNAG DKVTATISGR ANVQEALEAL LKTDFTSVPV 
TVRRKYVGMV SLSTVQNAIA GLREKSKARS RS