Gene Snas_5086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5086
Symbol
ID	8886293
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	5402598
End bp	5403863
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	65%
IMG OID
Product	hypothetical protein
Protein accession	YP_003513815
Protein GI	291302537
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.776305
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGAAA TGCGAACCGC GCGGGTGCGA CTCGCCGTGC TGGCCGTCGC GGCTGTGGGC 
GCCGTCGTCG CGGGCACCGT GGCGATGATC CCGGCATCCG CCGACGACAC CGAGGGCACT 
ACATACTATG TAGACAGTAG TGGCGCCGAC TCGGCCTCCG GCAAGAAGAC GGGCACGGCG 
TGGAAGTCAC TGGACAAGGT CAACGACTTC GACTTCAAAC CCGGCGACTC CGTCCTGTTC 
AAACGCGGCT CCACCTGGGA AGGCACCCTG AGACTCGACG ACGACGGCAC CAAGGCCGCC 
CCCGTCACGG TGGGTGCCTA CGGCGAGGGT GACGCCCCGG TGTTCACCGC CGCCGACAAC 
TGCGTCGAGG TCGACGGCGA CAACCAGGTC ATTGAGGACA TCCGCGCCAC CGACTGCTCC 
TGGGCCGGAA TCGAACTGCG GGGCAGCCAG AACGAGGTCC GCAATGTCCA GTCCGACAAG 
AACGTCGTCG GTGTCTCCAT AGTTGACAAG TCAAAGGGGA ACAAGGTCAC CGGCTCCAAG 
CTTGTCGACA ACGACAAGAT GAGCGTCAAC GACCCGGGCG GCGACAACGA CTCCGGTGCC 
TTCGGGGTAC TCCTCAACGG CGACGACAAC ACCATCTCCG GCAACACGAT CACCGGCAGC 
TTCGCCGAAA GCCACGACTA CGGCTACGAC GGCGCGGCGG TCGAGATCTT CAACGGCGAC 
CGCAACGTCA TCTCCCACAA CGTGACCGCC GACAACGAGA CCTTCACCGA ACTGGGCCAC 
GACCCCGGCG GAACCGCCGA CGACAACGTC TTCGCCTACA ACTCGGTGAC CTCCACCCAG 
AAGACCGGCG CCTTCCTGGT CACCCGTGGC GAAGGCGTCC CGATCGGCCC GGTCAAGGGC 
ACCGTCGCGG TCAACAACTC CGTCAACCTG ACCACGGGCG ACACGGCGGG CTGGGTCTGC 
CACGACGGCT GCTCCCCGGA CATCCTGAAG CTGCGCAACA ACATCATCAA GGTCACCGGC 
AACACCGGCT TCGAGGACGG CGAGGGCGCC GACGAGAACA ACGGCGTCTA CTCCGGCAAG 
GACCACCAGT TCGAGCTCGG CGACAAGTCC GTCAAGGACG ACCCGAAGTT CACCAGCGAC 
ACCGACCTGC ACCTCACCGA GGGCAGCCCG GCGATCGGAC TGGGCGAACC GGCGGGATAC 
GACGAAGACC TGGACGGCAA CCCCGTGGGG GACAAGCCGG ACGCGGGCTG TTACCAGAGC 
AAGTAG

Protein sequence

MTEMRTARVR LAVLAVAAVG AVVAGTVAMI PASADDTEGT TYYVDSSGAD SASGKKTGTA 
WKSLDKVNDF DFKPGDSVLF KRGSTWEGTL RLDDDGTKAA PVTVGAYGEG DAPVFTAADN 
CVEVDGDNQV IEDIRATDCS WAGIELRGSQ NEVRNVQSDK NVVGVSIVDK SKGNKVTGSK 
LVDNDKMSVN DPGGDNDSGA FGVLLNGDDN TISGNTITGS FAESHDYGYD GAAVEIFNGD 
RNVISHNVTA DNETFTELGH DPGGTADDNV FAYNSVTSTQ KTGAFLVTRG EGVPIGPVKG 
TVAVNNSVNL TTGDTAGWVC HDGCSPDILK LRNNIIKVTG NTGFEDGEGA DENNGVYSGK 
DHQFELGDKS VKDDPKFTSD TDLHLTEGSP AIGLGEPAGY DEDLDGNPVG DKPDAGCYQS 
K