Gene Snas_0202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_0202
Symbol
ID	8881380
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	215715
End bp	217232
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	69%
IMG OID
Product	alpha-L-arabinofuranosidase domain-containing protein
Protein accession	YP_003509014
Protein GI	291297736
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.957662
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	0.0476441
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAACC GGCACAAGGC GAGCGTCGTG CTAGACCCGG CGTTCGCGGT GGCCCCCGTC 
GACCGGCGGC TGTTCGGGTC GTTCGTCGAA CACATGGGGC GGTGCGTGTA CGGCGGGATC 
TACGACCCCG GCCATCCGTC CGCCGACGAG CACGGCCTGC GCACCGACGT CATCGACCTG 
GTGCGGGAAC TGGGCGTGTC GGTGGTGCGC TACCCCGGTG GCAACTTCGT GTCCAGCTAC 
CGCTGGGAGG ACGGCATCGG ACCGGTCGCC GACCGGCCCC GGCGGCTCAA CCTGGCCTGG 
CGGTGCCTCG AGACCAACGA ATTCGGGCTC GGCGAGTTCA TGACCTGGGC GAGACTGGCC 
GTCGTGGAAC CCATGATGAC GGTCAACCTC GGCACCCGGG GCGTCGCCGA GGCCTGCGAC 
ATGATCGAGT ACTGCAACCA CCCCGGCGGC ACCGCGCTGT CCGACCTGCG CCGCAAACAC 
GGCTCGGCCG ATCCCTACGA CATCAAACTG TGGTGCCTGG GCAACGAGAT GGACGGACCC 
TGGCAGGTGG GCCAGAAGAC CGCCGCCGAA TACGGACGCA TCGCCGCCGA GACCGGCAAG 
GCAATGCGCA TCGTGGACCC GTCCATCGAA CTGGTCGCCG CGGGCAGCTC CAACTCCCAG 
ATGCCGACCT TCGGCGACTG GGAGGCCACT CTTCTGGAAC ACGCCTACGA CCAGGTCGAC 
TACCTGTCGT TGCACCACTA TTTCGACCCC GCCAACCAGG ACCGCGACAG CTTCCTGGCC 
TCGGGCACCG TCATGGACCG TTTCATCGAC GACGTCGTGT CCACGTGCGA CCACATCGGC 
GCCAAACGCC GCAGCCGCAA GAAGATCAAG CTCAGCTTCG ACGAGTGGAA CGTGTGGTAC 
CAAAGCCGCT TCACCGAACC CGGTGACCGG GAGTGGATCG AGTCGCCGCC GCTGATCGAG 
GACGACTACG ACGCCACCGA CGCCGTGGTC GTCGGCGACC TGCTCATCAC GCTGCTGCGG 
CACGCCGACC GGGTCTCGAT CGCCAACCAG GCCCAGCTCG TCAACGTCAT CGCCCCCATC 
CGCACCGCCC CGGACGGACC GGCCTGGCGG CAGTCGATCT TCCACCCGTT CGCGCTGACC 
TCCCGGCTGG CCCGCGGCAC CGTGCTGCGC ACCGAGACCG CGGGCCCCCG GCACGAAACC 
CCGCGCCACG GCGAGGTGCC GACCCTGAGC ACCACCGCCA CCCACGACGC CGCCACCGGC 
CAGACCGTCC TGTTCGCCGT GAACCGCGCC GAGCACCCGG TGGAACTGGC GGTGGACGCG 
CGCGCCCTGT CCGGCGTCCG GCTCGCCGAA CACCTCACGA TCGCCGAAGA CGACCCCACG 
GCGATCAACA CCCCCGCCGA CCCCGACCGG GTCGGACCCC GTCGACTACC ACCATCCGTT 
ATGGACAACG GACGCTGTCT GGTGCGGCTG CCCGCGCTGT CCTGGAACGC CCTGCGTTTG 
AGTGAAGAGA AAGAGTGA

Protein sequence

MDNRHKASVV LDPAFAVAPV DRRLFGSFVE HMGRCVYGGI YDPGHPSADE HGLRTDVIDL 
VRELGVSVVR YPGGNFVSSY RWEDGIGPVA DRPRRLNLAW RCLETNEFGL GEFMTWARLA 
VVEPMMTVNL GTRGVAEACD MIEYCNHPGG TALSDLRRKH GSADPYDIKL WCLGNEMDGP 
WQVGQKTAAE YGRIAAETGK AMRIVDPSIE LVAAGSSNSQ MPTFGDWEAT LLEHAYDQVD 
YLSLHHYFDP ANQDRDSFLA SGTVMDRFID DVVSTCDHIG AKRRSRKKIK LSFDEWNVWY 
QSRFTEPGDR EWIESPPLIE DDYDATDAVV VGDLLITLLR HADRVSIANQ AQLVNVIAPI 
RTAPDGPAWR QSIFHPFALT SRLARGTVLR TETAGPRHET PRHGEVPTLS TTATHDAATG 
QTVLFAVNRA EHPVELAVDA RALSGVRLAE HLTIAEDDPT AINTPADPDR VGPRRLPPSV 
MDNGRCLVRL PALSWNALRL SEEKE