Gene Snas_0072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_0072
Symbol
ID	8881248
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	+
Start bp	80612
End bp	82501
Gene Length	1890 bp
Protein Length	629 aa
Translation table	11
GC content	66%
IMG OID
Product	hypothetical protein
Protein accession	YP_003508887
Protein GI	291297609
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.504192
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCAAAGC CCACTTTCCG CCAGCGTGCG CGCTATTGGT TCGACAACAC CATGTCCAAG 
GGCACCAAAG CCCTGATCAG CTGGCTGACC ATCATCACCC TGGTCGTCGT GGCCATCGGT 
GCCGGTCTCG CCGTGCTGGC CTCGCTGATC GACCCCAAGG CCGAAGACGA AGGGTTCGCC 
GCCAACCTGT GGACGGCGTT CATCCACGTC ATCGACCCGG GAACCATCAC CGGTGACACC 
TCTACTCCGC TGTTCATCGG CATGATGCTG GTGATCACCA TCGGCGGTCT GGTCATCATC 
TCGTCCCTTG TGGGTATTCT GACCACCGGT CTGGACGCCA AGCTGGAGGA ACTGCGCAAG 
GGCCGCTCAC TGGTCGTCGA GAGCGGCCAC ACCGTCGTCC TGGGCTGGTC GGACCAGGTC 
TTCACCGTCA TCTCCGAACT GGTGGAGGCC AACGAGAGCG AGAAACGCGC CTGCATCGCC 
ATCCTGGCCG ACCGCGACAA GGTCGAGATG GAGGACGAGA TCCGGGCCAA ACTCTCCGAC 
CTGAAGACCA CGAAGGTCGT GTGCCGCACC GGCGACCCGG CCGACCCCGA CGACATCGCC 
ATCGTCAACC CCGAGCAGGC CAAGGGCATC GTCCTGCTCA CCTCCAACGA GGAGGACCCG 
GACGCCCAGC TGGTGCGCAG CCTGCTCGCC GTCACCGAGG GCGGGCAGAA GACCGACGGA 
CCGCACGTGG TGGGAGCGGT CACCGACAGT CGCAACCTGC CCGCGGCCCG GCTGGCCGGT 
GGGCCCCGCG CCCAGGTCGT CGACGGCGAC GACATCATGG CGCGGCTGAT GGTGCAGACC 
TGTCGGCAGT CGGGACTGTC GGTCGTCTAC ACCGACCTGC TGGACTTCGG CGGCGACGAG 
ATGTACATGG TCGAGGAGCC GCGGCTGGTG GGCTGCACGG TGCAGCAGGT GGTGCACGCG 
TACCGCGTCT CAAGCTTCAT GGGCATCTAC AACCCCAACA CCGGCAGCCG CATCAACCCG 
CCGTCCTCGA CCGTCGTCAA CCCGGGCGAC CGGCTCATCA TGCTGTCCGA GGACGACAGC 
ACCATCGTGC TGGACGGCGC GCAGCCGTAC ATCGAGGAGA AGGCCATCGT GGCGCGCGGC 
GAGCACGGCT CCCGTCCCGA ACGCACCCTC ATCCTCGGCT GGAACGCCCG CACCCCAACG 
GTTCTGGAAC AGCTCGACGC CTACGTGTCC CGAGGCTCCA CCACCGACGT CGTCTCCGAC 
CACGGCGACA TGTCCACCCA GCTGCGTCGC CTCGGGCCGC AGATGAAGGT GCAGTCGGTG 
AACTTCAAGG AGGACGACAC CACCAGCCGC GCGCTGCTGG AGTCGCTCAA CGTCGCCAGC 
TACGACCACG TCATCGTGTT GTGCCGCGAC GACGTACCGG CGCAGTTGGC CGACTCCAAG 
ACCCTCGTGA CGCTGCTTCA CCTGCGCGAC ATGGCCGAGA AGTCCGGCCA GCGCTACAAG 
GTGGTCAGCG AGATGGCCGA CGACCGCAAC CGGGGCCTGG CCCAGGTGAC CCAGGCCGAC 
GACTTCATCG TCAGCGAGAA GCTGATCAGC CTGATGCTGA CCCAGACCGC CGAGAACCCG 
CACCTGTCGC AGGTCTTCAA CGACCTGTTC GACCCGGACG GCAGCGAGAT CTACCTGAAG 
CCGTGCGAGT ACTACGTCCG GCCGGGCATG CCGCTCAACT TCTACACGGT GGCCGAGAGC 
GCCAGGCGTC GCGGCGAGAC GGCCATCGGC TACCGGCAGG CGGCACTGTC CAGCCAGGCG 
CCCACCTTCG GTGTCGTCCT CAACCCGGAC AAGGCGGCCG GTTTCACGAT GCAGGCCGGC 
GACAAGGTGA TCGTGCTGGC CGAGGACTGA

Protein sequence

MSKPTFRQRA RYWFDNTMSK GTKALISWLT IITLVVVAIG AGLAVLASLI DPKAEDEGFA 
ANLWTAFIHV IDPGTITGDT STPLFIGMML VITIGGLVII SSLVGILTTG LDAKLEELRK 
GRSLVVESGH TVVLGWSDQV FTVISELVEA NESEKRACIA ILADRDKVEM EDEIRAKLSD 
LKTTKVVCRT GDPADPDDIA IVNPEQAKGI VLLTSNEEDP DAQLVRSLLA VTEGGQKTDG 
PHVVGAVTDS RNLPAARLAG GPRAQVVDGD DIMARLMVQT CRQSGLSVVY TDLLDFGGDE 
MYMVEEPRLV GCTVQQVVHA YRVSSFMGIY NPNTGSRINP PSSTVVNPGD RLIMLSEDDS 
TIVLDGAQPY IEEKAIVARG EHGSRPERTL ILGWNARTPT VLEQLDAYVS RGSTTDVVSD 
HGDMSTQLRR LGPQMKVQSV NFKEDDTTSR ALLESLNVAS YDHVIVLCRD DVPAQLADSK 
TLVTLLHLRD MAEKSGQRYK VVSEMADDRN RGLAQVTQAD DFIVSEKLIS LMLTQTAENP 
HLSQVFNDLF DPDGSEIYLK PCEYYVRPGM PLNFYTVAES ARRRGETAIG YRQAALSSQA 
PTFGVVLNPD KAAGFTMQAG DKVIVLAED