Gene Snas_5001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5001
Symbol
ID	8886208
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	5307187
End bp	5308467
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	69%
IMG OID
Product	hypothetical protein
Protein accession	YP_003513731
Protein GI	291302453
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.52714
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.539309
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGCGC CGGATCTGAA ACGACTCGCC GACACGTGCG TCCATTGTGG TTTCTGTTTG 
TCGACGTGCC CCACCTACGA ACTGTGGGGA CAGGAGATGG ACTCGCCGCG CGGGCGGATC 
CAGCTGATGA AACTGGGTCT GGAGGGCGCC GAGCTCACCG ATTCCACCGT GAACCACATG 
GACCGGTGTC TGGGGTGCAT GGCCTGCGTG ACGGCCTGTC CCTCGGGGGT TCGCTACGAC 
GTCCTCATCA CCGCCAAACG CGCCGAGGTG GAGGAACAGC ATCCGCGCAC CGCTTCGGAG 
CGCTGGCTGC GGCGGCTGAT CTTCGCGCTG TTCCCGTATC CGCGCCGGTT GCGGCTGTTG 
CGGTGGCCGC TGCGGATCGC GCAGTGGCTG CGGTTGGACC GGCTCGCGAC CCGGACGCTG 
TCGCGGCGGG CCCCGCGACT GGCGACGATG GCGACACTGG CGCCCCGCGC GGGTGCGCGT 
CCCCGACTGC CGCAGCGGAT CGCGGCGTCG GGCGACAAAC GGGCGACGGT CGGCATGCTC 
ACCGGCTGCG TCCAGGGCGA GTTCTTCCCG CAGGTCAACG CCGCCACCGC GCGGGTGCTG 
GCGGCCGAGG GCTGCGAGGT GGTGATCCCA CCGGGGCAGG GCTGCTGCGG GGCGTTGTCC 
CTGCACACTG GACGGCGAGC CGAGGCGACG AACTTCGCCA AGGCCACGAT CGAGGCGTTC 
GAGGCCGCCG GGGTCGACAC GATCGTCGTC AACGCGGCCG GTTGCGGCTC GGCGATGAAG 
GAGTACGACG AACTGTTCGC CGACGACCCC AACTGGGAAC GACGGGCCCG CGACTTCGTC 
GCGAAGGTCC GCGACGTCAG CCAGTACCTG GCCGAACTGG GGCCGCGCGG GCCACGACAC 
GCACTGAACC TCACCGTCGC CTACCACGAC GCCTGCCATC TGGCCCACGC CCAACGGGTG 
CGGGCACAAC CGCGCGAACT GTTGCGCGGC ATACCCGGGC TCGACGTACG CGAGATCGCC 
GACGCCGAGA TCTGCTGCGG TTCGGCCGGT GTCTACAACA TCCTGCAACC GAAAGCCGCG 
TCCGAACTGG GCGACCGCAA GGCCGCCAAC GTCCTGGACA CGAACGCGGA ACTGCTGGTC 
TCGGCCAATC CCGGCTGCGC CATGCAGATC GCCGCCGCCG TCACACGACG CGGCGAGTCA 
CTGCCGGTGG CGCACATCGT CGAAGTCCTC GACGCGGCGA TCCGTGGCGA CGATCCCGCG 
AAACTGCTCG ATCGAGGCTA A

Protein sequence

MDAPDLKRLA DTCVHCGFCL STCPTYELWG QEMDSPRGRI QLMKLGLEGA ELTDSTVNHM 
DRCLGCMACV TACPSGVRYD VLITAKRAEV EEQHPRTASE RWLRRLIFAL FPYPRRLRLL 
RWPLRIAQWL RLDRLATRTL SRRAPRLATM ATLAPRAGAR PRLPQRIAAS GDKRATVGML 
TGCVQGEFFP QVNAATARVL AAEGCEVVIP PGQGCCGALS LHTGRRAEAT NFAKATIEAF 
EAAGVDTIVV NAAGCGSAMK EYDELFADDP NWERRARDFV AKVRDVSQYL AELGPRGPRH 
ALNLTVAYHD ACHLAHAQRV RAQPRELLRG IPGLDVREIA DAEICCGSAG VYNILQPKAA 
SELGDRKAAN VLDTNAELLV SANPGCAMQI AAAVTRRGES LPVAHIVEVL DAAIRGDDPA 
KLLDRG