Gene Snas_1406 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_1406
Symbol
ID	8882593
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	1489707
End bp	1490918
Gene Length	1212 bp
Protein Length	403 aa
Translation table	11
GC content	74%
IMG OID
Product	PHP domain-containing protein
Protein accession	YP_003510206
Protein GI	291298928
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.407213
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGCCG AGACCACACT GACCGGTGTC TGGACGCCCG GCGATCGGGC CGAGGGCTTC 
TACCGGTACC TGCCGTTCGA GGTGCCCACC GGGACGAACG CGGTGCGGGT GCGGCTGGAG 
TACCCGCGCG CGGGCGGCGT GCTGGACCTG GGTTGCTTTG GCGCGGAAGG CTTTCGGGGC 
TGGTCGGGCG GCGCCCGCGA CCGCTGTGAG ATCGGCGAGT CGGCCGCGAC CCCCGGCTAC 
CTGCCGGGCG AACTCGAAAC CGGACAGTGG AATGTGGTGC TCGGTCTGCA CCGGGTGCCG 
CAACCGCTGG AGTACACCGT CACGATCGCG ACCTCGGCCG ATCCGGTGAC CCGCGTCGAG 
GAACGGGTGC CGGTCGCCAC CGAGCGCCGT CCCCGCCGCG ACCTGCCCGC TCCCACCGGG 
ATGCGTTGGG CGGCGGGCGA TCTGCACTCC CACTCCGAGC ACTCCGACGG GACGCTCAGC 
CTCGACGCGC TCGCCGCGTC GGCGGCGTCC GCCGGGCTGG ACTTCCTGGC GGTCACCGAC 
CACAACACCG TCAGCCACCA CCCGCACCTG GCCGCCGCCG GTGACCGGCA CGGCGTCCTG 
CTGCTGCCCG GCCAGGAGGT GACCACCGAA CGCGGGCACG CCAACGCCTT CGGGCCGCTG 
CCGTGGATCG ACTTCCGCCG TCCGGCCCAA CACTGGCTCG AGACCACCGA GGCCGCCGGT 
GGCCTGCTGT CGGTCAACCA CCCCATCGCG GTCGACTGCG CCTGGCGCCA GCACCTGTCC 
CGCCCCGCCC CGCTGGCCGA GGTGTGGCAC TGCACCTGGC GCGACCGCAC CTGGAGCGGC 
CCACTGGCGT GGTGGCTGGC CAACGGCACG GCCACCACCG CGATCGGCGG CTCCGACTTC 
CACGAACCCG GCCGCGACCG CCCGCTCGGC CAACCCACCA CCTGGGTCCT GGTCCCCGAC 
GGCGAGCCGA CGGTGGCGGC GGTCCTGGAG GCCCTGCGAA CCGGCACGGT CGCGATCGCG 
GCCGACATCG ACGGCCCGGC GCTGCTGCGC GTCGAGGACG AACTGGTCGC GGTGGCCGCC 
GACGGCGCGA TCCTCAGCGA CTACTCGGGA CGACGCCGAC TGGTGCGCGG CGAGACGGCC 
CGGTTCCCCG CCCCGGCGGG ACCGCACTGG CTGGAGGACT CCCGCACCAC GGTGCTGGCG 
ATCGCGAACT GA

Protein sequence

MAAETTLTGV WTPGDRAEGF YRYLPFEVPT GTNAVRVRLE YPRAGGVLDL GCFGAEGFRG 
WSGGARDRCE IGESAATPGY LPGELETGQW NVVLGLHRVP QPLEYTVTIA TSADPVTRVE 
ERVPVATERR PRRDLPAPTG MRWAAGDLHS HSEHSDGTLS LDALAASAAS AGLDFLAVTD 
HNTVSHHPHL AAAGDRHGVL LLPGQEVTTE RGHANAFGPL PWIDFRRPAQ HWLETTEAAG 
GLLSVNHPIA VDCAWRQHLS RPAPLAEVWH CTWRDRTWSG PLAWWLANGT ATTAIGGSDF 
HEPGRDRPLG QPTTWVLVPD GEPTVAAVLE ALRTGTVAIA ADIDGPALLR VEDELVAVAA 
DGAILSDYSG RRRLVRGETA RFPAPAGPHW LEDSRTTVLA IAN