Gene Snas_5201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Snas_5201
Symbol
ID	8886410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Stackebrandtia nassauensis DSM 44728
Kingdom	Bacteria
Replicon accession	NC_013947
Strand	-
Start bp	5522329
End bp	5523510
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	73%
IMG OID
Product	putative RNA polymerase sigma-24 subunit, ECF subfamily
Protein accession	YP_003513929
Protein GI	291302651
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.603065
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.598241
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGTCCGCC GCTACGGCCA CTTCGACGAG AGCGAGGACG CCGTCCAGGA GGCGCTGCTG 
ACCGCCGCCA CCCGCTGGCC CACCGACGGC CTCCCCGACA ACCCGCGCGC CTGGCTCATC 
ACCGTCGCCT CCCGCCGGCT CACCGACCAG CTGCGCAGCG ACGAGGCCCG CCGCCGCCGC 
GAGGACACCG TCGCGGCCCG CCAGCTCCCC GAGGACACCC AGGCCCCCGC CGCCGACGCC 
CCCGACACCA ACGCGGACGA CACCCTGATC CTGCTGTTCA TGTGCTGCCA CCCCTCGCTG 
ACGGCCGCGT CCCAGATCGC CCTGACCCTG CGCGCGGTCG GCGGTCTGAC CACCGCCGAG 
ATCGCCCACG CCTTCCTGGT CCCCGAAGCG ACCATGGCCC AACGCATCAG CCGCGCCAAA 
CAACAGGTCA AGGCGTCCGG GCTGCCCTTC CAAATGCCAC CGGCACCCGA GCGGGCCGCG 
AAACTGGGCG CCGTGCTGCA CGTCCTCTAC CTGATCTTCA ACGAGGGCTA CACCGCCACC 
TCCGGCCCCA ACCTGCGACG CGCGGAACTG TCGAACGAGG CCATCCGCCT CACCCGAGCC 
GTCCACCGAC TGCTGCCCGA CGACGGCGAG GTCACCGGCC TGCTGGCCCT GATGCTGCTG 
ACCGACGCCC GCCGCGACGC CCGCAACACC GCCACCGGCG ACCTCGTCCC ACTCGCCGAC 
CAGGACCGCT CCCGCTGGGA CCGGCGATCC ATCGCCGAAG GCGTCGACCT CATCAGCCAC 
GCGCTGGCCA CCGCGCCCCC TGGCCCCTAC CAGGTCCAGG CCGCGATCGC CGCCATCCAC 
GACGAGGCCC CCAGCACCGA AGCCACCGAC TGGCCCCAGA TCGTCGCGCT GTACGCCGTC 
CTGGACAACC TGGCCCCCGG CCCCATGGTC ACCCTCAACC AGGCCGTCGC CGTGGCCATG 
GTGGACGGAC CCCGGGCCGG GCTGGAACTG TTGTCCCGCC TCGACGACGA CCCCCGCATG 
GCCCGGCACC ACCGCCTGGA GGCCGTCCGC GCGCATCTCT ACGAAATGGA CGGTGACCCC 
GCCGCCGCCC GCGCCGCCTA CCTCGCCGCC GCCACCCTCA CCACGAGCCT CCCCGAACAG 
GACTACCTGC GCTGGCGGGC CGACAAGCTG CCCGAATCGT GA

Protein sequence

MVRRYGHFDE SEDAVQEALL TAATRWPTDG LPDNPRAWLI TVASRRLTDQ LRSDEARRRR 
EDTVAARQLP EDTQAPAADA PDTNADDTLI LLFMCCHPSL TAASQIALTL RAVGGLTTAE 
IAHAFLVPEA TMAQRISRAK QQVKASGLPF QMPPAPERAA KLGAVLHVLY LIFNEGYTAT 
SGPNLRRAEL SNEAIRLTRA VHRLLPDDGE VTGLLALMLL TDARRDARNT ATGDLVPLAD 
QDRSRWDRRS IAEGVDLISH ALATAPPGPY QVQAAIAAIH DEAPSTEATD WPQIVALYAV 
LDNLAPGPMV TLNQAVAVAM VDGPRAGLEL LSRLDDDPRM ARHHRLEAVR AHLYEMDGDP 
AAARAAYLAA ATLTTSLPEQ DYLRWRADKL PES