Gene RoseRS_0032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	RoseRS_0032
Symbol
ID	5206965
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus sp. RS-1
Kingdom	Bacteria
Replicon accession	NC_009523
Strand	-
Start bp	33506
End bp	34603
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	61%
IMG OID	640593666
Product	stage II sporulation E family protein
Protein accession	YP_001274425
Protein GI	148654220
COG category	[K] Transcription [T] Signal transduction mechanisms
COG ID	[COG2208] Serine phosphatase RsbU, regulator of sigma subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAAGTC AACGCAAACG ACCTTTTCAC CGCTTCACGC TGCTCAGTCA CGCAGCGACC 
GGTCGACTGC GCCGCAGGGA GCGACCTGCA CAGCCGCGGC TCACCCCGGA GGAAGCGCGT 
CGTCAGGCGG AAATCGAGCA CGAACTGCTC CTGGCGCGTG ATATTCAACA AGGGTTACTG 
CTCGAAGCGG TGCCACGCCT GCCAGGATGG GAAATTCACG CCATTTCGCT GCCAGCGCGC 
GATCTGGGAG GCGACCTGTA CGATTTTTTG CCGCTCGGTG AGGAACGCCA CGGGATCATG 
ATCGGCGATG TTTCAGGAAA AGGGTTGCCA GCAGCCCTCC GTATGGCCGT CGCGCGTACC 
GTGTTTCGCT ATGCCGCCCG GCGCGGCGCA ACACCCGGTC CGACGCTTGC GGACGTTAAT 
CGCGGGATCA TCGCCGACAT TCCACAGGGC ATGATCACCA TGCTGTATGC CGTGCTCGAT 
CTGCGCCACG GTATTGTGCA GGTGGCGAAT GCCGGGCATC ATTATCCGCT GCTGCTCAAC 
GGGCGCGTCA GCGAACTGGA ACTCTCAGGA TTGCCGCTTG GCGTCGATGA CGATGTTGAT 
TACGAAGAGA TATGCGCCGA TATCGAACCG GGCGCCACGG TGATGATGTA CACCGATGGC 
GTGGTCGAGG CGACAAATAG CAGGGGCGAA TACTTCGGGT ACGAGCGGTT GGAGCGACTG 
TTGATCGAAA GCGCAACCCT GAAGCCGCGT GCCCTGGTTG CACGGTTGCT GCACGAACTG 
CGCGCCTGGA GCGACGCCGG TCAGGATGAC GATATTACCG TTGTGGCGGT GCGACGACGG 
TTCGAGCGAC TCGCCGATGA GTTGTACAGC ATTCTCCGCG ATGTCCTGGG TGATGATCGC 
GCCGGGCAGG CCTGGGAGAC GTTGCCGCGC CCCGATGACC ACGAAGGCGC CGATGCCTGG 
ACGGAAGCCT TGCCGGAGAT CGTCAAAGCG GTGCAGAGTC GTTTCGGGCG CGGTCTGGCG 
CGCGAGTTGA ACGCGCAGAT CCGTCTGACG CTCGAAGAAT ACCGAATCAT GAAAAAATAT 
GGACCAATGC GCTACTAA

Protein sequence

MRSQRKRPFH RFTLLSHAAT GRLRRRERPA QPRLTPEEAR RQAEIEHELL LARDIQQGLL 
LEAVPRLPGW EIHAISLPAR DLGGDLYDFL PLGEERHGIM IGDVSGKGLP AALRMAVART 
VFRYAARRGA TPGPTLADVN RGIIADIPQG MITMLYAVLD LRHGIVQVAN AGHHYPLLLN 
GRVSELELSG LPLGVDDDVD YEEICADIEP GATVMMYTDG VVEATNSRGE YFGYERLERL 
LIESATLKPR ALVARLLHEL RAWSDAGQDD DITVVAVRRR FERLADELYS ILRDVLGDDR 
AGQAWETLPR PDDHEGADAW TEALPEIVKA VQSRFGRGLA RELNAQIRLT LEEYRIMKKY 
GPMRY