Gene TM1040_0563 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	TM1040_0563
Symbol
ID	4077914
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Ruegeria sp. TM1040
Kingdom	Bacteria
Replicon accession	NC_008044
Strand	+
Start bp	599575
End bp	600474
Gene Length	900 bp
Protein Length	299 aa
Translation table	11
GC content	57%
IMG OID	638005860
Product	RNA polymerase factor sigma-32
Protein accession	YP_612558
Protein GI	99080404
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02392] alternative sigma factor RpoH [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.939582
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.0697509
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAAATT ATGCAAACCT TCCCGCCCCG TCTCCCGAAG GCGGACTCAA TCGGTATCTG 
CAGGAAATTC GCAAGTTCCC GCTTCTGGAG CCGGAAGAGG AATACATGCT GGCCAAGAGA 
TGGGTCGAAG AGCAGGACAC CGAAGCCGCG CACAAGATGG TAACATCGCA TCTGCGACTG 
GCAGCAAAAA TTGCCATGGG ATACCGGGGT TACGGGTTGC CTCAGGCAGA AGTCATTTCT 
GAAGCTAATG TTGGTCTGAT GCAGGCGGTA AAGCGGTTCG ATCCGGAAAA AGGCTTCCGT 
CTGGCAACCT ATGCGATGTG GTGGATCCGC GCCTCCATTC AGGAGTATAT CCTGCGGTCC 
TGGTCGCTGG TGAAGCTTGG GACCACATCT GCGCAGAAGA AGCTGTTTTT CAATCTGCGC 
AAAGCCAAGG CCCGGATCGG TGCACTTGAG GATGGAGATC TGCGGCCCGA AGTGGTGAAG 
AAGATCGCCA CAGATCTTGG CGTGACCGAG GATGAGGTGA TCTCCATGAA CCGACGTATG 
TCGGGCGGCG ATGCGTCGCT CAATGCCATG GTGGGCAGCG ACGGTGACAG CACCATGCAG 
TGGCAGGATT GGCTCGAGGA TGAGGACGCC GATCAGGCGG GAGATTACGA GGCCCGTGAC 
GAGCTGCAAG CGCGCCGGGA GCTTCTCGCC GAGGCCATGA GCGTCCTCAA CGATCGCGAG 
AAAGACATTT TGACCCAGCG TCGTCTGGCC GAGCAGGCCA AGACGCTTGA AGAGCTGAGT 
GTCCAATATG ATGTGAGCCG GGAGCGCATT CGCCAAATCG AAGTGCGCGC CTTTGAAAAG 
CTACAGAAGA AAATGCGCGA GCTCGCGGCT GGCAAGGGGA TGCTGCAGTC GAAGCTCTGA

Protein sequence

MANYANLPAP SPEGGLNRYL QEIRKFPLLE PEEEYMLAKR WVEEQDTEAA HKMVTSHLRL 
AAKIAMGYRG YGLPQAEVIS EANVGLMQAV KRFDPEKGFR LATYAMWWIR ASIQEYILRS 
WSLVKLGTTS AQKKLFFNLR KAKARIGALE DGDLRPEVVK KIATDLGVTE DEVISMNRRM 
SGGDASLNAM VGSDGDSTMQ WQDWLEDEDA DQAGDYEARD ELQARRELLA EAMSVLNDRE 
KDILTQRRLA EQAKTLEELS VQYDVSRERI RQIEVRAFEK LQKKMRELAA GKGMLQSKL