Gene Hore_12400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_12400
Symbol
ID	7313561
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	1333523
End bp	1334599
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	40%
IMG OID	643611680
Product	RNA polymerase, sigma 70 subunit, RpoD family
Protein accession	YP_002508985
Protein GI	220932077
COG category	[K] Transcription
COG ID	[COG0568] DNA-directed RNA polymerase, sigma subunit (sigma70/sigma32)
TIGRFAM ID	[TIGR02393] RNA polymerase sigma factor RpoD, C-terminal domain [TIGR02937] RNA polymerase sigma factor, sigma-70 family

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	0.0607
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGTAAAA ATTTCAATCC AGACAAAGTT AAAGAAGTTA AGGAATTAAT TAAAAAAGGT 
AAAGAAGAAG GCTATTTGAC CTATGAAGAA ATTATGGATT CTCTGGAAGA GATAGAACTC 
TCCTCTGAAG ATATTGAGAA GATATATGAA CTCTTTAACG AGATGAATAT AGATGTAGTT 
GATGATGTGG ATGAAGTTGA TGATGATAAA GGAGATGATG ACCTGGAGTT ATCTATACCG 
GAAGGGGTTG GAATTGATGA CCCAGTAAGG ATGTATTTAA AAGAAATTGG AAAAGTACCA 
CTTCTTACTG CTGAAGAAGA GGTTGATCTG GCAAAAAGAA TTGAACAGGG CGACGAACAG 
GCTAAAAGGG AATTGGTTGA AGCTAATCTA AGACTGGTTG TTAGTATTGC TAAAAAGTAT 
GTGGGAAGAG GTATGTCTTT CCTTGATTTG ATTCAGGAAG GAAATATGGG TCTTATTAAG 
GCTGTTGAAA AATTTGATTA TCGTAAAGGA TATAAATTTA GCACTTATGC TACCTGGTGG 
ATTCGCCAGG CTATAACCCG TGCTATTGCT GACCAGGCCC GTACTATACG TATCCCGGTG 
CATATGGTAG AAACAATTAA TAAATTGATC AGGGTATCAA GACAATTACT CCAGGAAAAG 
GGGCGTGAGC CTACTCCTGA GGAGATTGGT GAAGAAATGG GAATGCCGGC CGAAAAAGTC 
CGGGAAATTT TAAAGATTGC CCAGGAACCG GTCTCCCTGG AAACACCTAT TGGTGAAGAA 
GAGGATAGTC ATCTTGGTGA TTTTATTGAG GATGAAGATG CCCCAGCACC TGCCTCAGCT 
GCTTCATTTA CTCTTTTAAG GGAACAGCTC GATGATGTGC TGGATACACT AACAGATAGA 
GAAAAAAGGG TTCTTGAACT ACGTTTTGGT CTGGAGGATG GCCGTCCCCG GACTCTAGAG 
GAAGTTGGAA AAGAATTTGG GGTTACCAGA GAAAGAATCA GGCAGATTGA GGCCAAGGCT 
TTAAGGAAAC TCCGGCATCC AAGCCGTAGT AAAAAACTCA AAGATTACCT TGAGTAA

Protein sequence

MGKNFNPDKV KEVKELIKKG KEEGYLTYEE IMDSLEEIEL SSEDIEKIYE LFNEMNIDVV 
DDVDEVDDDK GDDDLELSIP EGVGIDDPVR MYLKEIGKVP LLTAEEEVDL AKRIEQGDEQ 
AKRELVEANL RLVVSIAKKY VGRGMSFLDL IQEGNMGLIK AVEKFDYRKG YKFSTYATWW 
IRQAITRAIA DQARTIRIPV HMVETINKLI RVSRQLLQEK GREPTPEEIG EEMGMPAEKV 
REILKIAQEP VSLETPIGEE EDSHLGDFIE DEDAPAPASA ASFTLLREQL DDVLDTLTDR 
EKRVLELRFG LEDGRPRTLE EVGKEFGVTR ERIRQIEAKA LRKLRHPSRS KKLKDYLE