Gene Hore_22420 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_22420
Symbol
ID	7312994
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	+
Start bp	2443423
End bp	2444766
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	46%
IMG OID	643612694
Product	hypothetical protein
Protein accession	YP_002509982
Protein GI	220933074
COG category	[S] Function unknown
COG ID	[COG1690] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	66
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAAATACT ACCGTTTTAA GCAGGAAGGG AGAATGAACT GTGATGTCCG GGTCTTTGCC 
ACCCGGGACC TCTATAACCA GATAGAAAAA ACAGCCTTAA AACAGCTTTT TAATGCAGCC 
AGCCTTCCAG GAGTAGTCGG GGTTATAGGA CTCCCCGATA TCCATCAGGG GTATGGATTA 
CCCATCGGTG GAGTAATGTG TTCCAGTTTA AAAAAAGGAG TCATCTCTCC CGGGGCGGTA 
GGTTTTGATA TAAACTGTGG AGTCCGGCTT TTAGTTGCCG GTTTAAGGCT CGAAGATATA 
ATTGATAAAC TGGATGATAT AATGTCCGGA CTGAAAAATG AAATCCCGGC CGGGTTAGGG 
GTTAATTCAA CATTAACATT TACCGACCAG CAATTTGAAC GGGTAGTTGA GGAGGGACTA 
CCCTTTTTAA TAACCAGGCT GGGGTATGGA CAGACCATTG ATATAGCAGC CTGTGAGGAA 
AACGGCCACC TAAAGGGGGC AGATCTTACG GGGGTCTCAA AAAAGGCCAT AAACAGGGGT 
AAAAAACAGC TGGGAACCCT CGGTTCAGGC AATCATTTTC TTGAAATTCA GGTAATTGAT 
AAGGTCTATA ATCATAACTC CGGTCTCGAA GAGGGCCAGA TCAGTATCAT GATCCACACC 
GGATCCCGGG GTTTTGGCCA CCAGATTGCT GAAGATTATA TCAACATTGC CAAAAAAAGG 
GCCAAAAAAT ATAATTTTGA TTTCCCCACT AAAAACCTGG CCTCCTTCCC CATTAATTCC 
CCGGAAGGGG AAGACTACTA CCGGGCCATG GCCTGTGCCG CTAACTTTGC TTTTGCCAAC 
CGGCAGATAT TAACCCATTT TGTAAGACAG GTAATAAACC ACTTTATACC GGGAACCTTT 
ATTACTGTAT ATTATGACCT CGCCCATAAT ATCTGCAAAA AGGAAATTCA CCAGATAAAT 
GGCAAGAAAA AAGCCCTTCT GGTCCACCGT AAAGGGGCTA CCAAGCTATC CCCTGACGGC 
ATTGCCCTTG TTCCAGGATC TATGGGAACA GACAGTTATA TTGTCAGGCC GAAAAATCAG 
GAGGCCCTGA AAGCTGCCTT TGAATCTGTT TCCCATGGAG CCGGTCGGAA AATGGGGAGA 
AGGCAGGCCA GAAAGAAACT ATCATACCGG GAACATTTAA AGAGTCTGGG GGAAGTCAGA 
GTGACCTCGG CCACCAATGA CAACCTCCTG GATGAATCAC CACTGGCCTA TAAGGATATT 
AGTGAGGTCA TAAGGTCCCT TAAAGAAACC GGGCTGGCAG AACCGGTGGT CCGTCTTAAA 
CCCCTGGCTG TTTTAAAGGG ATAG

Protein sequence

MKYYRFKQEG RMNCDVRVFA TRDLYNQIEK TALKQLFNAA SLPGVVGVIG LPDIHQGYGL 
PIGGVMCSSL KKGVISPGAV GFDINCGVRL LVAGLRLEDI IDKLDDIMSG LKNEIPAGLG 
VNSTLTFTDQ QFERVVEEGL PFLITRLGYG QTIDIAACEE NGHLKGADLT GVSKKAINRG 
KKQLGTLGSG NHFLEIQVID KVYNHNSGLE EGQISIMIHT GSRGFGHQIA EDYINIAKKR 
AKKYNFDFPT KNLASFPINS PEGEDYYRAM ACAANFAFAN RQILTHFVRQ VINHFIPGTF 
ITVYYDLAHN ICKKEIHQIN GKKKALLVHR KGATKLSPDG IALVPGSMGT DSYIVRPKNQ 
EALKAAFESV SHGAGRKMGR RQARKKLSYR EHLKSLGEVR VTSATNDNLL DESPLAYKDI 
SEVIRSLKET GLAEPVVRLK PLAVLKG