Gene Hore_05110 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hore_05110
Symbol
ID	7314490
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothermothrix orenii H 168
Kingdom	Bacteria
Replicon accession	NC_011899
Strand	-
Start bp	557074
End bp	558234
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	34%
IMG OID	643610934
Product	DNA methylase N-4/N-6 domain protein
Protein accession	YP_002508264
Protein GI	220931356
COG category	[L] Replication, recombination and repair
COG ID	[COG0863] DNA modification methylase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	39
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATGACA GTAGTACCTG TAATGACAAT AATATTAACA ATTATAAAAT AATCAGGTTA 
AAACATAAAT CTAATTTGCA CTCTTCAGAA ATTAAAGCCA TTGACTATAT AAATAAATTC 
TTTAACCAGG ATAACTTCTA CATTGAGGTA AATCCCGGCT CCGTAAAGAT TTATTTAAAA 
AAACTCGACA TGAAAAAGCT GGGTCGGTTA ATTAAAGAAA TAAACGATAC CAGTCCTTTT 
CTTCTCAAAA TATACCGTAC TATAAAAAAT ATAAAAAGCT ATGTCATTGA AAATAACAAA 
AGGGTTTATG TAGACTATAA CAGAGAAAAA AAAGTTAAAA ACAGAAAGAA AAAGGAAAGA 
AACAGGCAAA AATATTTTTA TGCCAGAAAT CATAATTTTA ATGTCATTAA TCAACCATTA 
CCTGAAAAAT ATATAAATAA AATTATCTGT GGTGACAGTG AACAAATACT TAAAGAAATA 
CCTGATAACA GTATAGATCT CATTCTTACT TCCCCGCCAT ATAACTTTGG ACTTGATTAC 
AAAGATTCAC GGGATGGCTA TTACTGGAAA AGTTATTTTA GTAAGTTGTT TTCCATTTTT 
AAGGAATGTA TCAGAATTCT CAAATATGGC GGCCGGATAA TCATCAACGT CCAGCCCCTC 
TTTTCAGATT ATATCCCCAC CCACCACCTG ATCAGCAACT TTTTTATAAA AAATAAGATG 
ATCTGGAAGG GAGAAATCCT CTGGGAAAAA AATAACTACA ACTGCAAATA TACAGCCTGG 
GGTAGCTGGA AAAGCCCCTC AAGTCCTTAT TTAAAATACA CCTGGGAGTT TTTAGAGATC 
TTTGCAAAGG GTAGTTTAAA GAAAAAAGGA GATAAAAAAA ATATTGATAT TACAGGAGAG 
GAATTTAAAG AATGGGTTTC GGCCAGGTGG TCGATTGCCC CGGTCCGTAA TATGAAAAAA 
TACCAGCACC CGGCAGTATT CCCCGAGGAA CTGGTTTATA GAGTCCTGAA GTTATTCAGT 
TATAAGGGTG ACGTTATCCT CGATCCCTTT AACGGAACAG GAACCACTAC AGCAGTCGCC 
CACAGACTTA AAAGGAATTA TCTGGGGATT GATATCTCAC CTGATTACTG TAATACAGCC 
CGTGGCCGTC TTAATCCATA G

Protein sequence

MNDSSTCNDN NINNYKIIRL KHKSNLHSSE IKAIDYINKF FNQDNFYIEV NPGSVKIYLK 
KLDMKKLGRL IKEINDTSPF LLKIYRTIKN IKSYVIENNK RVYVDYNREK KVKNRKKKER 
NRQKYFYARN HNFNVINQPL PEKYINKIIC GDSEQILKEI PDNSIDLILT SPPYNFGLDY 
KDSRDGYYWK SYFSKLFSIF KECIRILKYG GRIIINVQPL FSDYIPTHHL ISNFFIKNKM 
IWKGEILWEK NNYNCKYTAW GSWKSPSSPY LKYTWEFLEI FAKGSLKKKG DKKNIDITGE 
EFKEWVSARW SIAPVRNMKK YQHPAVFPEE LVYRVLKLFS YKGDVILDPF NGTGTTTAVA 
HRLKRNYLGI DISPDYCNTA RGRLNP