Gene Hhal_1155 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hhal_1155
Symbol
ID	4710145
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhodospira halophila SL1
Kingdom	Bacteria
Replicon accession	NC_008789
Strand	-
Start bp	1258837
End bp	1260816
Gene Length	1980 bp
Protein Length	659 aa
Translation table	11
GC content	65%
IMG OID	639855629
Product	N-6 DNA methylase
Protein accession	YP_001002733
Protein GI	121997946
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAACACCG AGAATCACTC CCAGATGGCC GGATTCATCT GGTCGGTCGC CGACCTGCTG 
CGCGGCGATC TCAAGCAATC CCAGTACGGA CGGGTCATCT TGCCGTTTAC CCTGCTGCGG 
CGGCTGGAGT GCGTCCTGGA GCCGACCAAG GAGCAGGTGC TGGCCGCGGC GAAGGAGCAC 
GCGGACAAGC CGCTGGGGGT GCGCGAGCGG CTTCTGCGCC GGGCGGCCGA TCAGCCTTTC 
TTCAACACCT CGCCGCTGAC CCTGGGGACG CTGTCGGACA CGCAGACCGC GGACGACCTG 
ATGAGCTACG TCCAGTCGTT CAGCCCCGAT GCCCGAGAGG TCTTTGAGCA CTTCAACTTC 
GAGGACTTCG TCCAGCAGCT CTCGGCGAAC AATCTGCTCT ACCAGGTGGT GCAGCGCTTC 
GCGGCCATGG ATCTCAGCCC CGGGCGGATC TCCAACTTCG GCATGGGCTC GATCTTCGAG 
GAGCTGATCC GCAAGTTCGC CGAGAGCTCC AACGAGACCG CCGGTGAGCA CTTCACGCCC 
CGCGACGTGG TCCACCTGAC CACCTCGCTG GTGCTCACCG ATCAGGACGA CAAGCTGCAA 
CCGCACAGCG TGGTCACGGT CTATGACCCG GCCGCCGGCA CGGGTGGCTT CCTCTCCGAG 
AGTGACGCCT ACATCCAGCA GGTCAGCGAT AACGTGACCG TTTCGCTGCA CGGCCAGGAG 
CTCAACCCGG AGTCCTACGC CATCTGCAAG GCGGACATGC TGATCAAGGG CCAGCAGGTC 
GAGAACATCA AGCTCGGCAA CACCCTCTCC GACGACGAGC TCGCCGGCGA GCGCTTCGAC 
TTCATGCTTG CCAATCCGCC CTTCGGCGTG GAGTGGAAGA AGGTCCAGAA GCAGGTCACC 
GACGAGCACA AGCGCTGGGG GTACAACGGC CGCTTCGGAC CGGGCCTGCC CCGGGTCTCC 
GACGGCTCCC TGCTATTTCT GCTGCACCTG GTGAGCAAGG TCCGCGATCC GCGGGAGGGT 
GGCTCGCGCA TCGGCATCAT CCTCAACGGC TCCCCGCTGT TCACCGGCGG GGCCGGTAGC 
GGCGAGTCGG AGATCCGTCG CTTCCTGCTT GAGCGCGACC TGGTGGAGGC CATCGTCGCC 
CTGCCCACGG ACATGTTCTA CAACACCGGC ATCGCCACCT ACGTCTGGAT CCTCTCCAAC 
GACAAGCCGC CGGAGCGCCG CGGTCGGGTG CAGCTGATCA ACGCCACCGA GCGTTACAGC 
AAGATGCGCA AGTCGCTCGG ATCCAAGCGG CAGTACATCG ACGATACAAA CATCGACAAC 
ATCGTCCGCC TCTACGGCGC CTTCGAGGAG AGCGAAGAGA GTAAGCTCTT CCCGGTGGCG 
GAGTTCGGCT ACCGGCGGAT CACCGTCGAG CGGCCCCTGC GGCTCAACTT CCAGGCCAGC 
GAGGAGCGCA TCCGCCGGAT CCTCGACGAG AAGCCGATCC AGAAACTCGA CGAGGACACC 
CAGGCCCGCC TCCTGGCCGC CTGCGAGGCC ATGGACGGCC AGATGCTCTA CCGGGACCGG 
CAGGCGTTCA CCCGCGACCT GAAGCGTGCC CTGGAGGAGC GGGAAGTGAA GCTCGGCGCG 
CCACCGATGA AAGCGGTCCT CAACGCCTTA TCCGAGCGCG ACCCGGAGGC CAAGCCGTGC 
ACCGACGCCA AGGGCAACCC GGAGCCGGAC ACCAGCCTGC GTGACCACGA GAACGTGCCG 
CTGACCGAAT CCGTCTACGA CTATTTCGAG CGCGAGGTGC GCCCGCACGT CCCCGACGCC 
TGGATCGACG AGGCCAAGCG TGACGCCCAG GACGGCGAGG TGGGCATCGT CGGCTATGAG 
ATCCCCTTCA ACCGCCACTT CTACAAGTTC ACCCCGCCGC GCCCGCTCGA AGAGATCGAC 
GCGGACCTGA AGGTCTGCAC GGACCGGATC AAGCGGATGA TCGAGGAGCT GTCGGCATGA

Protein sequence

MNTENHSQMA GFIWSVADLL RGDLKQSQYG RVILPFTLLR RLECVLEPTK EQVLAAAKEH 
ADKPLGVRER LLRRAADQPF FNTSPLTLGT LSDTQTADDL MSYVQSFSPD AREVFEHFNF 
EDFVQQLSAN NLLYQVVQRF AAMDLSPGRI SNFGMGSIFE ELIRKFAESS NETAGEHFTP 
RDVVHLTTSL VLTDQDDKLQ PHSVVTVYDP AAGTGGFLSE SDAYIQQVSD NVTVSLHGQE 
LNPESYAICK ADMLIKGQQV ENIKLGNTLS DDELAGERFD FMLANPPFGV EWKKVQKQVT 
DEHKRWGYNG RFGPGLPRVS DGSLLFLLHL VSKVRDPREG GSRIGIILNG SPLFTGGAGS 
GESEIRRFLL ERDLVEAIVA LPTDMFYNTG IATYVWILSN DKPPERRGRV QLINATERYS 
KMRKSLGSKR QYIDDTNIDN IVRLYGAFEE SEESKLFPVA EFGYRRITVE RPLRLNFQAS 
EERIRRILDE KPIQKLDEDT QARLLAACEA MDGQMLYRDR QAFTRDLKRA LEEREVKLGA 
PPMKAVLNAL SERDPEAKPC TDAKGNPEPD TSLRDHENVP LTESVYDYFE REVRPHVPDA 
WIDEAKRDAQ DGEVGIVGYE IPFNRHFYKF TPPRPLEEID ADLKVCTDRI KRMIEELSA