Gene SeHA_C4931 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	SeHA_C4931
Symbol
ID	6489056
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salmonella enterica subsp. enterica serovar Heidelberg str. SL476
Kingdom	Bacteria
Replicon accession	NC_011083
Strand	-
Start bp	4810358
End bp	4811947
Gene Length	1590 bp
Protein Length	529 aa
Translation table	11
GC content	58%
IMG OID	642744976
Product	type I restriction enzyme EcoKI M protein
Protein accession	YP_002048548
Protein GI	194450433
COG category	[V] Defense mechanisms
COG ID	[COG0286] Type I restriction-modification system methyltransferase subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	79
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAATA ACGATCTGGT CGCCAAGCTG TGGAAACTGT GCGACAACCT GCGTGACGGC 
GGCGTCTCCT ATCAAAACTA CGTCAATGAA CTCGCCTCGC TGCTGTTTTT GAAAATGTGC 
AAAGAGACCG GCCAGGAAGC GGACTACCTG CCGGAAGGCT ACCGCTGGGA TGACCTGAAA 
TCGCGTATTG GCCAGGATCA GATGCAGTTC TACCGCAACC TGCTGGTTCA GTTAGGCTCA 
GATGAGAAAA AGCTGGTGCA GGCGGTATTC CATAATGTCA GCACCACCAT TGAGCACCCC 
AAACAGCTGA CTGAGCTGGT CAGCTATATG GATGCGCTGG ACTGGTACAA TGGCAACCAC 
GGGAAATCCC GCGACGACTT CGGCGATATG TACGAAGGGC TGCTGCAGAA GAACGCCAAC 
GAAACCAAAT CTGGCGCGGG CCAGTACTTC ACCCCACGCC CGCTGATCAA AACCATTATC 
CATCTGCTGA AACCGCAGCC GCGTGAAGTG GTGCAGGACC CGGCGGCGGG TACGGCGGGC 
TTTTTGATTG AAGCTGACCG TTACGTGAAA TCACAGACTA ACGATCTGGA TGACCTTGAT 
GGCGACACTC AGGATTTCCA GATCCACCGC GCGTTTATCG GCCTCGAACT GGTGCCCGGC 
ACCCGCCGTC TGGCGCTGAT GAACTGTCTG CTGCACGATA TTGAAGGCAA CCTCGACCAC 
GGCGGCGCTA TCCGTCTGGG CAACACGCTG GGCAGCGACG GTGAAAACCT GCCGAAGGCA 
CATATCGTCG CCACCAACCC GCCGTTTGGC AGCGCCGCGG GCACCAACAT TACCCGTACC 
TTCGTGCACC CGACCAGCAA CAAACAGCTG TGCTTTATGC AGCATATTAT TGAAACCCTG 
CACCCCGGCG GCCGCGCGGC GGTGGTGGTG CCGGATAACG TGCTGTTTGA AGGCGGTAAG 
GGCACCGATA TTCGTCGCGA CCTGATGGAC AAATGCCATC TGCACACCAT CCTGCGTCTG 
CCGACCGGTA TCTTTTACGC CCAGGGCGTC AAAACCAACG TGCTGTTCTT TACCAAAGGC 
ACGGTCACCA ATCCGCATCA GGATAAAAAC TGCACCGATG ACGTGTGGGT GTATGACCTG 
CGGACCAATA TGCCGAGCTT CGGCAAGCGC ACGCCGTTTA CCGAGCAGCA TCTGCAGCCG 
TTTGAAACTG TCTACGGCGA AGATCCACAC GGCTTAAGTC CGCGTGAAGA AGGGGAGTGG 
AGCTTTAACG CCGAAGAGAG CGAAGTCGCC GACAGCGAAG AGAACAAGAA CACTGACCAG 
CACCAGGCCA CCAGCCGCTG GCGCAAGTTC AGCCGCGAGT GGATCCGCAG CGCAAAATCC 
GATTCGCTGG ATATCTCCTG GCTGAAGGAT AAAGACAGCA TCGACGCCGA CAGTCTGCCG 
GAGCCGGACG TGCTGGCGGC AGAAGCGATG GGCGAGCTGG TACAGGCGCT GGGCGAACTG 
GATGCGCTGA TGCGCGAGCT GGGCGCGGGC GATGAAGCGG ATGCTCAGCG TCAGTTGCTG 
AATGAAGCGT TTGGCGAGGT GAAGGCATGA

Protein sequence

MNNNDLVAKL WKLCDNLRDG GVSYQNYVNE LASLLFLKMC KETGQEADYL PEGYRWDDLK 
SRIGQDQMQF YRNLLVQLGS DEKKLVQAVF HNVSTTIEHP KQLTELVSYM DALDWYNGNH 
GKSRDDFGDM YEGLLQKNAN ETKSGAGQYF TPRPLIKTII HLLKPQPREV VQDPAAGTAG 
FLIEADRYVK SQTNDLDDLD GDTQDFQIHR AFIGLELVPG TRRLALMNCL LHDIEGNLDH 
GGAIRLGNTL GSDGENLPKA HIVATNPPFG SAAGTNITRT FVHPTSNKQL CFMQHIIETL 
HPGGRAAVVV PDNVLFEGGK GTDIRRDLMD KCHLHTILRL PTGIFYAQGV KTNVLFFTKG 
TVTNPHQDKN CTDDVWVYDL RTNMPSFGKR TPFTEQHLQP FETVYGEDPH GLSPREEGEW 
SFNAEESEVA DSEENKNTDQ HQATSRWRKF SREWIRSAKS DSLDISWLKD KDSIDADSLP 
EPDVLAAEAM GELVQALGEL DALMRELGAG DEADAQRQLL NEAFGEVKA