Gene Hneap_0616 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hneap_0616
Symbol
ID	8533751
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halothiobacillus neapolitanus c2
Kingdom	Bacteria
Replicon accession	NC_013422
Strand	+
Start bp	661782
End bp	664133
Gene Length	2352 bp
Protein Length	783 aa
Translation table	11
GC content	56%
IMG OID	646383004
Product	Type I site-specific deoxyribonuclease
Protein accession	YP_003262516
Protein GI	261855233
COG category	[V] Defense mechanisms
COG ID	[COG4096] Type I site-specific restriction-modification system, R (restriction) subunit and related helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACGAAG CCGAAACCCG CGCCGAACAT ATCGACCCTG CCTTGGCTGC TGCCGGATGG 
GGCGTGGTGG CCGGTTCACG CATTCGGCGA GAATACCCGA TTACCTTGGG CCGCATTGAA 
GGCGCGGGTA AACGCGGCAA GGCGCTGACG GCCGATTATG TGCTGGAGTA CCGCAATACC 
AAGTTGGCGG TGGTCGAGGC CAAGGCGTGG AATAAACCAC TCACCGAGGG CGTGGGCCAA 
GCCAAGGATT ATTCCGGCAA ACTCGCCATC CGTTTTGCGT ATGCCACGAA CGGTCAGGGC 
ATTTATGGCA TCGATATGGA ATCCGGCGTC GAAGCCGAGC TCGCAAATTA TCCATCCCCG 
GATGAATTGT GGGCGCGCAC CTTTGCCAGC CAGAATATTT GGCGTGATCG CTTCGCGGAG 
GTGCCGTTCG AGGATCGGGG CGGGTACTTT CAAAGTCGGT ATTATCAAGA CATTGCCATC 
GAGCGCGTGC TGGCGGCAAT CGCCGATCAT CAATCGCGCA TTTTGCTCAC CTTGGCGACC 
GGTACGGGCA AAACCTTTAT TGCCTTTCAA CTGGCGTGGA AGCTGTTTCA TAGCCGCTGG 
AACTTGCGCG ACTGGCAGCG TGAAGCCGAA CCGAGCCGCC GCCCGCGTAT TTTGTTTTTA 
GCCGACCGCA ACATTCTCGC CAATCAGGCC TTCAATGCCT TTTCGGCGTT CCCGGAAGAT 
GCGTTGGTAC GGATTGATCC TGCCGATATT CGCAAGCAGG GAAGGGTGCC GAAAAACGGC 
AGTCTGTTTT TCACGATTTT CCAGACATTC ATGAGTGGGC AGGATGCCGA AGGCCAGCCT 
GCACCGTACT TTGGCGATTA CCCGCCGGAT TTTTTCGATT GCATCATTAT CGACGAGTGC 
CATCGCGGTG GCGCGAACGA TGAAAGCAAC TGGCGCGGCA TTCTGGCGTA TTTCGCGCCC 
GCCGTGCAGC TTGGCTTGAC CGCCACGCCC AAGCGCAAAG ACAACGTGGA TACCTATCAA 
TACTTCGGCG AGCCGGTGTT TGTGTATTCA TTGAAGGACG GCATCAATGA TGGTTTTTTG 
ACTCCGTTCC GAGTGAAGCA AATCGCCACC ACGCTCGATG AATATGTGTA CACGCCCGAT 
GACACGCTGG TGGAAGGCGA GATTGAAGCG GGCAAGCGCT ACGAAGAAGC CGACTTCAAC 
AAGATCATCG AGATCAAGGA ACGTGAGCAA AAGCGTGTCG AGATTTTCAT GGCGCAAATT 
GACCAGCGCG AGAAAACCAT CGTGTTTTGT GCCACCCAAG AACATGCCCT GGCCGTGCGG 
GATTTGATCA ACCAGATCAA GTCCAGCAGC AACCCCGATT ACTGCCAACG GGTAACCGCC 
AATGATGGTG CGCGGGGTGA ACACTATCTG CGCGATTTTC AGGACAACGA GAAAACTATC 
CCGACGATCC TGACCACATC GCAAAAGCTC TCGACCGGCG TGGACGCCCG CAACGTGCGC 
AATATCGTGC TGATGCGCCC CGTCAATTCG ATGATCGAAT TCAAACAGAT TATCGGGCGC 
GGCACGCGGC TGTATGACGG CAAGGATTAC TTCACCATCT ATGATTTCGT GAAGGCGCAC 
CATCACTTCA ATGACCCCGA ATGGGACGGC GAGCCGCTGG AACCAGAGCC AACCGACCCC 
CGCCCACCCC AACCGCCGAG TGAACCAACC CCGCCCGATG GCGTGCGTGA ACCCAGTTCG 
TCTTATGAGC GCAAGCCCAA AGTGAAAGTG CAGCTTTCCG ATGGCAAGGC CCGCACCATC 
CAGCACATGA TGAGCACGAG CTTCTGGCAC CCGGACGGTA CACCGATGTC TGCCCAGCAG 
TTCATGGAAT CGCTGTTTGG TCGCTTGCCG GAGTTTTTCA AGGACGAAGA CGAATTACGG 
GCCCTGTGGA GTGACCCCGA AACCCGCAAA CGCTTGCTCG AAGGGCTGGC CGAAAAAGGC 
TTCGGTACGG ATCAACTGCG GGAAATGCAA AAGATCATCG ATGCACAAAA TAGTGATCTG 
TTCGATGTGT TGGCTTATGT GGCCTACGCC CAAACGCCGC TGAGCCGGGA AGATCGCGCG 
GATCGTGCCA TGGCGCTCAT CAGCAGCCAC TTCAACAGCA AACAGCAAGT GTTTCTGGAT 
TTCGTGCTTT CGCAGTACAT CAGCGTGGGG GTGGAGGAGT TGGACAAAAC CAAACTCGGC 
AGTTTGCTCC GCCTGAAATA CCACGACTCC ATCAACGATG CTATCGCCGA CCTCGGCAAG 
CCCGATGAAA TCGGCCAGAT GTTTAGCGGG TTTCAGAAGT TTTTGTATCA GCCAGTGCAA 
GCGAAGGTTT AG

Protein sequence

MNEAETRAEH IDPALAAAGW GVVAGSRIRR EYPITLGRIE GAGKRGKALT ADYVLEYRNT 
KLAVVEAKAW NKPLTEGVGQ AKDYSGKLAI RFAYATNGQG IYGIDMESGV EAELANYPSP 
DELWARTFAS QNIWRDRFAE VPFEDRGGYF QSRYYQDIAI ERVLAAIADH QSRILLTLAT 
GTGKTFIAFQ LAWKLFHSRW NLRDWQREAE PSRRPRILFL ADRNILANQA FNAFSAFPED 
ALVRIDPADI RKQGRVPKNG SLFFTIFQTF MSGQDAEGQP APYFGDYPPD FFDCIIIDEC 
HRGGANDESN WRGILAYFAP AVQLGLTATP KRKDNVDTYQ YFGEPVFVYS LKDGINDGFL 
TPFRVKQIAT TLDEYVYTPD DTLVEGEIEA GKRYEEADFN KIIEIKEREQ KRVEIFMAQI 
DQREKTIVFC ATQEHALAVR DLINQIKSSS NPDYCQRVTA NDGARGEHYL RDFQDNEKTI 
PTILTTSQKL STGVDARNVR NIVLMRPVNS MIEFKQIIGR GTRLYDGKDY FTIYDFVKAH 
HHFNDPEWDG EPLEPEPTDP RPPQPPSEPT PPDGVREPSS SYERKPKVKV QLSDGKARTI 
QHMMSTSFWH PDGTPMSAQQ FMESLFGRLP EFFKDEDELR ALWSDPETRK RLLEGLAEKG 
FGTDQLREMQ KIIDAQNSDL FDVLAYVAYA QTPLSREDRA DRAMALISSH FNSKQQVFLD 
FVLSQYISVG VEELDKTKLG SLLRLKYHDS INDAIADLGK PDEIGQMFSG FQKFLYQPVQ 
AKV