Gene Huta_1723 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_1723
Symbol
ID	8384009
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	-
Start bp	1732649
End bp	1733872
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	49%
IMG OID	644972790
Product	HNH endonuclease
Protein accession	YP_003130629
Protein GI	257052796
COG category	[V] Defense mechanisms
COG ID	[COG3440] Predicted restriction endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGGAAG AATCTGTGGT CTCGCCGGAG CGTTGTGCGA CAATCCGACG TGAATACTCT 
CAGCAAACCG GGTTTGATCC ATTGGTGGAG GAGCTAGATA TCGAGAAACA GGAACTCCGC 
CACCACCTAT ACGGAGACTG TAGTCACGAT ATCGCAATTG AACCAATCGA CCCGCCGGTC 
AGTCATCAAT TAGATGCTGA TCAGTGCCAG GAGATCCGAA ACCTATTCGC AGATGGTTTC 
GATACGGAGA CCTTAGAGCA ACGGTTCGAG ACACGATGGC GGCCAATTGC TCGTCATCTC 
ACCGGTGAGT GCTCACATAA TAACGATGCG CCCACGGTGG CTCGGAGCGA AATCAGTGAT 
CGGGAGCCGA TTTCGGAAAC TGACTGTGCC GTGCTCCGCG AGCGGTTCTT CGACGACGAA 
GAACGAAGCA TTATGGATGT TGCACGGGAT GTTCGGTGGA GCTATGAGGC CGTTGTTCAA 
CACGTCAACG GAAACTGTTC TCACGATATT ACTACGAGCT CTCGATCAAC TGAGGAACGG 
GGAGGTAATC TAACCAAAGA GGATTGCCAG AACGTTCGAG AACTATGGGC TCAGGATCCC 
GAAATGACAC TCGAAAAAGT TGCATCGGAG ATCGAAAGAT CAGAAGCGAC CGTTGAAAAG 
CATATCAAAC GGGCTTGTTC TCATTCTTCG GATGAATTGT TGATCGACGA AATGCAAATA 
TTTGACTCAA TATTGACAGA CGAGGATGAG CAGGTTAGCG ATTCGCAGGC TATACTAGAT 
GCCGCTAATT CTTCGAATAT TGACTCTGAA GAGTTCGTAG ACGACGTGAT TACCCCGGAT 
TCAGTCGAAA CGACTATTAG TCGGACAGTC CGCAACACGA CACTCGTCAA AGAATTAAAA 
GGAGCATACG ATTACGAGTG TCAGGTCTGC GATAGTCCCC GGTATCAGGG TCCAGATAAA 
CGCTACGCAG AGGGACATCA TATCAAGCCG CTGGGTGAGC CGCATAACGG ACCAGACACG 
CCAAGTAATA TCTTGGTTCT ATGTCCGAAT CATCATGCAG ACTTTGATTA CGGTTTGATA 
GAGATTGATC CCGGGACTTA TGAGATACAT CATGAATATG ATGATACTGT TCACGGTAGT 
ACTCTGACTG TCGATGGGGA ACACGATTTG GACCCTGAGA AATTAAGCTA CCATAGTCAA 
CGGATCTCCG AAGTCACCCG CTGA

Protein sequence

MMEESVVSPE RCATIRREYS QQTGFDPLVE ELDIEKQELR HHLYGDCSHD IAIEPIDPPV 
SHQLDADQCQ EIRNLFADGF DTETLEQRFE TRWRPIARHL TGECSHNNDA PTVARSEISD 
REPISETDCA VLRERFFDDE ERSIMDVARD VRWSYEAVVQ HVNGNCSHDI TTSSRSTEER 
GGNLTKEDCQ NVRELWAQDP EMTLEKVASE IERSEATVEK HIKRACSHSS DELLIDEMQI 
FDSILTDEDE QVSDSQAILD AANSSNIDSE EFVDDVITPD SVETTISRTV RNTTLVKELK 
GAYDYECQVC DSPRYQGPDK RYAEGHHIKP LGEPHNGPDT PSNILVLCPN HHADFDYGLI 
EIDPGTYEIH HEYDDTVHGS TLTVDGEHDL DPEKLSYHSQ RISEVTR