Gene Htur_5043 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_5043
Symbol
ID	8745849
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013748
Strand	-
Start bp	31879
End bp	32928
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	47%
IMG OID	646515657
Product	restriction endonuclease
Protein accession	YP_003406604
Protein GI	284176328
COG category	[V] Defense mechanisms
COG ID	[COG1715] Restriction endonuclease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	69
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATATGTA TGTCTGTACA AGAGGAAGAA CGGAGTGAAC TACTCCCACG GTTACAAAAT 
ATTGATCCGA TCGAATTCGA ACATTTTGTA GCTGATCTCT GGAGTCGACA AGGATGGGAA 
ACAGAAGTAT CAACAGCATC TAATGACGAG GGTGTTGATA TTGTTGCCGA TAAACAAGTC 
GGAGGAGTCG ATCATCGCCA AGTGATCCAG GTAAAACGGT ATAGCAATGG GAATAAAATT 
GGACGTCCAG ATGTTCAACA GTATTACGCG CTCAAAGTAC AGGATGCAAA AGCGGATGCA 
GCCGTTATCG TAACAACGTC GACGTTCACA TCAACCGCTA AAGAATGGGC AAGTGAACAT 
AATGTCAAGC TTATTGACGG GGACGATTTG GTTGAGTTGA TTCAAGAGCA GCGTGCCTAT 
GATCTTGTCG AAGAATATGC CCCATCGTTA TCGACGTCGT CAACTGACCC TGTCGAGCGA 
TCGCAGATAA CCGAAACACA GACCGAATTG CCAGATCCAC TTGATGATGC AGAAGTGCGG 
AAAAAAGCAG GTATTGGTCT GGGTGCCATC GGTCTCTATC TCATTCTGAA CCCGACTGGT 
ATTGGCTATT CTATCGAGGC TGTCGGAATG CTATTTCTTC TCGGAGCAAT TGCTGTTGTG 
AAGTTCCCCG AGCAGGTTTG GGCAGCTATC ACTCCAGATA AGGAAGTGAT CCGGGAATTC 
TCGGATGGTG CAACGGTTAT TGAACAGAGT GAGACGGTTG AGTACGTTCC TGCAGATGAT 
CGAGATCCAG TCGCATTCAA CGACTTTGAG GATATCCCAG AACGACGCCA ACAGGCGAAT 
GTATACGGTT CTCTTGATCA GACATGGGGC CCTCTACAAG AACTCCCTCC AGGTAGTGTT 
CCAACAGACA TTGCGGCACA AGGTCAGGGT ACTATCGTCG CGTACCGGTA TGCTGTACAC 
TCAGAATCAC CAGCTTCAAT CGCACAAGAT ATGAAGATGA CCCAGCAGGA GGTCATTGAT 
CATCTGACTA ATATTGCAAA ACCAGACTGA

Protein sequence

MICMSVQEEE RSELLPRLQN IDPIEFEHFV ADLWSRQGWE TEVSTASNDE GVDIVADKQV 
GGVDHRQVIQ VKRYSNGNKI GRPDVQQYYA LKVQDAKADA AVIVTTSTFT STAKEWASEH 
NVKLIDGDDL VELIQEQRAY DLVEEYAPSL STSSTDPVER SQITETQTEL PDPLDDAEVR 
KKAGIGLGAI GLYLILNPTG IGYSIEAVGM LFLLGAIAVV KFPEQVWAAI TPDKEVIREF 
SDGATVIEQS ETVEYVPADD RDPVAFNDFE DIPERRQQAN VYGSLDQTWG PLQELPPGSV 
PTDIAAQGQG TIVAYRYAVH SESPASIAQD MKMTQQEVID HLTNIAKPD