Gene Htur_5046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Htur_5046
Symbol
ID	8745851
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Haloterrigena turkmenica DSM 5511
Kingdom	Archaea
Replicon accession	NC_013748
Strand	-
Start bp	37066
End bp	38175
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	60%
IMG OID	646515659
Product	integrase family protein
Protein accession	YP_003406606
Protein GI	284176330
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	76
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCGGG AAAAAGCTAC GTCTCGAGAC CGCAACCCCA AGGGAAAGAC CGTCGAAGAG 
ACGGTGAACC GCTACCTCGA GAAGAAACTC GAGGCCGGCG GCAGCCGAGC TACGATGAAA 
CCCGTCCTCG ACGACTTCGC TGACTTCTGC AAGAGCGAGG GAATCGAGTA CGTCGGCCAG 
ATCGACTCGG GCGACTGTCG CGAGTACGGA CTACGTCTCA AGACGAAGAA AGCCAACGGG 
GAAATCGCTG GGTCGACGGC GAATACGTAC TTCGCCTACG TCCGGGCGTT CCTCTCGTTC 
TGTGTTCGCG ACGAGCTGCT CGATACGAAT CCCGCACAGA CCGAACGGGC GGAGGAGTTC 
CTTCCCGAAG ACAAATCGAC CGGCGAGACC CAGTTCTGGG AACCTGAGCA GCGGAAGCGA 
CTCCTCGAGT ACGCCGACGA ACGCGTCCGG ATGGCTCGCG AGGAGACCAT CGATGTCCCG 
CTTGAACGGG CCTACCGTGA CCGAACCATC GTCATTCTGC TCGCGGAACT CGGCCTCCGT 
GGGGCCGAAC TCTTTCGCGA CAGAAACGAC GATGCACGGA AAGGCCTCCG GTGGGATGAC 
GTCGACCTCG AGCGCGGCCG GATCGAAGTG TACGGCAAGT CACGCGAGTA CGAACCTGTT 
GGACTGACCG AGGCCGCACA CGACGCCCTG TCGCGGTTCG AGCGCGTTCA AGACCCACCG 
ACCGACGAGT GGCCGTTGTT CCCGACGGAT CACGCTGCGA GCAAGTACAA AGCAGTCGAG 
AACGCCACGG GCGATCGGCC GGAACCAGGT AGCGATATTG ATTCAATTCT TCGCGAGCGG 
GAGATCATCC CACCGTCGAT CACCAAGGAG GCCGGTCGGC AGATTCTCAA GCAGCTCACC 
GACGAGGCTG GTATCGAGGT CGATGGCGAC ACGAACTATC TGCAACCTCA CGGTGCGAGA 
CGGGCGCTCG GTGCTGAACT GTACGAAAAA GGCCACTCCG AGTTAGCACA AAAGGCGCTC 
CGACACGAAT CGATCGAAAC CACACATAAG GCGTATTCGG ACATCCAGGC TGAGAACGTA 
GCTGACTCGA TTGATGAGGT ACGGGATTGA

Protein sequence

MSREKATSRD RNPKGKTVEE TVNRYLEKKL EAGGSRATMK PVLDDFADFC KSEGIEYVGQ 
IDSGDCREYG LRLKTKKANG EIAGSTANTY FAYVRAFLSF CVRDELLDTN PAQTERAEEF 
LPEDKSTGET QFWEPEQRKR LLEYADERVR MAREETIDVP LERAYRDRTI VILLAELGLR 
GAELFRDRND DARKGLRWDD VDLERGRIEV YGKSREYEPV GLTEAAHDAL SRFERVQDPP 
TDEWPLFPTD HAASKYKAVE NATGDRPEPG SDIDSILRER EIIPPSITKE AGRQILKQLT 
DEAGIEVDGD TNYLQPHGAR RALGAELYEK GHSELAQKAL RHESIETTHK AYSDIQAENV 
ADSIDEVRD