Gene Huta_2202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_2202
Symbol
ID	8384496
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	-
Start bp	2254862
End bp	2256115
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	58%
IMG OID	644973271
Product	transposase, IS605 OrfB family
Protein accession	YP_003131102
Protein GI	257053269
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAACTACA ACTACAGGTA TCGGCTCTAT CCGACGGACG ACCAACGGGA GGCGTTAGCG 
TGGACGCTCG ATACCTGTAG ACAGGTCTAC AACCACTTCC TGAACCGGCT CAACGAAGCC 
GACGACGTGC CTTCGGAATA CGCCCAAAAG AACACACTCC CTGACCTGAA ACGCGAATGG 
TCCGACCTGA AGCAGATCCA TTCGAAGGTG CTTCAGGTCG TCGTAGAACG GCTCTACAAC 
AACCTTCGTA CACTCTCAGG GCAAAAGGAG AACGGGTACA ACGTCGGTGC GCTTCGTTGG 
AAGGGCGCGG GGTGGTACAA GTCGTTCACC TACAGCCAAA GCGGGTTCAA GCTCATTGGA 
ACCGACACCC GACGGGATCG GCTTCGACTG AGCAAGATCG GTGAGATACC AATCGCGTAC 
CACCGCGAGA TTCCCGAGAA CGCGACCATC AAGCAGGTCT GCATCAAACG GAACGCTTCG 
GGGAAATGGT ACGCGACGTT CGGCATTGAG ATCGACGAAC AACCCGAAAA ACCCGCCCCC 
GAAACCATCG ACCCCGAAGA TGCTGTCGGT ATCGACGTGG GTATCCTGAA GTACGCTCAC 
GACACCGACG GGACCGCCGT GGAATCGTTG GACCTCTCGG ACGAACGTGA GCGCCTACGA 
CGAGAACAGC GGAAGCTCTC GCGAAAAGAG AAGAGGTCGA ACAACTACGA AAAACAACGG 
ATGGTCGTCG CCCGCTGGCA CGACCAGATT GCGAACAAAC GCCGCGACTT CCTGCACAAG 
CTCGCCCACT ACTACGTCGA GACCTACGAC GTGGTGGCCG TCGAGGACCT GAACGTTCGC 
GGCATGATGG AGCAAGACCG AAACAGTCGA AACACAGCAC ATTCCGCGTG GCGAACCTTC 
ATCGAGATAC TGCGATACAA GGCTGAGAGC GCCGGTACGC ACCTCGTTGA AGTCAACCCA 
CGTGGAACTA CCAAGGAGTG TAGCAACTGT GGCGTTGAAA CCGAGAAACC CCTGTGGGTG 
CGCGAGCACT CATGTCCGTC GTGCGGATAC GAAGACGATA GGGACGCCAA CGCCGCGAAG 
AACATCCTTC AGCGTGCTTT TTCTGAATTA GGCATGGGAC AGGCCGAATC CGCGCCCCTG 
GAGACTGCGA CCGCTACGGA TACCCGTGTG GTATCTGCAA GTCGCGTCAT CGAACGGGGA 
AGCCCCGCCC TCAACGAGCG AGGTCGTCAG ACCGAGCGCA GTAGGACGGG GTAG

Protein sequence

MNYNYRYRLY PTDDQREALA WTLDTCRQVY NHFLNRLNEA DDVPSEYAQK NTLPDLKREW 
SDLKQIHSKV LQVVVERLYN NLRTLSGQKE NGYNVGALRW KGAGWYKSFT YSQSGFKLIG 
TDTRRDRLRL SKIGEIPIAY HREIPENATI KQVCIKRNAS GKWYATFGIE IDEQPEKPAP 
ETIDPEDAVG IDVGILKYAH DTDGTAVESL DLSDERERLR REQRKLSRKE KRSNNYEKQR 
MVVARWHDQI ANKRRDFLHK LAHYYVETYD VVAVEDLNVR GMMEQDRNSR NTAHSAWRTF 
IEILRYKAES AGTHLVEVNP RGTTKECSNC GVETEKPLWV REHSCPSCGY EDDRDANAAK 
NILQRAFSEL GMGQAESAPL ETATATDTRV VSASRVIERG SPALNERGRQ TERSRTG