Gene Huta_1790 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_1790
Symbol
ID	8384077
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	+
Start bp	1796164
End bp	1797435
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	69%
IMG OID	644972857
Product	domain of unknown function DUF1743
Protein accession	YP_003130695
Protein GI	257052862
COG category	[R] General function prediction only
COG ID	[COG1571] Predicted DNA-binding protein containing a Zn-ribbon domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGACAGTCA TCGGCATCGA CGACACGGAC TCCCGGACGG CGGGCATGTG TACGACCTAC 
CTCGCCGCCC GGATCGCCGA CCGGCTGGCG GCGACGGATG ACTGGGTCGT CGACCGGCGG 
CTGCTCGTCC GACTGAACCC TGCCGTCGAG TACAAAACCC GGGGCAACGC CGCGCTGGCG 
ATCCACACCG ACGCCCCCGT CGATGCCGTC CGAGAAATCG TCAGCGAGGA GCTCCCGATC 
GCCGAGACTG ACGATCCACG CACGAACCCG GGCGTTGTCC TCGCGAGTGA GTCGGCGGCT 
GAGATCCCGG AAGCCGTTGG CGACTTCGCT CGCGATGCCG TCCGGGATTT CCACGACGTC 
GCCGACGCCC GCGCCCTGAT CGACCGGCTT GAGTACGACA CCCTGGAGGC GGGCAACGGT 
CGCGGGTTGA TCGGCGCGCT CGCGGCGCTC GGGGCCTGGC GGGCGTTCGA GGACTGGACG 
TACGAGTACA TCTCCTATCG CGAGCCACCG CGCCGCGGGA CCCCTCGCGA GGTCGGCCCC 
GAGTCTGTCT TCCGGGCCGC CGATGCCGGC TACCCGGACG CTTGGGACAC TGTCGATCAC 
GTCGAAGACG AACTTGTCTG CGTTCCCCAC GCGCCGGGGC CGATCCTCCA CGGTATCCGC 
GGCGACGACC CCGATGTCGT CAGAGGAGTC GCTGCCGACA TCGAGAGCGA ACCGATCGAA 
CGAACCGCCC TGTTCGTCAC CAACCAGGGG ACTGACGCCC ACCTACGGCA GGGGACGATC 
GGGACACTCC GGGACGGCCG GGCCTACCGG GTGACCGGCG TCGTCGACGC CTCGCCCGAA 
ACCCGCGAAG GCGGCCACGT CTTTCTCACC ATCGAGGGAG ACGATGGCCA TGCGTTGCCC 
TGTGCCGCGT TCGAGCCGAC CAAGCGCTTC CGCGACCGCG TTCGTTCGCT CCGGGTGGGT 
GATCGCGTCA CCGTCTGTGG CGAGGTCAGC GATGGCACGC TCAAACTCGA GAAGTTCGCC 
GTCCGGGATC TCGTTCGGAC CGAGCGTGTC ACGCCGACCT GTCCGGCCTG CGGTCGGACG 
ATGGAAAGCG CCGGACGGGG CCAGGGGTAT CGCTGCCGGG ACTGTTCGAC GGCTGTCGAC 
GGGAAAGCCG AGCGGGAGAT CGACCGCGAT CTAGAGGTAG GGTGGTACGA GGTCCCGCCG 
TGTGCCCGCC GACACATCGC CAAACCGCTC GTGCGGGGCG GATTCGACGC GCCGGTCCAC 
CCCGAGCGGT GA

Protein sequence

MTVIGIDDTD SRTAGMCTTY LAARIADRLA ATDDWVVDRR LLVRLNPAVE YKTRGNAALA 
IHTDAPVDAV REIVSEELPI AETDDPRTNP GVVLASESAA EIPEAVGDFA RDAVRDFHDV 
ADARALIDRL EYDTLEAGNG RGLIGALAAL GAWRAFEDWT YEYISYREPP RRGTPREVGP 
ESVFRAADAG YPDAWDTVDH VEDELVCVPH APGPILHGIR GDDPDVVRGV AADIESEPIE 
RTALFVTNQG TDAHLRQGTI GTLRDGRAYR VTGVVDASPE TREGGHVFLT IEGDDGHALP 
CAAFEPTKRF RDRVRSLRVG DRVTVCGEVS DGTLKLEKFA VRDLVRTERV TPTCPACGRT 
MESAGRGQGY RCRDCSTAVD GKAEREIDRD LEVGWYEVPP CARRHIAKPL VRGGFDAPVH 
PER