Gene Huta_2022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_2022
Symbol
ID	8384316
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	+
Start bp	2041717
End bp	2042655
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	66%
IMG OID	644973092
Product	protein of unknown function DUF6 transmembrane
Protein accession	YP_003130923
Protein GI	257053090
COG category	[E] Amino acid transport and metabolism [G] Carbohydrate transport and metabolism [R] General function prediction only
COG ID	[COG0697] Permeases of the drug/metabolite transporter (DMT) superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCCCCAGG ATCGAACGCC GACTGTGCGC TATCGAAACG CCACCGCGTT TCTTGCTCTC 
GGCGCGATCT GGGGGAGCGC GTTCGTCGCG ATCAAGGCCG GCCTGTCGGC GTTCCCGCCG 
GTTCTGTTCG CCGCACTCCG CTACGATGTC GCCGGCGTCA TCGTGCTAGG CTACGCCGCG 
GTCGTCACTG ACCCGCTGCC CGAGAGCCGT CGCGACCTGG CGGCGATCAT CGTCGGGTCG 
ACTCTCCTCA TCGCGGGATA TCACGCCCTG CTGTTCGTCG GCGAACTCGA AACCACGAGC 
GCGACCGCAG CGGTCATCGT GAGTCTCTCG CCGGTACTGA CGGCCGGGTT CGCCCGGCTT 
GCCCTCCCGG GGGACCGTCT TTCGGTTGCC GGCGTCGCCG GACTCGCCCT GGGGTTCGCT 
GGCGTCGTCG TCATCGCCCA GCCTGATCCC GCTCGACTCC TCTCCAGTGA CGTCATCGGG 
CCGCTGCTCG TCTTTGGCGC TGCGTGCGCC TTTGCCCTGG GAAGTGTGCT CACCCGCTGG 
CTCGACGCTG AACTGTCGAT CGAAGCCATG GAAGGGTGGT CGATGGTCGG CGGAGCCGTG 
CTGATGCACG TCCTCAGTCT CGCGCTCGGG GAGTCACCGG CCGCAGTCGA GTGGACGCCG 
ACTGCCCTGC TTTCGCTCGG CTATCTCTCG CTGGTCGCGA GTGCGCTGGG CTTTCTTCTC 
TATTTCGCCC TGCTGGATCG ACTCGGCCCG GTCGAGATCA ACCTCGTCTC CTACGTTGCG 
CCCGTCTTCG CCGCGCTGAC TGGCTTTCTC CTGCTGGGGG AACGCATCGA CGTCGCGACG 
GCTTCCGGGT TCGTCGTCAT TCTGGTTGGA TTTGTCCTGC TAAAACGGGA TGCGATCCGT 
GAGACGTATG TCGGTTGGCT GGCGGAAGCG CAACCGTAG

Protein sequence

MPQDRTPTVR YRNATAFLAL GAIWGSAFVA IKAGLSAFPP VLFAALRYDV AGVIVLGYAA 
VVTDPLPESR RDLAAIIVGS TLLIAGYHAL LFVGELETTS ATAAVIVSLS PVLTAGFARL 
ALPGDRLSVA GVAGLALGFA GVVVIAQPDP ARLLSSDVIG PLLVFGAACA FALGSVLTRW 
LDAELSIEAM EGWSMVGGAV LMHVLSLALG ESPAAVEWTP TALLSLGYLS LVASALGFLL 
YFALLDRLGP VEINLVSYVA PVFAALTGFL LLGERIDVAT ASGFVVILVG FVLLKRDAIR 
ETYVGWLAEA QP