Gene Huta_2114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Huta_2114
Symbol
ID	8384408
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halorhabdus utahensis DSM 12940
Kingdom	Archaea
Replicon accession	NC_013158
Strand	-
Start bp	2151197
End bp	2152327
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	64%
IMG OID	644973183
Product	oligopeptide/dipeptide ABC transporter, ATPase subunit
Protein accession	YP_003131014
Protein GI	257053181
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4608] ABC-type oligopeptide transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGAAA CTGAATCAGA CGAACCACTG CTCTCGATGG AGGACGTCGA GGTACACTTC 
AAACCCGGCG GCGTTATCGA GAAAGCGCTC TCCGAGGAGA TCGTTCGGGC CGTCGACGGA 
ATCTCCCTCG AAGTCGAGGA GGAGGACATC GTCGCACTGG TCGGCGAGAG CGGGTGTGGC 
AAAACCACGC TCGGGAAGGC CGCGATCGGC CTCCAGCGAC CGACCGGCGG TTCGATCAAG 
TACCGTGGCC AGAACATCTG GAAGGCGAAG GACCGCTCGA GCGACGCCAA GATCTCGAAG 
GACGAGATCC AGCAGGCGTT GCAGATCATC CACCAGGACC CGGGGAGTGC GCTCAACTCT 
TCCCGGCGCG TTCGGGCGAC CCTGGCTGAC CCACTCAAGC GGTGGCGCAA GGAACTCGGC 
CCCGACGAGC GCCTCGAGAC GATCTATCAC TTCCTCGAGT ACGTCGGGAT GACGCCGGTC 
GAGGACTACG CCGAGCGGTT CCCCCACCAG CTCTCGGGCG GCGAACAACA GCGGGTCGTC 
CTCGGGCGGG CGCTGTTGAC GAATCCCGAC CTCGTGCTCG CGGACGAGGC GGTGTCGGCG 
CTGGACGTCT CCCTGCGCGT CGAGATGATG GACCTGCTGC TCGAACTCCA GGACATGTTC 
GGGACCTCGT TCGTGTTCGT CTCCCACGAC CTGGCGAACG CCCGCTATCT CACGAAGAAG 
TCCGACGGCC GCATCGCCGT GATGTACCTC GGCGACATCG TCGAAATCGG TGATCCCGAC 
GAGCTCATCG AGAACCCGAC CCACCCCTAC ACGAAGGTGC TGCGGTGGTC GACGCCGCCG 
GCCGACCCGG ACGTGGCCAG CGAGACCATG CACATGCAGC CGCCGGTCCG CCGGATCGAC 
ATCCCCGACC CCGCAGATCC GCCGGAAGGC TGTAAGTTCC ACACCCGGTG TGAGCACGCT 
CGCGAGGTGT GTAAACAAGA GGACCCGGAC CTCTACGACG CCGATGGCAC CGATGCGAAG 
TGCTTCCGGG CGCTGGACAA CCACGAGTAC TGGCACAGTG AGGAACTCAC GGATCGCGAG 
GAACTCGGCT TCACCTCAAG CCTGGACGAG GAAGAGCCGG CGGACGACTG A

Protein sequence

MSETESDEPL LSMEDVEVHF KPGGVIEKAL SEEIVRAVDG ISLEVEEEDI VALVGESGCG 
KTTLGKAAIG LQRPTGGSIK YRGQNIWKAK DRSSDAKISK DEIQQALQII HQDPGSALNS 
SRRVRATLAD PLKRWRKELG PDERLETIYH FLEYVGMTPV EDYAERFPHQ LSGGEQQRVV 
LGRALLTNPD LVLADEAVSA LDVSLRVEMM DLLLELQDMF GTSFVFVSHD LANARYLTKK 
SDGRIAVMYL GDIVEIGDPD ELIENPTHPY TKVLRWSTPP ADPDVASETM HMQPPVRRID 
IPDPADPPEG CKFHTRCEHA REVCKQEDPD LYDADGTDAK CFRALDNHEY WHSEELTDRE 
ELGFTSSLDE EEPADD