Gene Hmuk_3313 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_3313
Symbol
ID	8409391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013201
Strand	+
Start bp	119893
End bp	120981
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	64%
IMG OID	645018245
Product	periplasmic solute binding protein
Protein accession	YP_003175766
Protein GI	257372992
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0803] ABC-type metal ion transport system, periplasmic component/surface adhesin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGACA CACCGCAGTC TCGAACGCGG GACAGATTCT CACGCAGGAG AGCCATTACT 
GCCGGTGCAG GACTTCTCGC CACCGGCCTC GCCGGATGCA CGAACAGCGT CGGTAGCAGC 
GATACCACGC CCGCGAGCGA CGCGGGCGGC GCGAACGGAG ACGGCCCCAC TGTCGCAGTC 
GCCTCCTTTT TCAGCTTCTA CGACTTCGCA CGGAACGTCG TCGACGGGAC ACCGCTTCGA 
GTGAAAAACC TCGTCCCGAC CGGACTGCAC GGTCACGGGT GGGAGCCGAA TGCGAGCGTC 
ACGAAAGAGA TCGTCGAAGC CGACGCGTTT CTCCACGTCG GTCCGGGGTT CCAGCCGTGG 
GCCGACCGCG CGATTCAGAC GCTCGAAGAC GACGCCGTCG ACACACAGTT GATCAACGCC 
CGTGAGGGCG TCGAAATGGT CGATCTCGCC GCGACGCTGG ACCCCGAGGA AGAGGGGGTC 
GGAAAGCAGC AAGGGAAGGA CCCACACTTC TGGCTCGATC CCGACCGCGC GAAGAAATCG 
GTAGACAACA TCGCCGACGG GCTCGCGAAA CTCGCGCCCG ACCAAGCCAA CACTCTCCGA 
ACGAACGCCG AGACGTACAA ATCCGACACC CTCGAACGGA TCGACCGGGA CTACCGGGCC 
ATCTTCGATG CCGCCGACCG AAACGTCGTG CAGCTCGCGG CGCACAACGC CTTCCAGTAC 
ATCGGCGTCA AATACGACGC CGAGATGGTC CCCCTCGTTA CGAACCTCGC AGCCAGCGGT 
GACGTCAAGC CCTCGGACAT CACCGAGGCG AAGGCGGTCA TCGAGCGAAA CGACATCGAC 
TACATCGCAA ACGGCGTCTT CGAGTCACGG AAGCCGGCGA AGCAACTGCT CGACGAAACG 
CGAGTCGCCG GCTATCTCCC CGTCACCCCC TACGCGGGGG TCCGGGAAGA CTGGGTCGAG 
AACGACTGGG GCTACGAGGA GATCGCCTAC AACATCAACA TGCCCACGTT CGAGGTCGTC 
CTCGGCAACA AACGACCCGA GGAAGCCGGA CCCGACGGCT GGGCCGACGA GTGGCTGAAC 
TTCGAGTGA

Protein sequence

MDDTPQSRTR DRFSRRRAIT AGAGLLATGL AGCTNSVGSS DTTPASDAGG ANGDGPTVAV 
ASFFSFYDFA RNVVDGTPLR VKNLVPTGLH GHGWEPNASV TKEIVEADAF LHVGPGFQPW 
ADRAIQTLED DAVDTQLINA REGVEMVDLA ATLDPEEEGV GKQQGKDPHF WLDPDRAKKS 
VDNIADGLAK LAPDQANTLR TNAETYKSDT LERIDRDYRA IFDAADRNVV QLAAHNAFQY 
IGVKYDAEMV PLVTNLAASG DVKPSDITEA KAVIERNDID YIANGVFESR KPAKQLLDET 
RVAGYLPVTP YAGVREDWVE NDWGYEEIAY NINMPTFEVV LGNKRPEEAG PDGWADEWLN 
FE