Gene Hmuk_3395 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_3395
Symbol
ID	8409473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013201
Strand	+
Start bp	198486
End bp	199631
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	66%
IMG OID	645018317
Product	extracellular solute-binding protein family 1
Protein accession	YP_003175838
Protein GI	257373064
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1840] ABC-type Fe3+ transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.441617
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAGATC ACACACGACG CGGGTTCCTG ACCGTGGCGG GCTCGGCGAC GGCCGCCACG 
GTCGCAGGGT GTAGCGGCAC CGAAGCCATC GGCGGCGGTG GCGGCGAGAC CTACGAGGTC 
GGCCACGGGG ACTACCAGAC GACCGTCAGC GAGAGCGACT TCCCCTCGGA CAGACTCTAC 
ATCTACGCCG TCCAGACGGG GTGGTCGAAC TGGGGTGCCG TCATGGACGC CTTCGACGAG 
CGGTACGGCG TCGAGCTGAA CGACGACCAG CGTACCTCCG GCGAGGCGCT CACACACATC 
CGATCGAACG CCGAGAACCC CACCCACTCG GCGTACAACG GCGGCTACTC GTTCGGTATC 
ACCGCCATGG AGGAGGGGTT CACCACGGAC TACAAGCCGG CCAACTGGGA CGCCGTTCCG 
CCGGATCTGA AGACGGACAA CGGCCACCTC ACCGCGACCC GGCAGATGAC GACGGCGGTC 
ACCTACCGCA AGGACATCTA CGAGGAGCGC GGGCTGGGCG AGCCCGAGAG CTGGGAGGAC 
TTCAAACACC CCGACGCCGC CAAGGACTTC TGTGTGACCC CGCCCCACTC GGCCAACGGG 
CTGGCGACGG CGCTGTCGAT CAACAACGCC TACGGCGGGA CGATGGACGA TCTGGGACCG 
GTCGTCGAGT ACTACGACGA CATCGCCCAG AAGGGGGCAG ACGTGCGTCG CAACATCACC 
GGCGACTTCA CCAGCGGCGA GGTCTCGGCG GTCGCTCAGT ACGACTACAC CGCCCTGGAG 
ATGAAGTACA ACCACGAGGA GGTGCCCGCG GAGAACGTCG GCGTCGCGAT CCTGCCCGGC 
CCCGAGGGCG ACGCCGGAGC GATGAACATC CCGTACGGCT ACGGCATGCT CGACGGCGCA 
CCGAATCCGG AGACGGCGAA GTTGTTCATG GACTTCGTTC TCTCACTGGA GGGCCAGCGG 
CTGTTCTTCG ACGCGTTCGT CCGCCCGATC CGGGCCGGCG AGCTGGAGAT GCCAGACGAG 
TTCCCCGACC AGACGACCTA CGAGGCGGCG GAGTTCACCG TCGACCAACT GGATCTCGTC 
GAGCGACAGG AGTCCATCAT CGATCAGGTG ACCTCGGAGT CGGACATTCC CGGCATCCAG 
GGGTAA

Protein sequence

MTDHTRRGFL TVAGSATAAT VAGCSGTEAI GGGGGETYEV GHGDYQTTVS ESDFPSDRLY 
IYAVQTGWSN WGAVMDAFDE RYGVELNDDQ RTSGEALTHI RSNAENPTHS AYNGGYSFGI 
TAMEEGFTTD YKPANWDAVP PDLKTDNGHL TATRQMTTAV TYRKDIYEER GLGEPESWED 
FKHPDAAKDF CVTPPHSANG LATALSINNA YGGTMDDLGP VVEYYDDIAQ KGADVRRNIT 
GDFTSGEVSA VAQYDYTALE MKYNHEEVPA ENVGVAILPG PEGDAGAMNI PYGYGMLDGA 
PNPETAKLFM DFVLSLEGQR LFFDAFVRPI RAGELEMPDE FPDQTTYEAA EFTVDQLDLV 
ERQESIIDQV TSESDIPGIQ G