Gene Hmuk_2435 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2435
Symbol
ID	8411979
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	2337670
End bp	2338713
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	68%
IMG OID	645020778
Product	halocyanin domain protein
Protein accession	YP_003178252
Protein GI	257388479
COG category	[C] Energy production and conversion
COG ID	[COG3794] Plastocyanin
TIGRFAM ID	[TIGR02656] plastocyanin [TIGR03102] halocyanin domain

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.000875368
Fosmid Hitchhiker	No
Fosmid clonability	decreased coverage

Sequence

Gene sequence

ATGACCGACG CCGACGTGAC TCGCCGACGC CTGCTACAGG GCGCGGCCGG GCTCACCGTC 
GCGGCCGCCG CCCGTCCCGC GGTCGCGCAG TCCGACGGGC CTGACTTCGG GGGCTGGTTC 
GACAACGTGG GCAACTACGA CGGCGTGGTC GACGAGACTG GCAGCGACGA AGTGACGATC 
TCCGTCGGTG CAGACGCTAA CGGCGGTGCC TTCGGATTCG ATCCGGCAGC CGTCGAGGTG 
TCGCCGGGAA CGACGGTCGT CTGGGAGTGG ACCGGTAGCG GCGGCTCGCA CAACGTCGTC 
GCGGAAGACG GTACGTTCGA GAGCGAACTC ACCAAGGAGA GCGGCCACAC CTTCGAGTAC 
ACGTTCGAGG AAACGGGCAC CTACGAGTAC GCCTGTACGC CCCATCGCTC GATGGGGATG 
AAGGGTGCCG TCGTGGTCAG CGAGGGCGGC GGCTCTGGGA CCGAGACGGC CCAGAGCGAG 
GAGAGCGGCG GATCGGATCC GGACTTCGGG AGCTGGTTCG ACAACGTGGG CAACTACGAC 
GGCGTGGTCG ACGAGACCGG CAGCGACGAA GTGACGGTCT CCGTCGGTGC AGACGCTAAC 
GGCGGTGCCT TCGGATTCGA TCCGGCGGCC GTCGAGGTGT CGCCGGGGAC GACGGTCGTC 
TGGGAGTGGA CCGGTAGCGG CGGCTCGCAC AACGTCGTCG CGGAAGACGG TACGTTTGAA 
AGCGAACTCA CGAAAGAGAG CGGTTTCACG TTCGAGTACA CGTTCGAGGA AGCGGGCACC 
TACGAGTACG CCTGTACGCC CCACCGCTCG ATGGGGATGA AGGGTGCCGT CGTCGTCTCG 
GAGGCCGGTT CCGGTGCCAG CGGCGACGGA GGCGGTGGCG AAAGCGGCGG TAACTCGGGT 
GGCGATCCGT TCTCACCGGG TGCCAGCGCG CTCGGCATCT CACTGCTGAT CGCGTTCCTC 
TCCCCGCTCG GACTGGCCGC GTTCCTCCGA CGACGGGGAG CGGACGAGCC GGGCTCCGGC 
GGTCGCCCAC GCTCTGGCGA CTGA

Protein sequence

MTDADVTRRR LLQGAAGLTV AAAARPAVAQ SDGPDFGGWF DNVGNYDGVV DETGSDEVTI 
SVGADANGGA FGFDPAAVEV SPGTTVVWEW TGSGGSHNVV AEDGTFESEL TKESGHTFEY 
TFEETGTYEY ACTPHRSMGM KGAVVVSEGG GSGTETAQSE ESGGSDPDFG SWFDNVGNYD 
GVVDETGSDE VTVSVGADAN GGAFGFDPAA VEVSPGTTVV WEWTGSGGSH NVVAEDGTFE 
SELTKESGFT FEYTFEEAGT YEYACTPHRS MGMKGAVVVS EAGSGASGDG GGGESGGNSG 
GDPFSPGASA LGISLLIAFL SPLGLAAFLR RRGADEPGSG GRPRSGD