Gene Hmuk_0316 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_0316
Symbol
ID	8409814
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	-
Start bp	304614
End bp	306014
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	72%
IMG OID	645018641
Product	LVIVD repeat protein
Protein accession	YP_003176160
Protein GI	257386387
COG category	[S] Function unknown
COG ID	[COG5276] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCGCC GCCCCCTCCT TCGAACGCTC GGCAGCGGTC TCGCGCTCGG GAGCGCCGGC 
CTCGCGAGCG GGCACCCGAC TGCCACCAGC GACGGGACGC CGCCCGCCGA GACGCCGGAC 
AGCCAGCCCC TCGGGACGGT CTCGATCGAG AACGTCCGCG AGATGGTCCT GAATCCCGAC 
GGGACGGTCG CCTACGTCGC CACCGTCGAC GGCTTCGCGG TCGTCGACGT GAGCGATCCG 
ACCGAGATGC GGGTGCTGGC TCGCGAGCGG CTCCTGGCCG ACCACGCCGA CGGGCCGCTG 
TCTGGGATCT GGGACCTGCA CTGTGACGGC GACCGACTGC TCGTGGCCGG CCCGGCAAAC 
GGTGGGCGCG ACTCGGTCCG TGGCTTTGGC TACGTCGACG TGTCCGATCC CGCCGATCCC 
GAACTTCTCG CCGAACACGA GGTCGACTTC TACACCCACA ACTGCGTGCT CGCGGACGGC 
GTCGGCTACT TCACCGGCGG CGGTCTGGAC GGCTCGCCCC TGGTCGTCGC CGATCCCGAG 
AGTGGCACGG AACTGGCCCG CTGGAGCGTC GTCGACGTCG ACGACCGCTG GGCCGAGCTG 
CCCTTCGGCA TGGTGAACCT CCACGACGTG TGGGTCCACG ACGACCGCGC GTATCTGGCC 
TACTGGGACG CCGGCACCTG GTGTCTCGAC GTGTCCGACC CCGGCGAGCC GACGCTCGTT 
TCGCGGGTGC GCGGTCGGCC ACTCGACGAG CTCCTCGATG TTACCAACAG GCGACGCGAG 
CGCACGGAGC CGCCGGGCAA CGACCACTTC GTCACCGTCG ACGAGACCGG CGATCTGCTG 
GGGATCGGGA CCGAATCGTG GGCGGCGGCC TCGGGCTCGA CCGGCCCGGG CGGGATCGCC 
TTCTACGACG TGACCGACCC CGCCGAACCG ACGCGACTCG GGGCGATCGA CCCGCCGCCG 
ACGCCCGATC CCACCCGCGG CGGCGTCTGG ACGACCGCCC ACAACTTCGA GCTCGTCGAC 
GGGCGCTGTT ACGCCGCCTG GTACCAGGGC GGGGTCACCG TCCACGACGT GACCGACGCG 
ACGGATCCCG TCGAGCGGTT CCACTGGCGC GACGCCGGCC GCGGGAAGTT CTGGACCGCA 
CAGCTTGCCG CGCCGGGCGA GTTCTTCCTG GGGGCCAGCA TCGGCGCGTT CGGTGTCAAC 
ACCGCCGCCG ACTCGCCCCT GGAGTCGGCG CTGTTCGCGT TTCCGGACCA GCGGCCGGCC 
GACGGCGCGA CGACGACCGA CGGCACCCGG TCGGGACGGG CGTCGACGCC CACCAGCGAG 
ACGGGAGCCG GCGCTGGTGT CGGCGCGGGT CTGCTCGGAC TGCTCGGTGC CGGCGCGTGG 
TGTCGACGGC GTTCGGAGTG A

Protein sequence

MRRRPLLRTL GSGLALGSAG LASGHPTATS DGTPPAETPD SQPLGTVSIE NVREMVLNPD 
GTVAYVATVD GFAVVDVSDP TEMRVLARER LLADHADGPL SGIWDLHCDG DRLLVAGPAN 
GGRDSVRGFG YVDVSDPADP ELLAEHEVDF YTHNCVLADG VGYFTGGGLD GSPLVVADPE 
SGTELARWSV VDVDDRWAEL PFGMVNLHDV WVHDDRAYLA YWDAGTWCLD VSDPGEPTLV 
SRVRGRPLDE LLDVTNRRRE RTEPPGNDHF VTVDETGDLL GIGTESWAAA SGSTGPGGIA 
FYDVTDPAEP TRLGAIDPPP TPDPTRGGVW TTAHNFELVD GRCYAAWYQG GVTVHDVTDA 
TDPVERFHWR DAGRGKFWTA QLAAPGEFFL GASIGAFGVN TAADSPLESA LFAFPDQRPA 
DGATTTDGTR SGRASTPTSE TGAGAGVGAG LLGLLGAGAW CRRRSE