Gene Hmuk_2235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Hmuk_2235
Symbol
ID	8411775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Halomicrobium mukohataei DSM 12286
Kingdom	Archaea
Replicon accession	NC_013202
Strand	+
Start bp	2153665
End bp	2155116
Gene Length	1452 bp
Protein Length	483 aa
Translation table	11
GC content	68%
IMG OID	645020578
Product	cryptochrome, DASH family
Protein accession	YP_003178055
Protein GI	257388282
COG category	[L] Replication, recombination and repair
COG ID	[COG0415] Deoxyribodipyrimidine photolyase
TIGRFAM ID	[TIGR02765] cryptochrome, DASH family

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.14399
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.570848
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTACCG TTCTCGTCTG GTTCCGCCGC GATCTGCGCT GTCACGACAA CGCGACGTTG 
CGACGCGCCG TCGCCGAGGC CGACACCGTC GTGCCGCTGT ACTGTCTCCC GGATCGACTG 
ACCGGCGAGG GGATGTTCGG GCTCGACAGG GTCGGTCCCC ATCGGGCGCA GTTCCTGATC 
GAGAGCCTCG CGGACCTGCG CGAGTCGTTG CGGGACCGGG ACGGCGAACT GTACGTTCGC 
AGCGGCGACC CCGGGACGGT CGTCCCCGAG GCCGCTGAGG AGTTCGACGC CGACGCGGTC 
TACTGGCAGG CGCTCCCGGG TCCCGAAGAG CGGGACGAAG CTGGCAGCGT TCGGGCGGGG 
CTGGCCGACG CCGGGATCGA CTCCGAGACG TTCTGGACGC ACACGCTGTA CCACCGCGAC 
GACCTCCCCA GACCGCCCGA CGAGATCGAG GACACCTTCA CGCCGTGGAA GGACCGAACC 
GAAGCGAAGG CGACCGTCCG ACCGCCCAAA CCGGCCCCGG AGTGGGTCCA CGCCCCCAAC 
GGCGGCCGGC GCGCCAGCAG CGGTGCCGAC GATCTCCCCA CGCTCGCGGA CTTCGGCTTC 
GGCGAGGACG AGGCGACGGT CGACGACCGC GGCGTCCTCG ACTGGACCGG CGGCGAGACG 
GCGGGGCTGG ATCGCGTCGC GACGTACGTC TGGGAGCGTG ACTGCCTGCG GGAGTACCGC 
GAGACGCGCA ACGGCCTCGT GGGTGCCGAC TACTCCTCGA AGTTCTCGCC GTGGCTCTCC 
TTTGGCTGTC TCTCGCCGCG TCAGATCCAC CGCGAGGTCG AGCAGTACGA GACCGATCGG 
GTGGAAAACG ACTCGACGTA CTGGCTCGTC TTCGAGCTGA CCTGGCGGGA CTTCTTCCAG 
TACCAGCTCG CGAAGTACGG CGCGAAGTGG TTCCAGCCCG GCGGCATCCG CGACCGGGAC 
GACATTCGGT GGCGGCGCGA CCGTGCGCAG TTCGAACGCT GGGCGCGTGG CGAGACGGGG 
ATCCCCTTCG TCGACGCCAA CATGCGCGAG CTGAACGCGA CGGGATACGT GAGCAATCGC 
GGCCGCCAGA ACGTCGCCTC GTTTCTCTCG AACAACCTCC GGATCGACTG GCGGCTCGGG 
GCGGCATACT TCGAGTCGCG GCTGGTCGAC TACGACGTGG CCTCGAACTG GTGTAACTGG 
GCGTACCAGT CACAGGTCGG CAACGACTCG CGAGACAGCT ACTTCGAGAT CGTCGGCCAG 
GCGACACACT ACGATCCCGA GGGGGCGTAC GTCACTCGCT GGTGTCCGGA ACTGTCGGCA 
CTTCCGCCGG AGTACGTCCA CGAGCCCTGG ACGATGAGCG AGCACGAGCA GGCCGACTAC 
GGCGTCGAGC TGGGGACCGA CTACCCCGCG CCGATGATCG ACCTCGAAGC GTCCTACGAG 
AAGCTACGCT GA

Protein sequence

MSTVLVWFRR DLRCHDNATL RRAVAEADTV VPLYCLPDRL TGEGMFGLDR VGPHRAQFLI 
ESLADLRESL RDRDGELYVR SGDPGTVVPE AAEEFDADAV YWQALPGPEE RDEAGSVRAG 
LADAGIDSET FWTHTLYHRD DLPRPPDEIE DTFTPWKDRT EAKATVRPPK PAPEWVHAPN 
GGRRASSGAD DLPTLADFGF GEDEATVDDR GVLDWTGGET AGLDRVATYV WERDCLREYR 
ETRNGLVGAD YSSKFSPWLS FGCLSPRQIH REVEQYETDR VENDSTYWLV FELTWRDFFQ 
YQLAKYGAKW FQPGGIRDRD DIRWRRDRAQ FERWARGETG IPFVDANMRE LNATGYVSNR 
GRQNVASFLS NNLRIDWRLG AAYFESRLVD YDVASNWCNW AYQSQVGNDS RDSYFEIVGQ 
ATHYDPEGAY VTRWCPELSA LPPEYVHEPW TMSEHEQADY GVELGTDYPA PMIDLEASYE 
KLR