Gene Cmaq_1390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_1390
Symbol
ID	5709424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	+
Start bp	1467048
End bp	1468328
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	44%
IMG OID	641275901
Product	Fmu (Sun) domain-containing protein
Protein accession	YP_001541206
Protein GI	159041954
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0144] tRNA and rRNA cytosine-C5-methylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.122511
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTGAGT TTAACCTAGG GGCAGACTTC GTGGACTTCG CCGCTGACGT AATGTACATT 
ATTGAGGATA GGTTAGTGTC AATGGATAAG GCATTCCACT ACGCCAGGCT TAGGCATAGG 
TTGAAGGCAC CGCTTAGGGT TTACTATAAT GCGGTTAGTG ATGTTGTTAG GAATTACGCC 
TACTTATCCT TCATGGCTAA GCAACTGTTG GGTTCAAGCT CAAGGAAGGC TATAGCCAAG 
ACCTGGCTAC TCCTAAACAC TAATGACCAC TACTCCAGGA GGCTTAGGAA GAGGGTGAGG 
GGTAGGGTTG AGGGCGCTGA GGCTAGGTTA AGTGAGGTTA AGGATAATGA CCCGTTAACG 
TACCTATCCA TTAAGTACTC CTTCCCAAGA TTCATAGTGG AGGAGTTGAG TAGGGGAATG 
GGGCTTAGTG AACTTGAGGA TTACTTATCA TCACTCAACA GGAGGGTTAC TTGGCTTAGG 
GTTAATACGC TTAAGGTGGA TTTAGATAAG GCCATTAGGC TCCTTGAGGA TGAGGGGGTT 
GAATTCACTC AAAGTAGACT ATACCCATTC ATGCTACTGG TTAAGGGTTA TAGGAGGCCA 
ATGGGTTACT TAAGGCTATT TAAGGATGGG GCTGTGGTTC CCCAGGACTT GGCGTCGGCA 
TTAGTGGTAC TCAACCTAAT GCCTGAACCC GGGGACGTGA TTATTGATGC CTGCGCCGCC 
CCAGGTATGA AGACTAGTCT AATAATGCAG TTAACTGATA ATAAGGCTGA GGTCATTGCT 
ATTGATGTTT CTAAGAATAG GTTGAGTAAA ATGAGGTCAA TATTAAGGAG AATGGGTGTT 
GATGACTCAA GGGTGCATAT AATGCGTTCA GACTCAAGTA GATTAAGGTT AACTGGGGTT 
AATGTTAATA AGGTGCTTAT TGATGCACCA TGCACCTCAA GCGGGGCAGT CTCAAAGGAT 
CCGGGAATTA AACTAATACT AGCCAGTAAT CCAGGCTTGG TTAAGCGTCA ATCACTGGTG 
CAGTCATCAA TACTACTTAA CTTAATTAAC CAGCTTAAGG ATGCATCAAT AGTATATGCT 
ACCTGCTCAA TACTACCTGA GGAGGGTGAG GAGGTTATTG AGAGAATTAA CTCATCAAGT 
AGTGTTAGTT TAGTTAAGCC CAGTGTGGGT GATTTAAGTA ACGGTTACGT GAATTACCCT 
GTATCAAGCG TTGTGGGTAG GGTAATGCCC CATATTCATA ATGCTGAAGG CTTCTTCATA 
TCAAAGCTCA CCATTAACTA G

Protein sequence

MVEFNLGADF VDFAADVMYI IEDRLVSMDK AFHYARLRHR LKAPLRVYYN AVSDVVRNYA 
YLSFMAKQLL GSSSRKAIAK TWLLLNTNDH YSRRLRKRVR GRVEGAEARL SEVKDNDPLT 
YLSIKYSFPR FIVEELSRGM GLSELEDYLS SLNRRVTWLR VNTLKVDLDK AIRLLEDEGV 
EFTQSRLYPF MLLVKGYRRP MGYLRLFKDG AVVPQDLASA LVVLNLMPEP GDVIIDACAA 
PGMKTSLIMQ LTDNKAEVIA IDVSKNRLSK MRSILRRMGV DDSRVHIMRS DSSRLRLTGV 
NVNKVLIDAP CTSSGAVSKD PGIKLILASN PGLVKRQSLV QSSILLNLIN QLKDASIVYA 
TCSILPEEGE EVIERINSSS SVSLVKPSVG DLSNGYVNYP VSSVVGRVMP HIHNAEGFFI 
SKLTIN