Gene Cmaq_0003 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cmaq_0003
Symbol
ID	5710202
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Caldivirga maquilingensis IC-167
Kingdom	Archaea
Replicon accession	NC_009954
Strand	-
Start bp	11454
End bp	14903
Gene Length	3450 bp
Protein Length	1149 aa
Translation table	11
GC content	41%
IMG OID	641274506
Product	hypothetical protein
Protein accession	YP_001539847
Protein GI	159040595
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	41
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGC AGGTACTGGT TATAGTCACT GTAATTACAT TAGCCGTATC GCTCGTGGCG 
AGTAGTCAAT TATACTATGG TGTAGCATAT GGCTGTGGCC GCATTGTAAT AGTTGGTGAA 
TCCGGGGGTG TTGGGTTAAT TAGTGTAATG GGTAATTCAG GTCCATACAG CACTGTGGGC 
GTGCATGGCG TCTCAATACT CTACTCAGTG GCTGTGGGTG GGTGTATGGC TGTTGCCGTT 
GGTGTGAGCC AGGGCGGTGG GCCGGTTTTC ATCATCTATA ATTTAACCAA TGGTGCTTAT 
AATGTTATTA ATATTAATGG TACTGGGGCC TTATATGGTG TTGCCTACGG TGACGGTTAC 
TTCATGGCCC TTGGTTCAGT TAATAACACT GGGTTAATAG TATTAACCAC TGGGGTTGGT 
TACAGTATTA TTAAGCCAAT AGGCTTCAAA GCCCTCTACG GTGCAGCATA CGGTGACGGC 
GGGTTCCTAA TTGTCGGTGA GGGCCTTAAT GGTGCTGCAT TAGGGTTCTA TAATATGTCA 
ACTGGTTCCT TAATAAACCT GAGCAGTAAA TTACCATCAA ATTACAATTA CGTACTATAC 
TCAGCGGCGT ACGGGCCCCT TGGATTCATG GTTGTTGGTG AAGGTGTGGT TAATTCCTCC 
GGTTACCTAA TTCAAGTGCC GGTGGCTGGC ATATTCAATA TTAGTAATGG TGAATTCAAG 
GATTTAAGCA TGTACCTGAA CCAATACAGT CTACTCACCA GTGTTACTTA CATTGATTAT 
GAGTATGTTT TCGCTGGCTC AACATCAAGT GGTGATGGTG GTTACGGCTA CTACTCAATA 
TATGGTTTAA CACCACTCTA CAACACTATT CAAGGTGGGA ACCTATACCT ACCGCTAATA 
CTCTACTCAA TAACCCCAAT CTCACCTGGT GTCCTCTACG TGGTTGGTAA TGATGGTTCA 
TCATCGGTGG CCTCCCGGGA GGCAATACCA GTAATATATA ATGTAACCCT ATTAACCAAC 
ACCCGGAATG CATTAATTAA ATTAAGCGGC CCAGTCTCAT TGAGCATAAC CCCGAATTCA 
ACAATACCCC TCCCCCAAGG CCAATATACC TTACTAGCCC AGGCTGAGGG CTATTATAAC 
GTGACTGAGC GCGTTATTGT GGATTCCAAT GAGGTTATTA ACCTAATGCT GAGTAGGGTT 
AGGCTATGCA ATGTAACAGT GAGGGTTATG GTTAATGGAA CCAGTGAACC AGTGGCTAAC 
GCATCCATAA CCCTAGTTAG TAATTGGCCT AACGCCAATA AGTATGTGGC GTTGAGTAAT 
GGGTCGGGTG AAGCCTCACT AATGGTTGTG TGTAATAATT ACTCAATGAG TATTAAGGCT 
AGGTACTTCA TAGGTGAGTC GGAGAACATA AACATTAATT CATCAGTAAC ACTTGACGTT 
GACTTAACCC CAATAGTCAA CGTTACCATT AGGGCACCCA ATGAGGCTGG GGAGTATAGG 
GTAATTATGA GTGGTGTGGT TAATGATTCA ATAATACTGG GTAATGCATC ATTATTCAAC 
CTAACATTAA GTAGAGTAGG CTTAATTAGG TTATTCACAA TTAGGTTAAT CAACGGTACC 
GTTCAATACC TGGGTGAAAC CATTATTCAT CTTAAGCCTG GCTTAAACGT AATTAACATC 
ACGTGGAGAA CGCCGGTAAT CGAGGACATG GGTGTTAAGC CAATAATACC TGGTAATCAA 
AGCGTATTAA TATACCTTAA TCTAAGTAAG CCAGGTAACC TAACATTAAT CATAAGTACT 
AATGGCTTAA GAATATTCAC CTTAAATGAA ACCAACATTA CATCACTCCA ATTAGTGAGG 
AACTTCACCA ACAATGGCGC CTACACCGTA TGCGCATACA CGTGGAGTCT ATTCAATGGG 
AGCATTTACA TTGATTATGG GCCATTATGC ATAATGGTGA ATGTTGTACT TCACAGTGAG 
TTAATAGTGA TGGATGAATC AGGTTTAGCG TTAAAGCTTT CAGGCTACTA TCTCGGTAAT 
GAGACTGTTA ATGTGACATT ACCACTGGTT TTAACGTTGG GGAATGGAAC TAGACTAATA 
TACAATGGTT CAATATTCAA CGGTGAATAC ATAGCCAATA ACTCATTCTC AATAAGGTTG 
AGTAGAATGG TTAATTACCT TGATGTTCTT TGGATTAGGG AGTATTGGGT TAGGGTTAAT 
GTACTTGTGA ATGGGTTACC CATTAACTCA ACAGAGGGTT GGTTTAGGGA GGGTTATGTG 
ATAAAGTACC CTATGTTCGT GTACTTCAAT AACGGTACTA GGCTCATTAA TGAAACACCA 
GTAACAGTGA TTGTTAATAA GCCACTTACA GTAACCGTGA ACTACACTAG GCAGTATAAT 
GTAACTATAA TAGAGTACTC AAGGCTTGGT TTAATTAATG AGACTTGGCT TTGGGTTAAC 
TCAGACTCAA TACTCAGGGT AATGCCGAGG CCGGTGGTTA ACATTAATAG CAGCGTTAGG 
CTAATACCAA GGACCCCTGT GGTTGAGGTT ACTGTTAATG AGCCGATAAT TATTAACGTG 
ACTTATGTTA TTCAATTCCT AGTAACCATG GTTAAATACT CTAAGCTCGG TGTGTTTAAT 
GAGACTAGTG AATGGGTTAA CTCAGATTCA ATAATTAAGA TAACTAATAC CATTATTGAG 
TTAAGCAACC TAACCAGGCT CATACCTAGG GTAAATAGCA TTATCATTAA TGTGACTGGT 
CCAATGATTA TTAATGAATC CTACACACCC CAGTACCTAT TAACCAATGT AACCACGATA 
GATGAGTCAC CGTGGATGTT TGAGGAGTAT TGGGTTAACG CATCAACTAG ACTTAACTTA 
AGCCCAACCC CAGTGTTAAG CCTAGGAAAC AGCACTAGGC TAATACTAAG CGGTATTCTG 
GTTAATGGGA AGCCGATAAA CTCTAATCAA TTGGTGGTTA ATGCCCCATT AAACGTAACT 
GTAATGTACC TTAAGCAGTG GTTCATAAGC ATCAGCGTAC ACACTTTAAA CAACACACCG 
TTAACTATTA TTAGTGGGTG GGTTAATGCA AGCAGCCCAA TCATCAGTAG TGTTAAATGG 
GGTAACTTAA CAATTAGGCT TAAGGAACCA TTAATAGTAA ACGCCTCAAT GGTTAATCAA 
CCCATTAACG CTGAGGCTGA TGTAGCGTAC AGGGTGTTTA AGGTTACGGA TTCACTGGGG 
TTACCGGAAC CATTCGTAAC AGTAATGGTT AAGTGCGGTG AGTATAGTGT TAGGCAGGTG 
AGTAACGCCT ACGGTATCAT TAAACCACTA GTACCCATTA ATGAAGCATG CCTATTAAGT 
AAACCAGCGG TGGGTTATTA TTCAATAGCA TTAATCATAT TTACAGTTAC AGTGGTATTA 
TTAATTGTAT TGAGTAGAAG ATTAAGGTAA

Protein sequence

MKLQVLVIVT VITLAVSLVA SSQLYYGVAY GCGRIVIVGE SGGVGLISVM GNSGPYSTVG 
VHGVSILYSV AVGGCMAVAV GVSQGGGPVF IIYNLTNGAY NVININGTGA LYGVAYGDGY 
FMALGSVNNT GLIVLTTGVG YSIIKPIGFK ALYGAAYGDG GFLIVGEGLN GAALGFYNMS 
TGSLINLSSK LPSNYNYVLY SAAYGPLGFM VVGEGVVNSS GYLIQVPVAG IFNISNGEFK 
DLSMYLNQYS LLTSVTYIDY EYVFAGSTSS GDGGYGYYSI YGLTPLYNTI QGGNLYLPLI 
LYSITPISPG VLYVVGNDGS SSVASREAIP VIYNVTLLTN TRNALIKLSG PVSLSITPNS 
TIPLPQGQYT LLAQAEGYYN VTERVIVDSN EVINLMLSRV RLCNVTVRVM VNGTSEPVAN 
ASITLVSNWP NANKYVALSN GSGEASLMVV CNNYSMSIKA RYFIGESENI NINSSVTLDV 
DLTPIVNVTI RAPNEAGEYR VIMSGVVNDS IILGNASLFN LTLSRVGLIR LFTIRLINGT 
VQYLGETIIH LKPGLNVINI TWRTPVIEDM GVKPIIPGNQ SVLIYLNLSK PGNLTLIIST 
NGLRIFTLNE TNITSLQLVR NFTNNGAYTV CAYTWSLFNG SIYIDYGPLC IMVNVVLHSE 
LIVMDESGLA LKLSGYYLGN ETVNVTLPLV LTLGNGTRLI YNGSIFNGEY IANNSFSIRL 
SRMVNYLDVL WIREYWVRVN VLVNGLPINS TEGWFREGYV IKYPMFVYFN NGTRLINETP 
VTVIVNKPLT VTVNYTRQYN VTIIEYSRLG LINETWLWVN SDSILRVMPR PVVNINSSVR 
LIPRTPVVEV TVNEPIIINV TYVIQFLVTM VKYSKLGVFN ETSEWVNSDS IIKITNTIIE 
LSNLTRLIPR VNSIIINVTG PMIINESYTP QYLLTNVTTI DESPWMFEEY WVNASTRLNL 
SPTPVLSLGN STRLILSGIL VNGKPINSNQ LVVNAPLNVT VMYLKQWFIS ISVHTLNNTP 
LTIISGWVNA SSPIISSVKW GNLTIRLKEP LIVNASMVNQ PINAEADVAY RVFKVTDSLG 
LPEPFVTVMV KCGEYSVRQV SNAYGIIKPL VPINEACLLS KPAVGYYSIA LIIFTVTVVL 
LIVLSRRLR