Gene Cmaq_0003 details

Gene Information       Plasmid Coverage information       Fosmid Coverage information       Sequence       

Gene Information

Locus tagCmaq_0003 
Symbol 
ID5710202 
TypeCDS 
Is gene splicedNo 
Is pseudo geneNo 
Organism nameCaldivirga maquilingensis IC-167 
KingdomArchaea 
Replicon accessionNC_009954 
Strand
Start bp11454 
End bp14903 
Gene Length3450 bp 
Protein Length1149 aa 
Translation table11 
GC content41% 
IMG OID641274506 
Producthypothetical protein 
Protein accessionYP_001539847 
Protein GI159040595 
COG category 
COG ID 
TIGRFAM ID 


Plasmid Coverage information

Num covering plasmid clones20 
Plasmid unclonability p-value
Plasmid hitchhikingNo 
Plasmid clonabilitynormal 
 

Fosmid Coverage information

Num covering fosmid clones41 
Fosmid unclonability p-value
Fosmid HitchhikerNo 
Fosmid clonabilitynormal 
 

Sequence

Gene sequence
ATGAAGCTGC AGGTACTGGT TATAGTCACT GTAATTACAT TAGCCGTATC GCTCGTGGCG 
AGTAGTCAAT TATACTATGG TGTAGCATAT GGCTGTGGCC GCATTGTAAT AGTTGGTGAA
TCCGGGGGTG TTGGGTTAAT TAGTGTAATG GGTAATTCAG GTCCATACAG CACTGTGGGC
GTGCATGGCG TCTCAATACT CTACTCAGTG GCTGTGGGTG GGTGTATGGC TGTTGCCGTT
GGTGTGAGCC AGGGCGGTGG GCCGGTTTTC ATCATCTATA ATTTAACCAA TGGTGCTTAT
AATGTTATTA ATATTAATGG TACTGGGGCC TTATATGGTG TTGCCTACGG TGACGGTTAC
TTCATGGCCC TTGGTTCAGT TAATAACACT GGGTTAATAG TATTAACCAC TGGGGTTGGT
TACAGTATTA TTAAGCCAAT AGGCTTCAAA GCCCTCTACG GTGCAGCATA CGGTGACGGC
GGGTTCCTAA TTGTCGGTGA GGGCCTTAAT GGTGCTGCAT TAGGGTTCTA TAATATGTCA
ACTGGTTCCT TAATAAACCT GAGCAGTAAA TTACCATCAA ATTACAATTA CGTACTATAC
TCAGCGGCGT ACGGGCCCCT TGGATTCATG GTTGTTGGTG AAGGTGTGGT TAATTCCTCC
GGTTACCTAA TTCAAGTGCC GGTGGCTGGC ATATTCAATA TTAGTAATGG TGAATTCAAG
GATTTAAGCA TGTACCTGAA CCAATACAGT CTACTCACCA GTGTTACTTA CATTGATTAT
GAGTATGTTT TCGCTGGCTC AACATCAAGT GGTGATGGTG GTTACGGCTA CTACTCAATA
TATGGTTTAA CACCACTCTA CAACACTATT CAAGGTGGGA ACCTATACCT ACCGCTAATA
CTCTACTCAA TAACCCCAAT CTCACCTGGT GTCCTCTACG TGGTTGGTAA TGATGGTTCA
TCATCGGTGG CCTCCCGGGA GGCAATACCA GTAATATATA ATGTAACCCT ATTAACCAAC
ACCCGGAATG CATTAATTAA ATTAAGCGGC CCAGTCTCAT TGAGCATAAC CCCGAATTCA
ACAATACCCC TCCCCCAAGG CCAATATACC TTACTAGCCC AGGCTGAGGG CTATTATAAC
GTGACTGAGC GCGTTATTGT GGATTCCAAT GAGGTTATTA ACCTAATGCT GAGTAGGGTT
AGGCTATGCA ATGTAACAGT GAGGGTTATG GTTAATGGAA CCAGTGAACC AGTGGCTAAC
GCATCCATAA CCCTAGTTAG TAATTGGCCT AACGCCAATA AGTATGTGGC GTTGAGTAAT
GGGTCGGGTG AAGCCTCACT AATGGTTGTG TGTAATAATT ACTCAATGAG TATTAAGGCT
AGGTACTTCA TAGGTGAGTC GGAGAACATA AACATTAATT CATCAGTAAC ACTTGACGTT
GACTTAACCC CAATAGTCAA CGTTACCATT AGGGCACCCA ATGAGGCTGG GGAGTATAGG
GTAATTATGA GTGGTGTGGT TAATGATTCA ATAATACTGG GTAATGCATC ATTATTCAAC
CTAACATTAA GTAGAGTAGG CTTAATTAGG TTATTCACAA TTAGGTTAAT CAACGGTACC
GTTCAATACC TGGGTGAAAC CATTATTCAT CTTAAGCCTG GCTTAAACGT AATTAACATC
ACGTGGAGAA CGCCGGTAAT CGAGGACATG GGTGTTAAGC CAATAATACC TGGTAATCAA
AGCGTATTAA TATACCTTAA TCTAAGTAAG CCAGGTAACC TAACATTAAT CATAAGTACT
AATGGCTTAA GAATATTCAC CTTAAATGAA ACCAACATTA CATCACTCCA ATTAGTGAGG
AACTTCACCA ACAATGGCGC CTACACCGTA TGCGCATACA CGTGGAGTCT ATTCAATGGG
AGCATTTACA TTGATTATGG GCCATTATGC ATAATGGTGA ATGTTGTACT TCACAGTGAG
TTAATAGTGA TGGATGAATC AGGTTTAGCG TTAAAGCTTT CAGGCTACTA TCTCGGTAAT
GAGACTGTTA ATGTGACATT ACCACTGGTT TTAACGTTGG GGAATGGAAC TAGACTAATA
TACAATGGTT CAATATTCAA CGGTGAATAC ATAGCCAATA ACTCATTCTC AATAAGGTTG
AGTAGAATGG TTAATTACCT TGATGTTCTT TGGATTAGGG AGTATTGGGT TAGGGTTAAT
GTACTTGTGA ATGGGTTACC CATTAACTCA ACAGAGGGTT GGTTTAGGGA GGGTTATGTG
ATAAAGTACC CTATGTTCGT GTACTTCAAT AACGGTACTA GGCTCATTAA TGAAACACCA
GTAACAGTGA TTGTTAATAA GCCACTTACA GTAACCGTGA ACTACACTAG GCAGTATAAT
GTAACTATAA TAGAGTACTC AAGGCTTGGT TTAATTAATG AGACTTGGCT TTGGGTTAAC
TCAGACTCAA TACTCAGGGT AATGCCGAGG CCGGTGGTTA ACATTAATAG CAGCGTTAGG
CTAATACCAA GGACCCCTGT GGTTGAGGTT ACTGTTAATG AGCCGATAAT TATTAACGTG
ACTTATGTTA TTCAATTCCT AGTAACCATG GTTAAATACT CTAAGCTCGG TGTGTTTAAT
GAGACTAGTG AATGGGTTAA CTCAGATTCA ATAATTAAGA TAACTAATAC CATTATTGAG
TTAAGCAACC TAACCAGGCT CATACCTAGG GTAAATAGCA TTATCATTAA TGTGACTGGT
CCAATGATTA TTAATGAATC CTACACACCC CAGTACCTAT TAACCAATGT AACCACGATA
GATGAGTCAC CGTGGATGTT TGAGGAGTAT TGGGTTAACG CATCAACTAG ACTTAACTTA
AGCCCAACCC CAGTGTTAAG CCTAGGAAAC AGCACTAGGC TAATACTAAG CGGTATTCTG
GTTAATGGGA AGCCGATAAA CTCTAATCAA TTGGTGGTTA ATGCCCCATT AAACGTAACT
GTAATGTACC TTAAGCAGTG GTTCATAAGC ATCAGCGTAC ACACTTTAAA CAACACACCG
TTAACTATTA TTAGTGGGTG GGTTAATGCA AGCAGCCCAA TCATCAGTAG TGTTAAATGG
GGTAACTTAA CAATTAGGCT TAAGGAACCA TTAATAGTAA ACGCCTCAAT GGTTAATCAA
CCCATTAACG CTGAGGCTGA TGTAGCGTAC AGGGTGTTTA AGGTTACGGA TTCACTGGGG
TTACCGGAAC CATTCGTAAC AGTAATGGTT AAGTGCGGTG AGTATAGTGT TAGGCAGGTG
AGTAACGCCT ACGGTATCAT TAAACCACTA GTACCCATTA ATGAAGCATG CCTATTAAGT
AAACCAGCGG TGGGTTATTA TTCAATAGCA TTAATCATAT TTACAGTTAC AGTGGTATTA
TTAATTGTAT TGAGTAGAAG ATTAAGGTAA
 
Protein sequence
MKLQVLVIVT VITLAVSLVA SSQLYYGVAY GCGRIVIVGE SGGVGLISVM GNSGPYSTVG 
VHGVSILYSV AVGGCMAVAV GVSQGGGPVF IIYNLTNGAY NVININGTGA LYGVAYGDGY
FMALGSVNNT GLIVLTTGVG YSIIKPIGFK ALYGAAYGDG GFLIVGEGLN GAALGFYNMS
TGSLINLSSK LPSNYNYVLY SAAYGPLGFM VVGEGVVNSS GYLIQVPVAG IFNISNGEFK
DLSMYLNQYS LLTSVTYIDY EYVFAGSTSS GDGGYGYYSI YGLTPLYNTI QGGNLYLPLI
LYSITPISPG VLYVVGNDGS SSVASREAIP VIYNVTLLTN TRNALIKLSG PVSLSITPNS
TIPLPQGQYT LLAQAEGYYN VTERVIVDSN EVINLMLSRV RLCNVTVRVM VNGTSEPVAN
ASITLVSNWP NANKYVALSN GSGEASLMVV CNNYSMSIKA RYFIGESENI NINSSVTLDV
DLTPIVNVTI RAPNEAGEYR VIMSGVVNDS IILGNASLFN LTLSRVGLIR LFTIRLINGT
VQYLGETIIH LKPGLNVINI TWRTPVIEDM GVKPIIPGNQ SVLIYLNLSK PGNLTLIIST
NGLRIFTLNE TNITSLQLVR NFTNNGAYTV CAYTWSLFNG SIYIDYGPLC IMVNVVLHSE
LIVMDESGLA LKLSGYYLGN ETVNVTLPLV LTLGNGTRLI YNGSIFNGEY IANNSFSIRL
SRMVNYLDVL WIREYWVRVN VLVNGLPINS TEGWFREGYV IKYPMFVYFN NGTRLINETP
VTVIVNKPLT VTVNYTRQYN VTIIEYSRLG LINETWLWVN SDSILRVMPR PVVNINSSVR
LIPRTPVVEV TVNEPIIINV TYVIQFLVTM VKYSKLGVFN ETSEWVNSDS IIKITNTIIE
LSNLTRLIPR VNSIIINVTG PMIINESYTP QYLLTNVTTI DESPWMFEEY WVNASTRLNL
SPTPVLSLGN STRLILSGIL VNGKPINSNQ LVVNAPLNVT VMYLKQWFIS ISVHTLNNTP
LTIISGWVNA SSPIISSVKW GNLTIRLKEP LIVNASMVNQ PINAEADVAY RVFKVTDSLG
LPEPFVTVMV KCGEYSVRQV SNAYGIIKPL VPINEACLLS KPAVGYYSIA LIIFTVTVVL
LIVLSRRLR