Gene Information Plasmid Coverage information Fosmid Coverage information Sequence |
Gene Information |
Locus tag | Cmaq_1218 |
Symbol | |
ID | 5709730 |
Type | CDS |
Is gene spliced | No |
Is pseudo gene | No |
Organism name | Caldivirga maquilingensis IC-167 |
Kingdom | Archaea |
Replicon accession | NC_009954 |
Strand | + |
Start bp | 1286810 |
End bp | 1289644 |
Gene Length | 2835 bp |
Protein Length | 944 aa |
Translation table | 11 |
GC content | 40% |
IMG OID | 641275722 |
Product | peptidase A5, thermopsin |
Protein accession | YP_001541035 |
Protein GI | 159041783 |
COG category | |
COG ID | |
TIGRFAM ID | |
|
|
Plasmid Coverage information |
Num covering plasmid clones | 5 |
Plasmid unclonability p-value | 0.00267921 |
Plasmid hitchhiking | Yes |
Plasmid clonability | hitchhiker |
| |
Fosmid Coverage information |
Num covering fosmid clones | 34 |
Fosmid unclonability p-value | 0.64223 |
Fosmid Hitchhiker | No |
Fosmid clonability | normal |
| |
Sequence |
Gene sequence | ATGAATGTTC CTGAGTCAGT AATATTCATT GTTATTTTAA CAATCACCTC AGCGTTAATC ACTAATGCTC AATCAGCCGC CTGCTGGTAC TATTGGCCTA ACGTTAACGT TAACCTTGGT CAAGGATTAC TGGTTAAGGT AATGAACGGG TCCTATAACC TATACGTATT CACACCAACC CAGTACGCTA AGTGGAGTAG CGGCAGCGGT GGGTACGCCG TATACGCAGG TAGCGTTACT GTGGGTGCCT ACCTTGTACG CATCCCCCCT GGTTCATACT ACGTGGTGCT CTACCCCACT CAATGCGGCA GCATCGTTAA CGCCGGTATT AATGTTATTG GTTTAGCCCC AACGGGTTTA TCATCAATAA TACCCATCAA CACCACTGCG GTTTTAGGCT ACTTCAATAT AAGTATTATT AGGGCTTGGA ATGCAAGCTA CACCGCAGTC AACGTACTAA GGGTACCTAA GAGTAGTGCC AGTCTTCAAT TAAATGCAGT AGTGCGAGTT GAGTTAATTA ATGGTAGTTT CCAGGAGTAT TGGCTTCAAG ATGCTTTAAT CTTCATTACG AGTAATGGAG TCTTCAGTGT TGCTGATAAT GTCTGGAACG CCACTGCCCC TGGGGCTAAT GTATCAAGCA GCTTAATCAC TGGACTAGGT AGGGTTTACA ATGCCGTGGG CGTTAGCCAG GAGTATTACG GGTACGTGGG TAATTTAACT AGGTACCAGT TACCTTTATC AGGTTACCTT GAGGTTAACG TAACCTTAAT TAACGATTCA GTGGTGGTTA TGTTCGGTTA CGCAATAGTG AGGAATGGAA GCACCTACGC ACCACCGGTA ATTAAGTGGT TTGATAACGT GACCCTGGGG ATTAAGGCTA AGGATGCGTT AATAGTAACT ACCCCATATG AGGAGACGGG TGGTGGATAC GCGTATGATG TTGAGTTAGT CTTTGGGGGA GGCTTTAATG GTGAGCAAAC CACCTTTGAG AGCCTTAATG CTCAATTAGC CGTAATGCAC TGGAGTGGAT CTGGTTGGGT ACCTTATAGT CAAGTCTATA ACTTCGGCAT GAACACTGGG GAATCAGCAA CAGACCTAGT GACCTCAATA TCAAGTAACG GTAATGTGCA AGTCACCGTG GGTATACCAT ACTACGGTGA GTTAACCAAT GACTTCAAAC CAACCATACC CACAAGCTTC ATTGAGGTCA TTTACCCAAA CAGCACTGTG AAAGGCTTCT ACACGTTCAA AGAAACCACA GTAACCTTGC CCAGGGTGAT AATTAGTAAT GGTGTCACCT ACATCTTCAA AGGCATTGAT GAGTCATGTA ATGGGGCAAC GCGATTAATT AGAAATAACT CAGCAACAGT GACCCCAAGC ATTAACGCGT TCTCAACATG CGTTATAAGG GGGAATTATA GTACGTACTT CTTATTGAGA CTTAAGTCAC AATACCCCAT TAATATTACC CTGGTTAATG GCACATTCAC AGTAACTAAT ATGGAGAGCT GGTTACCTGC AAACTCATCA CTGGTGATTA GGGTTAAGGC AATCTACCCA CTCAGTAACT TAACGAGGGT TAAGACTATT AATGAGACTT TAATTAACAT GACTGTTAGG GAGCCGTTAA ACTTAACCAT TGAGTGGATT AGGCAGTATT TTGTCAGGGT TATGAGTATT GTCCCAATTA ATGTTAATGG TTCATTAACA TTAAGTTACT TTAACTGGAT TAACAACGGC TCTGTCTTGG AGTTATCAAT ACCAAGCTTC ATGTACTTCA ATAATGGGAG TAGGTTAATG GCCTTGAATA AATCCAGGGT AATTATAGTG GTTACGCATC CATTAAACAT CACTACGTCA TGGGTTAGGC AGTACTTAGT TAACATTAGT AGCATTGCCC CAATTCTAAT TAACGGTAAT TACTCAATTA ATTATGTTCA GTGGATTAAT TCAGGCAGTA TCATTAACGT GACTGTGCCT AAGTACTATT ACCTTAACGG TAGTGTAAGG TTAATGGCGC TTAATTCATC AATTTTAATA ACAGTTAATA ACCCCATTAA GGCCACTGTA AAGTGGGTTA GGCAGTACTT GATTGAAGTT AATAGTATTG TCCCCGTAAT GGTGAATGAG TCTCAATTAA CCTCATTAAT TAATTGGCTT AATGAATCAA GCACATTAAT TATTAATGCG CAGCCTCAAT ACTACTTCAA TAATGGAACC AGGTTAATCC TACTTAATTC AAGCGAAATT AAAGTAATCA TCAATAAGCC ACTTAACCTA ACCATTGAGT GGGTTAGACA ATATTTGGTT AATGTAACCA GTTCAGCACC ATTAATGGTA AATGACACCT TAGTGAAGTC AATACAGGAT TGGTTTAACT CAAGTTCATT ACTCAATATT ACGCTTACAA TTCAATACTT CAATAATGGA ACCAGGTTAC TTCCCTTAAA CTCCTCATTA ATCCTCATTA AGGTTAATAA GCCTCTTAAC CTGACTGTTA ACTGGGTTAG GCAGTACTTA GTTAATTTAA CAAGCCCAAT AGCCTTAAAC ATTAACGGCA CTGTGTCTAG GAATTACTCC AGATGGATTA ACGCTAGTGA TTTAATAATC CTAAATGGGC CGCTTAGGAT TCTTGAAGTT AATTTAACCA TAATTAAATT AGCCTCCGTA TCAATTAATG GTCAGCTTCA CTACTCATTG CCAATTAACC TGACGGTTAA TGAACCCTTA ATGATTAAGG TTAATTGGGT TAGGGATTAC ATAGTCTACT ATTCATTGGT ATTATTAGTG ATTGTTATTG TATTAATCCT GGTTGCTTCA CGCCGTGGTG GTTAA
|
Protein sequence | MNVPESVIFI VILTITSALI TNAQSAACWY YWPNVNVNLG QGLLVKVMNG SYNLYVFTPT QYAKWSSGSG GYAVYAGSVT VGAYLVRIPP GSYYVVLYPT QCGSIVNAGI NVIGLAPTGL SSIIPINTTA VLGYFNISII RAWNASYTAV NVLRVPKSSA SLQLNAVVRV ELINGSFQEY WLQDALIFIT SNGVFSVADN VWNATAPGAN VSSSLITGLG RVYNAVGVSQ EYYGYVGNLT RYQLPLSGYL EVNVTLINDS VVVMFGYAIV RNGSTYAPPV IKWFDNVTLG IKAKDALIVT TPYEETGGGY AYDVELVFGG GFNGEQTTFE SLNAQLAVMH WSGSGWVPYS QVYNFGMNTG ESATDLVTSI SSNGNVQVTV GIPYYGELTN DFKPTIPTSF IEVIYPNSTV KGFYTFKETT VTLPRVIISN GVTYIFKGID ESCNGATRLI RNNSATVTPS INAFSTCVIR GNYSTYFLLR LKSQYPINIT LVNGTFTVTN MESWLPANSS LVIRVKAIYP LSNLTRVKTI NETLINMTVR EPLNLTIEWI RQYFVRVMSI VPINVNGSLT LSYFNWINNG SVLELSIPSF MYFNNGSRLM ALNKSRVIIV VTHPLNITTS WVRQYLVNIS SIAPILINGN YSINYVQWIN SGSIINVTVP KYYYLNGSVR LMALNSSILI TVNNPIKATV KWVRQYLIEV NSIVPVMVNE SQLTSLINWL NESSTLIINA QPQYYFNNGT RLILLNSSEI KVIINKPLNL TIEWVRQYLV NVTSSAPLMV NDTLVKSIQD WFNSSSLLNI TLTIQYFNNG TRLLPLNSSL ILIKVNKPLN LTVNWVRQYL VNLTSPIALN INGTVSRNYS RWINASDLII LNGPLRILEV NLTIIKLASV SINGQLHYSL PINLTVNEPL MIKVNWVRDY IVYYSLVLLV IVIVLILVAS RRGG
|
| |