Gene Information Plasmid Coverage information Fosmid Coverage information Sequence |
Gene Information |
Locus tag | Cphy_1694 |
Symbol | |
ID | 5741525 |
Type | CDS |
Is gene spliced | No |
Is pseudo gene | No |
Organism name | Clostridium phytofermentans ISDg |
Kingdom | Bacteria |
Replicon accession | NC_010001 |
Strand | - |
Start bp | 2078054 |
End bp | 2081500 |
Gene Length | 3447 bp |
Protein Length | 1148 aa |
Translation table | 11 |
GC content | 53% |
IMG OID | 641292794 |
Product | triple helix repeat-containing collagen |
Protein accession | YP_001558805 |
Protein GI | 160879837 |
COG category | |
COG ID | |
TIGRFAM ID | |
|
|
Plasmid Coverage information |
Num covering plasmid clones | 21 |
Plasmid unclonability p-value | 1 |
Plasmid hitchhiking | No |
Plasmid clonability | normal |
| |
Fosmid Coverage information |
Num covering fosmid clones | n/a |
Fosmid unclonability p-value | n/a |
Fosmid Hitchhiker | n/a |
Fosmid clonability | n/a |
| |
Sequence |
Gene sequence | ATGTCATTTT TTGAAAATTA TAACAAAAGA TATAAACGCG ACTTTGTTTG TGACCGTAAT AACGATTGCG AGTGCGATTG TGAACACGAC CGAGATAATG ATTGCGAACA CGATTTTGAT TGTAAACACG ACCGCAATTA TGATTACAAG CACGATTACG ATTGTGACGG CTGCGATAAC GATTGCGAGT ACGATTGCGA GTACGACCGA GAGTGTGACC GATATAATAA TTGCGAACAC AACCGAGAGT GCGACCGCAA TAATTATTGC GAGCGCAATT GTGATTGTGA TTGTGATGAC TGCGATTATG ACCGAAATTG TCATTGTAAA CAGTGTTGTT GTCTAACAGG ACCAAAAGGA CCAAAAGGAC CAACAGGGGC AACTGGATTA ACAGGCGACA CAGGAGCTAC TGGTCCAACA GGTGCTACCG GCCCAACAGG CGACACAGGG ACAACCGGTG CTACCGGTCC AACAGGTGAT ACGGGAGCAA TGGGAACTAC TGGTGCAACA GGTACTACCG GATTAACAGG TGACACAGGA GCTACTGGTG CAGCAGGTGC CACTGGATTA ACAGGCGACA CAGGTGCAAC AGGTGCTACC GGTTCAACAG GTGATACGGG AGCGACGGGT ACTACTGGTG CAACAGGAGC AACCGGATTA ACAGGCGACA CAGGTGCTAC TGGTGCTACC GGCCCAACAG GTGATACGGG AGCGACTGGT ACTACTGGTG CAACAGGAAC CACCGGATTA ACAGGTGACA CAGGAGCTAC TGGTGCTACT GGATTAACAG GTGACACGGG AGCAACAGGT GCTACTGGAT TAACAGGCGA CATAGGAGCT ACTGGTGCTA CCGGCCCAAC AGGCGATACA GGGGCAACCG GTACTACAGG TCCAACAGGT GATACGGGAG CAACGGGAAC TACTGGTGCA ACAGGTGCTA CTGGATTAAC AGGTGACACG GGAGCTACTG GTGCAACCGG TCCAGCAGGT GATACTGGTG CGACGGGTAC TACTGGTGCA ACAGGAGCAA CCGGATTAAC AGGTGACACA GGTGCTACAG GTGATACTGG AGCTACTGGA GCAACCGGAT TAACAGGTGA CACAGGTGCT ACAGGTGCTA CTGGATTAAC TGGCGACACA GGTGCTACAG GTGCTACCGG TCCAACAGGT GATACTGGAG CTACTGGAGC AACCGGTCCA ACAGGTGATA CGGGAGCGAC GGGTACTACT GGTGCAACAG GAACCACCGG ATTAACAGGT GACACAGGTG CTACAGGTGC TACCGGCCCA ACAGGTGATA CGGGAGCTAC TGGAGCAACC GGTCCAACAG GTGATACGGG AGCTACTGGA GCAACCGGTC CAACAGGTGA TACTGGAGCG ACGGGTACTA CTGGTGCAAC AGGAGCAACC GGATTAACAG GTGACACAGG AGTTACAGGT GCTACCGGCC CAACAGGTGA TACAGGTGAT ACTGGTGCAA CAGGAGCCAC TGGATTAACA GGTGACACGG GAGCTACTGG AGCAACCGGT CCAACAGGTG ATACTGGAGC TACTGGTACT ACTGGATTAA CAGGCGACAC AGGTGCAACA GGTGCTACCG GTCCAACGGG TGATACTGGA GCGACGGGTA CTACTGGTGC AACAGGAGCA ACCGGATTAA CAGGTGACAC AGGAGTTACA GGTGCTACCG GCCCAACAGG TGATACGGGA GCTACTGGAG CAACCGGTCC AACGGGTGAT ACTGGAGCCA CTGGTACTAC CGGTCCAACA GGTGATACTG GAGCTACTGG TGCAACAGGT GCCACTGGAT TAACAGGTGA CACAGGAGCT ACAGGTGTTA CTGGCCCAAC AGGTGATACA GGTGATACTG GTGCGACGGG TACTACTGGT GCAACAGGAG CCACTGGATT AACAGGTGAC ACGGGAGCTA CTGGAGCAAC CGGTCCAACA GGTGATACTG GAGCTACTGG TACTACTGGA TTAACAGGCG ACACAGGTGC AACAGGTGCT ACCGGTCCAA CGGGTGATAC TGGTGCGACG GGTACTACTG GTGCAACAGG AGCAACAGGT GACACAGGAG TTACAGGTGC TACCGGCCCA ACAGGTGATA CGGGAGCTAC TGGAGCAACC GGTCCAACGG GTGATACTGG AGCCACGGGT ACTACTGGTG CAACAGGTGC CACTGGATTA ACAGGTGACA CGGGAGCTAC TGGTGCTACT GGATTAACAG GCGACACAGG TGCAACAGGT GCTACCGGTC CAACAGGTGC TACCGGTCCA ACAGGTGATA CGGGAGCTAC TGGTGCTACC GGTCCAACAG GTGATACTGG AGCTACTGGT GCTACTGGTG CTACTGGTGC AACAGGTGCC ACTGGATTAA CAGGTGACAC AGGTGCTACA GGTGTTACTG GCCCAACAGG TGATACTGGT GCGACGGGTA CTACTGGTGC AACAGGTGCC ACTGGATTAA CAGGTGACAC GGGAGCTACT GGAGCAACCG GTCCAACAGG TGATACTGGA GCGACAGGTA CTACTGGATT AACAGGTGCA ACAGGTGCTA CCGGTCCAAC GGGTGATACT GGAGCGACGG GTACTACTGG TGCAACAGGT GCTACCGGAT TAACAGGTGA CACAGGAGTT ACAGGTGCTA CCGGCCCAAC AGGTGATACG GGAGCTACTG GAGCTACCGG TCCAACAGGT GATACGGGAG CCACGGGTAC TACTGGTGCA ATAGGTGCCA CTGGATTAAC AGGCGACACA GGTGCAACAG GTGCTACCGG TCCAACAGGT GATACGGGAG CTACTGGTGC TACCGGTCCA ACAGGTGATA CTGGAGCGAC AGGTACTACT GGTGCAACAG GAGCCACTGG ATTAACAGGT GACACGGGAG CTACTGGTGC TACTGGTCCT GCAGGTGATA CTGGAGCGAC GGGTACTACT GGTGCAACAG GAGCCACTGG ATTAACAGGT GACACGGGAG CTACTGGTGC TACTGGTCCT GCAGGTGCTA CTGGAGCTAC TGGAGTATTA AACTTTTCAG ACTTTTTTGC ATTGATGCCT CCAGATAATT CAGCAACAGT TGCGCCTGGC ACAGATGTAA GCTTTCCTCA AGATGGACCT ACGAGTGGTT TAGCCATTAC CCGTACTGGT CCCAGCTCAT TTAACTTGGC TGCAATTGGC ACGTATCAAG TATTGTTTCA AGTCAGTGTA GACGAAGCAG GCCAATTGAT TTTGACGCTT GGTGGCTCAG ATTTAGCGTA TACGGTGGCC GGACGAGCAA CAGGCACTTC TCAGATTGTA GGTATGGCAC TTGTAACCAC AACAGTCATA AATTCAATAC TCACCGTACG AAATCCGGCA GGTAATTCAA CAGCACTAAC TATCACTCCC CTTGCCGGTG GAACAAGACC TGTTTCAGCA CATCTTGTTA TCACACAAGT TTCGTAA
|
Protein sequence | MSFFENYNKR YKRDFVCDRN NDCECDCEHD RDNDCEHDFD CKHDRNYDYK HDYDCDGCDN DCEYDCEYDR ECDRYNNCEH NRECDRNNYC ERNCDCDCDD CDYDRNCHCK QCCCLTGPKG PKGPTGATGL TGDTGATGPT GATGPTGDTG TTGATGPTGD TGAMGTTGAT GTTGLTGDTG ATGAAGATGL TGDTGATGAT GSTGDTGATG TTGATGATGL TGDTGATGAT GPTGDTGATG TTGATGTTGL TGDTGATGAT GLTGDTGATG ATGLTGDIGA TGATGPTGDT GATGTTGPTG DTGATGTTGA TGATGLTGDT GATGATGPAG DTGATGTTGA TGATGLTGDT GATGDTGATG ATGLTGDTGA TGATGLTGDT GATGATGPTG DTGATGATGP TGDTGATGTT GATGTTGLTG DTGATGATGP TGDTGATGAT GPTGDTGATG ATGPTGDTGA TGTTGATGAT GLTGDTGVTG ATGPTGDTGD TGATGATGLT GDTGATGATG PTGDTGATGT TGLTGDTGAT GATGPTGDTG ATGTTGATGA TGLTGDTGVT GATGPTGDTG ATGATGPTGD TGATGTTGPT GDTGATGATG ATGLTGDTGA TGVTGPTGDT GDTGATGTTG ATGATGLTGD TGATGATGPT GDTGATGTTG LTGDTGATGA TGPTGDTGAT GTTGATGATG DTGVTGATGP TGDTGATGAT GPTGDTGATG TTGATGATGL TGDTGATGAT GLTGDTGATG ATGPTGATGP TGDTGATGAT GPTGDTGATG ATGATGATGA TGLTGDTGAT GVTGPTGDTG ATGTTGATGA TGLTGDTGAT GATGPTGDTG ATGTTGLTGA TGATGPTGDT GATGTTGATG ATGLTGDTGV TGATGPTGDT GATGATGPTG DTGATGTTGA IGATGLTGDT GATGATGPTG DTGATGATGP TGDTGATGTT GATGATGLTG DTGATGATGP AGDTGATGTT GATGATGLTG DTGATGATGP AGATGATGVL NFSDFFALMP PDNSATVAPG TDVSFPQDGP TSGLAITRTG PSSFNLAAIG TYQVLFQVSV DEAGQLILTL GGSDLAYTVA GRATGTSQIV GMALVTTTVI NSILTVRNPA GNSTALTITP LAGGTRPVSA HLVITQVS
|
| |