Gene Cphy_1694 details

Gene Information       Plasmid Coverage information       Fosmid Coverage information       Sequence       

Gene Information

Locus tagCphy_1694 
Symbol 
ID5741525 
TypeCDS 
Is gene splicedNo 
Is pseudo geneNo 
Organism nameClostridium phytofermentans ISDg 
KingdomBacteria 
Replicon accessionNC_010001 
Strand
Start bp2078054 
End bp2081500 
Gene Length3447 bp 
Protein Length1148 aa 
Translation table11 
GC content53% 
IMG OID641292794 
Producttriple helix repeat-containing collagen 
Protein accessionYP_001558805 
Protein GI160879837 
COG category 
COG ID 
TIGRFAM ID 


Plasmid Coverage information

Num covering plasmid clones21 
Plasmid unclonability p-value
Plasmid hitchhikingNo 
Plasmid clonabilitynormal 
 

Fosmid Coverage information

Num covering fosmid clonesn/a 
Fosmid unclonability p-valuen/a 
Fosmid Hitchhikern/a 
Fosmid clonabilityn/a 
 

Sequence

Gene sequence
ATGTCATTTT TTGAAAATTA TAACAAAAGA TATAAACGCG ACTTTGTTTG TGACCGTAAT 
AACGATTGCG AGTGCGATTG TGAACACGAC CGAGATAATG ATTGCGAACA CGATTTTGAT
TGTAAACACG ACCGCAATTA TGATTACAAG CACGATTACG ATTGTGACGG CTGCGATAAC
GATTGCGAGT ACGATTGCGA GTACGACCGA GAGTGTGACC GATATAATAA TTGCGAACAC
AACCGAGAGT GCGACCGCAA TAATTATTGC GAGCGCAATT GTGATTGTGA TTGTGATGAC
TGCGATTATG ACCGAAATTG TCATTGTAAA CAGTGTTGTT GTCTAACAGG ACCAAAAGGA
CCAAAAGGAC CAACAGGGGC AACTGGATTA ACAGGCGACA CAGGAGCTAC TGGTCCAACA
GGTGCTACCG GCCCAACAGG CGACACAGGG ACAACCGGTG CTACCGGTCC AACAGGTGAT
ACGGGAGCAA TGGGAACTAC TGGTGCAACA GGTACTACCG GATTAACAGG TGACACAGGA
GCTACTGGTG CAGCAGGTGC CACTGGATTA ACAGGCGACA CAGGTGCAAC AGGTGCTACC
GGTTCAACAG GTGATACGGG AGCGACGGGT ACTACTGGTG CAACAGGAGC AACCGGATTA
ACAGGCGACA CAGGTGCTAC TGGTGCTACC GGCCCAACAG GTGATACGGG AGCGACTGGT
ACTACTGGTG CAACAGGAAC CACCGGATTA ACAGGTGACA CAGGAGCTAC TGGTGCTACT
GGATTAACAG GTGACACGGG AGCAACAGGT GCTACTGGAT TAACAGGCGA CATAGGAGCT
ACTGGTGCTA CCGGCCCAAC AGGCGATACA GGGGCAACCG GTACTACAGG TCCAACAGGT
GATACGGGAG CAACGGGAAC TACTGGTGCA ACAGGTGCTA CTGGATTAAC AGGTGACACG
GGAGCTACTG GTGCAACCGG TCCAGCAGGT GATACTGGTG CGACGGGTAC TACTGGTGCA
ACAGGAGCAA CCGGATTAAC AGGTGACACA GGTGCTACAG GTGATACTGG AGCTACTGGA
GCAACCGGAT TAACAGGTGA CACAGGTGCT ACAGGTGCTA CTGGATTAAC TGGCGACACA
GGTGCTACAG GTGCTACCGG TCCAACAGGT GATACTGGAG CTACTGGAGC AACCGGTCCA
ACAGGTGATA CGGGAGCGAC GGGTACTACT GGTGCAACAG GAACCACCGG ATTAACAGGT
GACACAGGTG CTACAGGTGC TACCGGCCCA ACAGGTGATA CGGGAGCTAC TGGAGCAACC
GGTCCAACAG GTGATACGGG AGCTACTGGA GCAACCGGTC CAACAGGTGA TACTGGAGCG
ACGGGTACTA CTGGTGCAAC AGGAGCAACC GGATTAACAG GTGACACAGG AGTTACAGGT
GCTACCGGCC CAACAGGTGA TACAGGTGAT ACTGGTGCAA CAGGAGCCAC TGGATTAACA
GGTGACACGG GAGCTACTGG AGCAACCGGT CCAACAGGTG ATACTGGAGC TACTGGTACT
ACTGGATTAA CAGGCGACAC AGGTGCAACA GGTGCTACCG GTCCAACGGG TGATACTGGA
GCGACGGGTA CTACTGGTGC AACAGGAGCA ACCGGATTAA CAGGTGACAC AGGAGTTACA
GGTGCTACCG GCCCAACAGG TGATACGGGA GCTACTGGAG CAACCGGTCC AACGGGTGAT
ACTGGAGCCA CTGGTACTAC CGGTCCAACA GGTGATACTG GAGCTACTGG TGCAACAGGT
GCCACTGGAT TAACAGGTGA CACAGGAGCT ACAGGTGTTA CTGGCCCAAC AGGTGATACA
GGTGATACTG GTGCGACGGG TACTACTGGT GCAACAGGAG CCACTGGATT AACAGGTGAC
ACGGGAGCTA CTGGAGCAAC CGGTCCAACA GGTGATACTG GAGCTACTGG TACTACTGGA
TTAACAGGCG ACACAGGTGC AACAGGTGCT ACCGGTCCAA CGGGTGATAC TGGTGCGACG
GGTACTACTG GTGCAACAGG AGCAACAGGT GACACAGGAG TTACAGGTGC TACCGGCCCA
ACAGGTGATA CGGGAGCTAC TGGAGCAACC GGTCCAACGG GTGATACTGG AGCCACGGGT
ACTACTGGTG CAACAGGTGC CACTGGATTA ACAGGTGACA CGGGAGCTAC TGGTGCTACT
GGATTAACAG GCGACACAGG TGCAACAGGT GCTACCGGTC CAACAGGTGC TACCGGTCCA
ACAGGTGATA CGGGAGCTAC TGGTGCTACC GGTCCAACAG GTGATACTGG AGCTACTGGT
GCTACTGGTG CTACTGGTGC AACAGGTGCC ACTGGATTAA CAGGTGACAC AGGTGCTACA
GGTGTTACTG GCCCAACAGG TGATACTGGT GCGACGGGTA CTACTGGTGC AACAGGTGCC
ACTGGATTAA CAGGTGACAC GGGAGCTACT GGAGCAACCG GTCCAACAGG TGATACTGGA
GCGACAGGTA CTACTGGATT AACAGGTGCA ACAGGTGCTA CCGGTCCAAC GGGTGATACT
GGAGCGACGG GTACTACTGG TGCAACAGGT GCTACCGGAT TAACAGGTGA CACAGGAGTT
ACAGGTGCTA CCGGCCCAAC AGGTGATACG GGAGCTACTG GAGCTACCGG TCCAACAGGT
GATACGGGAG CCACGGGTAC TACTGGTGCA ATAGGTGCCA CTGGATTAAC AGGCGACACA
GGTGCAACAG GTGCTACCGG TCCAACAGGT GATACGGGAG CTACTGGTGC TACCGGTCCA
ACAGGTGATA CTGGAGCGAC AGGTACTACT GGTGCAACAG GAGCCACTGG ATTAACAGGT
GACACGGGAG CTACTGGTGC TACTGGTCCT GCAGGTGATA CTGGAGCGAC GGGTACTACT
GGTGCAACAG GAGCCACTGG ATTAACAGGT GACACGGGAG CTACTGGTGC TACTGGTCCT
GCAGGTGCTA CTGGAGCTAC TGGAGTATTA AACTTTTCAG ACTTTTTTGC ATTGATGCCT
CCAGATAATT CAGCAACAGT TGCGCCTGGC ACAGATGTAA GCTTTCCTCA AGATGGACCT
ACGAGTGGTT TAGCCATTAC CCGTACTGGT CCCAGCTCAT TTAACTTGGC TGCAATTGGC
ACGTATCAAG TATTGTTTCA AGTCAGTGTA GACGAAGCAG GCCAATTGAT TTTGACGCTT
GGTGGCTCAG ATTTAGCGTA TACGGTGGCC GGACGAGCAA CAGGCACTTC TCAGATTGTA
GGTATGGCAC TTGTAACCAC AACAGTCATA AATTCAATAC TCACCGTACG AAATCCGGCA
GGTAATTCAA CAGCACTAAC TATCACTCCC CTTGCCGGTG GAACAAGACC TGTTTCAGCA
CATCTTGTTA TCACACAAGT TTCGTAA
 
Protein sequence
MSFFENYNKR YKRDFVCDRN NDCECDCEHD RDNDCEHDFD CKHDRNYDYK HDYDCDGCDN 
DCEYDCEYDR ECDRYNNCEH NRECDRNNYC ERNCDCDCDD CDYDRNCHCK QCCCLTGPKG
PKGPTGATGL TGDTGATGPT GATGPTGDTG TTGATGPTGD TGAMGTTGAT GTTGLTGDTG
ATGAAGATGL TGDTGATGAT GSTGDTGATG TTGATGATGL TGDTGATGAT GPTGDTGATG
TTGATGTTGL TGDTGATGAT GLTGDTGATG ATGLTGDIGA TGATGPTGDT GATGTTGPTG
DTGATGTTGA TGATGLTGDT GATGATGPAG DTGATGTTGA TGATGLTGDT GATGDTGATG
ATGLTGDTGA TGATGLTGDT GATGATGPTG DTGATGATGP TGDTGATGTT GATGTTGLTG
DTGATGATGP TGDTGATGAT GPTGDTGATG ATGPTGDTGA TGTTGATGAT GLTGDTGVTG
ATGPTGDTGD TGATGATGLT GDTGATGATG PTGDTGATGT TGLTGDTGAT GATGPTGDTG
ATGTTGATGA TGLTGDTGVT GATGPTGDTG ATGATGPTGD TGATGTTGPT GDTGATGATG
ATGLTGDTGA TGVTGPTGDT GDTGATGTTG ATGATGLTGD TGATGATGPT GDTGATGTTG
LTGDTGATGA TGPTGDTGAT GTTGATGATG DTGVTGATGP TGDTGATGAT GPTGDTGATG
TTGATGATGL TGDTGATGAT GLTGDTGATG ATGPTGATGP TGDTGATGAT GPTGDTGATG
ATGATGATGA TGLTGDTGAT GVTGPTGDTG ATGTTGATGA TGLTGDTGAT GATGPTGDTG
ATGTTGLTGA TGATGPTGDT GATGTTGATG ATGLTGDTGV TGATGPTGDT GATGATGPTG
DTGATGTTGA IGATGLTGDT GATGATGPTG DTGATGATGP TGDTGATGTT GATGATGLTG
DTGATGATGP AGDTGATGTT GATGATGLTG DTGATGATGP AGATGATGVL NFSDFFALMP
PDNSATVAPG TDVSFPQDGP TSGLAITRTG PSSFNLAAIG TYQVLFQVSV DEAGQLILTL
GGSDLAYTVA GRATGTSQIV GMALVTTTVI NSILTVRNPA GNSTALTITP LAGGTRPVSA
HLVITQVS