Gene Information Plasmid Coverage information Fosmid Coverage information Sequence |
Gene Information |
Locus tag | Dtox_3124 |
Symbol | |
ID | 8430118 |
Type | CDS |
Is gene spliced | No |
Is pseudo gene | No |
Organism name | Desulfotomaculum acetoxidans DSM 771 |
Kingdom | Bacteria |
Replicon accession | NC_013216 |
Strand | + |
Start bp | 3327228 |
End bp | 3331970 |
Gene Length | 4743 bp |
Protein Length | 1580 aa |
Translation table | 11 |
GC content | 60% |
IMG OID | 645035379 |
Product | Collagen triple helix repeat protein |
Protein accession | YP_003192498 |
Protein GI | 258516276 |
COG category | |
COG ID | |
TIGRFAM ID | |
| 

|
Plasmid Coverage information |
Num covering plasmid clones | 8 |
Plasmid unclonability p-value | 1 |
Plasmid hitchhiking | No |
Plasmid clonability | normal |
| |
Fosmid Coverage information |
Num covering fosmid clones | 31 |
Fosmid unclonability p-value | 1 |
Fosmid Hitchhiker | No |
Fosmid clonability | normal |
| |
Sequence |
Gene sequence | TTGATTTCTA TGTCCTCTAT ATTGATAATG CCAACTGGAG ACACTTATAT TAAAAAATCA TCTCCAAATA GTAACTTTTC CAAAAAAAAA TGTCTTATTG CAGGTTTCGG GGGCTGCAAA AAAATATATA CTAGTTTGAT AAAATTTGAC ATTCCCCAGA TTCCTGCAGG GAGTGAGTTT ATTCGTGCTT ATTTAAGGCT TAATGTTGAT GATACTGATC TAGCAGATAA TGTTGAAATA AAGGTAAACA GGATATTATC TAGTTTTGAT ACGGATACAG TTACATGGGA CACTTCTCCC TCATATATAC CAACATCAAT TGTATTTAAT GTTGACTGCC ATCAAATAGG CCGATTAGTC GAAGTAAACA TAAGTGAATT GGTACGAGGC TGGATAGATC TGCAATTTCC CAATTATGGT ATTGCACTAA CAGGAAAAGA GGGTAATAAA GGTCTTGTAG CCTTTTCAAG TTCTAATGAC GAGGCAATGA GTAGACCACA ACTAATTATA ATATACCGAT TTAATATTGT TGGCCCCACA GGTCCGACTG GTCCGCATGG TAAAACAGGT AAAACCGGTA AAACCGGTCC CACAGGCCCG ACTGGCAAAA CAGGTAAAAC AGGAGCAACC GGTCCCACAG GCGCAACTGG TCCTACAGGC ACTGGCGCAA CCGGCCCCAC AGGTCCAACT GGCAGTGCAA CAGGAGCAAC TGGCCCCACG GGTCCTACAG GCACTGCAGG CACAACAGGT GCAACCGGTC CCACAGGTCC AACTGGTATA GCAGGTACAA GCGGCGCAAC CGGCCCCACT GGTCCGACCG GTACTGCGGG TGCAGACGGT ACAACCGGCC CCACAGGCCC GACTGGCATT GCGGGTGCAA ATGGCGCAAC CGGCCCCACA GGCCCGACAG GTACTGCGGG TGCAAATGGC GCAACCGGCC CCACAGGTCC TACGGGTACT GCGGGTGCAG ATGGCGCAAT CGGCCCTACA GGTCCCACGG GCACTGGTGC AACCGGTCCC ACAGGTCCTA CAGGTACCGC AGGAACAGAC GGTGCAACCG GCCCCACAGG TCCCACCGGT ACTGCAGGAA CAGACGGTGC AACCGGCCCC ACAGGCCCGA CAGGTACTGC GGGTGCAAAT GGCGCAACCG GTCCCACTGG TACAGATGGC GCAACCGGTC CCACAGGTCC CACCGGTACT GCAGGAGTAG ACGGTGCAAC AGGCCCCACA GGTCCTACTG GCACTTCTGG TGCAGATGGT GCAACCGGTC CCACAGGTCC CACCGGCACT TCTGGTGCAG ATGGCACAAC TGGTCCCACA GGTCCTACCG GTACTGCAGG AGTAGACGGT GCAACCGGCC CCACGGGTCC TACCGGCACT TCTGGTTCAG ATGGTGCAAC CGGCCCCACA GGCCCGACAG GTACTGCGGG TGCAGACGGA GCAACCGGCC CCACTGGTCC TACCGGTACT GCAGGAGCAG ACGGTGCAAC CGGTCCCACT GGCCCGACCG GTACTGCAGG AGCAGACGGC GCAACCGGTC CCACGGGCCC GACCGGTACT GCAGGAGCAG ACGGCGCAAC CGGTCCCACG GGTCCGACTG GCACTGCAGG AGCAGACGGT GCAACCGGCC CCACAGGCCC GACTGGTACT GCAGGTGCAG ATGGCGCAAC CGGCCCCACA GGTCCCACTG GCACTGCAGG TGCAGATGGC GCAACCGGCC CCACAGGCCC GACAGGTACT GCGGGTGCAG ACGGCGCAAC CGGCCCAACT GGTCCGACCG GTACTGCGGG TGCAGATGGT GCAACCGGTC CCACAGGTCC TACCGGTACT GCAGGAGTAG ACGGTGCAAC AGGCCCCACG GGTCCTACCG GCACTTCTGG TTCAGATGGT GCAACCGGCC CTACAGGTCC CACGGGCACT GCGGGAGTAG ACGGTGCAAC CGGTCCCACA GGTCCTACTG GTACCACAGG AACAGACGGT GCAACCGGCC CCACAGGCCC GACTGGCACT GCTGCTGCAG ACGGCGCAAC TGGTCCCACA GGCCCGACAG GTACTGCGGG TGCAGACGGC GCAACCGGCC CAACTGGTCC GACCGGCACT GCAGGAGCAG ACGGTGCAAC CGGCCCCACA GGTCCTACTG GTACTGCGGG TGCAGATGGC GCAACCGGTC CCACAGGTCC CACCGGTACT GCAGGAGTAG ACGGTGCAAC AGGCCCCACA GGCCCGACAG GTACTGCGGG TGCAGACGGC GCAACCGGCC CAACTGGTCC GACCGGTACT GCGGGTGCAG ATGGTGCAAC CGGCCCAACT GGTCCGACCG GCACTGCAGG AGCAGACGGT GCAACCGGCC CCACAGGTCC TACTGGTACT GCGGGTGCAG ATGGCGCAAC CGGCCCTACA GGTCCCACGG GCACTGCGGG AGTAGACGGT GCAACCGGCC CCACAGGTCC TACAGGTACC GCAGGAACAG ACGGTGCAAC CGGCCCCACA GGCCCGACTG GCACTGCTGG TGCAGACGGC GCAACCGGTC CCACAGGTCC GACTGGCACT GCTGGTACAG ATGGCGCAAC CGGTCCCACA GGTCCTACCG GTACTGCAGG AGTAGACGGT GCAACAGGCC CCACGGGTCC GACTGGCACT GCTGGTGCAG ATGGTGCAAC CGGTCCCACA GGTCCCACTG GCACTGCTGG TACAGATGGC GCAACCGGTC CCACAGGTCC CACCGGCACT GCTGGTACAA ATGGCGCAAC TGGTCCCACA GGTCCTACTG GTACTGCTGG TGCAGACGGC ACAACCGGTC CCACAGGTCC CACCGGCACT GCTGGTACAA ATGGCGCAAC TGGTCCCACA GGTCCTACAG GTACTGCAGG AGTAGACGGT GCAACCGGCC CCACGGGTCC GACTGGCACT TCTGGTGCAG ACGGCGCAAC CGGCCCCACA GGTCCTACTG GTACTGCTGG AACAAACGGT GCAACCGGCC CCACAGGTCC TACTGGTACT GCTGGTGCAG ACGGCGCAAC CGGCCCCACA GGTCCAACTG GTACAGCAGG AACAGACGGT GCAACCGGCC CCACAGGTCC GACTGGTACT GCAGGAGCAG ACGGTGCAAC CGGTCCCACA GGTCCAACTG GCACTGCTGG TGCAGACGGT GCAACCGGTC CCACAGGTCC TACTGGTACT GCTGGTGCAG ACGGTGCAAC CGGCCCCACA GGCCCGACTG GCACTGCTGG TGCAGACGGC GCAACCGGCC CCACAGGTCC TACTGGTACT GCTGGTGCAG ACGGTGCAAC CGGTCCCACA GGTCCTACTG GTACTGCTGG TGCAGACGGT GCAACCGGTG CAACCGGTCC CACTGGCCCA ACTGGTACTG CAGGTGCAGA TGGTGCAACC GGCCCCACAG GTCCTACTGG TACTGCTGGT GCAGACGGTG CAACCGGCCC CACAGGTCCT ACTGGCACTG CTGGTGCAGA TGGCGCAACC GGCCCCACAG GTCCTACTGG CACTGCTGGT GCAGATGGCG CAACCGGCCC CACAGGTCCG ACCGGCACTG CAGGTGTAGA CGGCGCAACC GGCCCCACTG GTCCGACCGG CACTGCTGGT GCAGACGGCG CAACCGGCCC CACAGGTCCT ACTGGTACTG CTGGTGCAGA CGGCGCAACC GGCCCCACAG GTCCGACTGG CACTGCAGGT GCAGACGGCG CAACCGGTCC CACTGGCCCA ACTGGTACAG CAGGTGTAGA CGGTGCAACC GGCCCCACAG GCCCGACAGG TACTGCAGGT GCAGACGGTA CAACCGGCCC CACAGGTCCG ACCGGCACTG CTGGTGCAGA TGGCGCAACC GGCCCCACTG GCCCGACTGG CACTGCTGGT GCAGACGGTG CAACCGGCCC CACAGGTCCG ACTGGTACTG CTGGTGTAGA CGGCGCAACC GGCCCCACGG GTCCGACCGG CACTGCTGGT GCAGACGGCG CAACCGGCCC CACTGGCCCG ACCGGCACTG CTGGTGCAGA TGGCGCAACC GGCCCCACAG GCCCGACCGG TACTGCAGGA GCAGACGGCG CAACCGGCCC CACAGGTCCA ACTGGCACTG CTGGTGCAGA TGGTACAACC GGTCCCACTG GCCCAACTGG TACAACAGGT GTAGACGGTG CAACCGGCCC CACAGGTCCG ACTGGCACTG CAGGTGCAGA TGGTGCAACC GGTCCCACAG GTCCGACTGG CACTGCGGGT GCAGACGGCG CAACTGGCCC CACAGGTCCG ACTGGTACTG CAGGTGCAGA CGGTGCAACC GGTCCCACAG GTCCGACTGG CGCAACTGGG GAAGTCGTTT TGGCTTTTGG ATCTTTAAGA GGAAACAGTG TAGAGACACC TGGTGCAACA TTCACACCCG TACCATTTAA TATTGTTGGA CCTTTATCAG ATACCATCAC GGTTAGTCTA TCGGGTAATG AATTAGTAGT AGGAGAAAAC GGAATTTATC AAATAACGAT ATCTATTAAT GCTGAAGCCA CTGTTAATCC AGATCCAGAT CAACCATATT TAAATGCTAT TATCACTGTC AATGGTGCAC CTATTTTTGG CGATACTACC ACTTTTTTCA AGATATCTAA TAGAAGTAGT TCAACGTTTG CCGTTCAATC ATCCTTAACA GCAGGAGATG AAGTAGGAGT AAGTATTATT ACAGATTTTC CTGCTTTGGG TTATATGAAT CGCTCTTTAA CTATTGTTCA ATTAAGTAAT TAA
|
Protein sequence | MISMSSILIM PTGDTYIKKS SPNSNFSKKK CLIAGFGGCK KIYTSLIKFD IPQIPAGSEF IRAYLRLNVD DTDLADNVEI KVNRILSSFD TDTVTWDTSP SYIPTSIVFN VDCHQIGRLV EVNISELVRG WIDLQFPNYG IALTGKEGNK GLVAFSSSND EAMSRPQLII IYRFNIVGPT GPTGPHGKTG KTGKTGPTGP TGKTGKTGAT GPTGATGPTG TGATGPTGPT GSATGATGPT GPTGTAGTTG ATGPTGPTGI AGTSGATGPT GPTGTAGADG TTGPTGPTGI AGANGATGPT GPTGTAGANG ATGPTGPTGT AGADGAIGPT GPTGTGATGP TGPTGTAGTD GATGPTGPTG TAGTDGATGP TGPTGTAGAN GATGPTGTDG ATGPTGPTGT AGVDGATGPT GPTGTSGADG ATGPTGPTGT SGADGTTGPT GPTGTAGVDG ATGPTGPTGT SGSDGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGPTGPTGT AGVDGATGPT GPTGTSGSDG ATGPTGPTGT AGVDGATGPT GPTGTTGTDG ATGPTGPTGT AAADGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGPTGPTGT AGVDGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGVDG ATGPTGPTGT AGTDGATGPT GPTGTAGADG ATGPTGPTGT AGTDGATGPT GPTGTAGVDG ATGPTGPTGT AGADGATGPT GPTGTAGTDG ATGPTGPTGT AGTNGATGPT GPTGTAGADG TTGPTGPTGT AGTNGATGPT GPTGTAGVDG ATGPTGPTGT SGADGATGPT GPTGTAGTNG ATGPTGPTGT AGADGATGPT GPTGTAGTDG ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGATGPTGP TGTAGADGAT GPTGPTGTAG ADGATGPTGP TGTAGADGAT GPTGPTGTAG ADGATGPTGP TGTAGVDGAT GPTGPTGTAG ADGATGPTGP TGTAGADGAT GPTGPTGTAG ADGATGPTGP TGTAGVDGAT GPTGPTGTAG ADGTTGPTGP TGTAGADGAT GPTGPTGTAG ADGATGPTGP TGTAGVDGAT GPTGPTGTAG ADGATGPTGP TGTAGADGAT GPTGPTGTAG ADGATGPTGP TGTAGADGTT GPTGPTGTTG VDGATGPTGP TGTAGADGAT GPTGPTGTAG ADGATGPTGP TGTAGADGAT GPTGPTGATG EVVLAFGSLR GNSVETPGAT FTPVPFNIVG PLSDTITVSL SGNELVVGEN GIYQITISIN AEATVNPDPD QPYLNAIITV NGAPIFGDTT TFFKISNRSS STFAVQSSLT AGDEVGVSII TDFPALGYMN RSLTIVQLSN
|
| |