Gene Dtox_3124 details

Gene Information       Plasmid Coverage information       Fosmid Coverage information       Sequence       

Gene Information

Locus tagDtox_3124 
Symbol 
ID8430118 
TypeCDS 
Is gene splicedNo 
Is pseudo geneNo 
Organism nameDesulfotomaculum acetoxidans DSM 771 
KingdomBacteria 
Replicon accessionNC_013216 
Strand
Start bp3327228 
End bp3331970 
Gene Length4743 bp 
Protein Length1580 aa 
Translation table11 
GC content60% 
IMG OID645035379 
ProductCollagen triple helix repeat protein 
Protein accessionYP_003192498 
Protein GI258516276 
COG category 
COG ID 
TIGRFAM ID 


Plasmid Coverage information

Num covering plasmid clones
Plasmid unclonability p-value
Plasmid hitchhikingNo 
Plasmid clonabilitynormal 
 

Fosmid Coverage information

Num covering fosmid clones31 
Fosmid unclonability p-value
Fosmid HitchhikerNo 
Fosmid clonabilitynormal 
 

Sequence

Gene sequence
TTGATTTCTA TGTCCTCTAT ATTGATAATG CCAACTGGAG ACACTTATAT TAAAAAATCA 
TCTCCAAATA GTAACTTTTC CAAAAAAAAA TGTCTTATTG CAGGTTTCGG GGGCTGCAAA
AAAATATATA CTAGTTTGAT AAAATTTGAC ATTCCCCAGA TTCCTGCAGG GAGTGAGTTT
ATTCGTGCTT ATTTAAGGCT TAATGTTGAT GATACTGATC TAGCAGATAA TGTTGAAATA
AAGGTAAACA GGATATTATC TAGTTTTGAT ACGGATACAG TTACATGGGA CACTTCTCCC
TCATATATAC CAACATCAAT TGTATTTAAT GTTGACTGCC ATCAAATAGG CCGATTAGTC
GAAGTAAACA TAAGTGAATT GGTACGAGGC TGGATAGATC TGCAATTTCC CAATTATGGT
ATTGCACTAA CAGGAAAAGA GGGTAATAAA GGTCTTGTAG CCTTTTCAAG TTCTAATGAC
GAGGCAATGA GTAGACCACA ACTAATTATA ATATACCGAT TTAATATTGT TGGCCCCACA
GGTCCGACTG GTCCGCATGG TAAAACAGGT AAAACCGGTA AAACCGGTCC CACAGGCCCG
ACTGGCAAAA CAGGTAAAAC AGGAGCAACC GGTCCCACAG GCGCAACTGG TCCTACAGGC
ACTGGCGCAA CCGGCCCCAC AGGTCCAACT GGCAGTGCAA CAGGAGCAAC TGGCCCCACG
GGTCCTACAG GCACTGCAGG CACAACAGGT GCAACCGGTC CCACAGGTCC AACTGGTATA
GCAGGTACAA GCGGCGCAAC CGGCCCCACT GGTCCGACCG GTACTGCGGG TGCAGACGGT
ACAACCGGCC CCACAGGCCC GACTGGCATT GCGGGTGCAA ATGGCGCAAC CGGCCCCACA
GGCCCGACAG GTACTGCGGG TGCAAATGGC GCAACCGGCC CCACAGGTCC TACGGGTACT
GCGGGTGCAG ATGGCGCAAT CGGCCCTACA GGTCCCACGG GCACTGGTGC AACCGGTCCC
ACAGGTCCTA CAGGTACCGC AGGAACAGAC GGTGCAACCG GCCCCACAGG TCCCACCGGT
ACTGCAGGAA CAGACGGTGC AACCGGCCCC ACAGGCCCGA CAGGTACTGC GGGTGCAAAT
GGCGCAACCG GTCCCACTGG TACAGATGGC GCAACCGGTC CCACAGGTCC CACCGGTACT
GCAGGAGTAG ACGGTGCAAC AGGCCCCACA GGTCCTACTG GCACTTCTGG TGCAGATGGT
GCAACCGGTC CCACAGGTCC CACCGGCACT TCTGGTGCAG ATGGCACAAC TGGTCCCACA
GGTCCTACCG GTACTGCAGG AGTAGACGGT GCAACCGGCC CCACGGGTCC TACCGGCACT
TCTGGTTCAG ATGGTGCAAC CGGCCCCACA GGCCCGACAG GTACTGCGGG TGCAGACGGA
GCAACCGGCC CCACTGGTCC TACCGGTACT GCAGGAGCAG ACGGTGCAAC CGGTCCCACT
GGCCCGACCG GTACTGCAGG AGCAGACGGC GCAACCGGTC CCACGGGCCC GACCGGTACT
GCAGGAGCAG ACGGCGCAAC CGGTCCCACG GGTCCGACTG GCACTGCAGG AGCAGACGGT
GCAACCGGCC CCACAGGCCC GACTGGTACT GCAGGTGCAG ATGGCGCAAC CGGCCCCACA
GGTCCCACTG GCACTGCAGG TGCAGATGGC GCAACCGGCC CCACAGGCCC GACAGGTACT
GCGGGTGCAG ACGGCGCAAC CGGCCCAACT GGTCCGACCG GTACTGCGGG TGCAGATGGT
GCAACCGGTC CCACAGGTCC TACCGGTACT GCAGGAGTAG ACGGTGCAAC AGGCCCCACG
GGTCCTACCG GCACTTCTGG TTCAGATGGT GCAACCGGCC CTACAGGTCC CACGGGCACT
GCGGGAGTAG ACGGTGCAAC CGGTCCCACA GGTCCTACTG GTACCACAGG AACAGACGGT
GCAACCGGCC CCACAGGCCC GACTGGCACT GCTGCTGCAG ACGGCGCAAC TGGTCCCACA
GGCCCGACAG GTACTGCGGG TGCAGACGGC GCAACCGGCC CAACTGGTCC GACCGGCACT
GCAGGAGCAG ACGGTGCAAC CGGCCCCACA GGTCCTACTG GTACTGCGGG TGCAGATGGC
GCAACCGGTC CCACAGGTCC CACCGGTACT GCAGGAGTAG ACGGTGCAAC AGGCCCCACA
GGCCCGACAG GTACTGCGGG TGCAGACGGC GCAACCGGCC CAACTGGTCC GACCGGTACT
GCGGGTGCAG ATGGTGCAAC CGGCCCAACT GGTCCGACCG GCACTGCAGG AGCAGACGGT
GCAACCGGCC CCACAGGTCC TACTGGTACT GCGGGTGCAG ATGGCGCAAC CGGCCCTACA
GGTCCCACGG GCACTGCGGG AGTAGACGGT GCAACCGGCC CCACAGGTCC TACAGGTACC
GCAGGAACAG ACGGTGCAAC CGGCCCCACA GGCCCGACTG GCACTGCTGG TGCAGACGGC
GCAACCGGTC CCACAGGTCC GACTGGCACT GCTGGTACAG ATGGCGCAAC CGGTCCCACA
GGTCCTACCG GTACTGCAGG AGTAGACGGT GCAACAGGCC CCACGGGTCC GACTGGCACT
GCTGGTGCAG ATGGTGCAAC CGGTCCCACA GGTCCCACTG GCACTGCTGG TACAGATGGC
GCAACCGGTC CCACAGGTCC CACCGGCACT GCTGGTACAA ATGGCGCAAC TGGTCCCACA
GGTCCTACTG GTACTGCTGG TGCAGACGGC ACAACCGGTC CCACAGGTCC CACCGGCACT
GCTGGTACAA ATGGCGCAAC TGGTCCCACA GGTCCTACAG GTACTGCAGG AGTAGACGGT
GCAACCGGCC CCACGGGTCC GACTGGCACT TCTGGTGCAG ACGGCGCAAC CGGCCCCACA
GGTCCTACTG GTACTGCTGG AACAAACGGT GCAACCGGCC CCACAGGTCC TACTGGTACT
GCTGGTGCAG ACGGCGCAAC CGGCCCCACA GGTCCAACTG GTACAGCAGG AACAGACGGT
GCAACCGGCC CCACAGGTCC GACTGGTACT GCAGGAGCAG ACGGTGCAAC CGGTCCCACA
GGTCCAACTG GCACTGCTGG TGCAGACGGT GCAACCGGTC CCACAGGTCC TACTGGTACT
GCTGGTGCAG ACGGTGCAAC CGGCCCCACA GGCCCGACTG GCACTGCTGG TGCAGACGGC
GCAACCGGCC CCACAGGTCC TACTGGTACT GCTGGTGCAG ACGGTGCAAC CGGTCCCACA
GGTCCTACTG GTACTGCTGG TGCAGACGGT GCAACCGGTG CAACCGGTCC CACTGGCCCA
ACTGGTACTG CAGGTGCAGA TGGTGCAACC GGCCCCACAG GTCCTACTGG TACTGCTGGT
GCAGACGGTG CAACCGGCCC CACAGGTCCT ACTGGCACTG CTGGTGCAGA TGGCGCAACC
GGCCCCACAG GTCCTACTGG CACTGCTGGT GCAGATGGCG CAACCGGCCC CACAGGTCCG
ACCGGCACTG CAGGTGTAGA CGGCGCAACC GGCCCCACTG GTCCGACCGG CACTGCTGGT
GCAGACGGCG CAACCGGCCC CACAGGTCCT ACTGGTACTG CTGGTGCAGA CGGCGCAACC
GGCCCCACAG GTCCGACTGG CACTGCAGGT GCAGACGGCG CAACCGGTCC CACTGGCCCA
ACTGGTACAG CAGGTGTAGA CGGTGCAACC GGCCCCACAG GCCCGACAGG TACTGCAGGT
GCAGACGGTA CAACCGGCCC CACAGGTCCG ACCGGCACTG CTGGTGCAGA TGGCGCAACC
GGCCCCACTG GCCCGACTGG CACTGCTGGT GCAGACGGTG CAACCGGCCC CACAGGTCCG
ACTGGTACTG CTGGTGTAGA CGGCGCAACC GGCCCCACGG GTCCGACCGG CACTGCTGGT
GCAGACGGCG CAACCGGCCC CACTGGCCCG ACCGGCACTG CTGGTGCAGA TGGCGCAACC
GGCCCCACAG GCCCGACCGG TACTGCAGGA GCAGACGGCG CAACCGGCCC CACAGGTCCA
ACTGGCACTG CTGGTGCAGA TGGTACAACC GGTCCCACTG GCCCAACTGG TACAACAGGT
GTAGACGGTG CAACCGGCCC CACAGGTCCG ACTGGCACTG CAGGTGCAGA TGGTGCAACC
GGTCCCACAG GTCCGACTGG CACTGCGGGT GCAGACGGCG CAACTGGCCC CACAGGTCCG
ACTGGTACTG CAGGTGCAGA CGGTGCAACC GGTCCCACAG GTCCGACTGG CGCAACTGGG
GAAGTCGTTT TGGCTTTTGG ATCTTTAAGA GGAAACAGTG TAGAGACACC TGGTGCAACA
TTCACACCCG TACCATTTAA TATTGTTGGA CCTTTATCAG ATACCATCAC GGTTAGTCTA
TCGGGTAATG AATTAGTAGT AGGAGAAAAC GGAATTTATC AAATAACGAT ATCTATTAAT
GCTGAAGCCA CTGTTAATCC AGATCCAGAT CAACCATATT TAAATGCTAT TATCACTGTC
AATGGTGCAC CTATTTTTGG CGATACTACC ACTTTTTTCA AGATATCTAA TAGAAGTAGT
TCAACGTTTG CCGTTCAATC ATCCTTAACA GCAGGAGATG AAGTAGGAGT AAGTATTATT
ACAGATTTTC CTGCTTTGGG TTATATGAAT CGCTCTTTAA CTATTGTTCA ATTAAGTAAT
TAA
 
Protein sequence
MISMSSILIM PTGDTYIKKS SPNSNFSKKK CLIAGFGGCK KIYTSLIKFD IPQIPAGSEF 
IRAYLRLNVD DTDLADNVEI KVNRILSSFD TDTVTWDTSP SYIPTSIVFN VDCHQIGRLV
EVNISELVRG WIDLQFPNYG IALTGKEGNK GLVAFSSSND EAMSRPQLII IYRFNIVGPT
GPTGPHGKTG KTGKTGPTGP TGKTGKTGAT GPTGATGPTG TGATGPTGPT GSATGATGPT
GPTGTAGTTG ATGPTGPTGI AGTSGATGPT GPTGTAGADG TTGPTGPTGI AGANGATGPT
GPTGTAGANG ATGPTGPTGT AGADGAIGPT GPTGTGATGP TGPTGTAGTD GATGPTGPTG
TAGTDGATGP TGPTGTAGAN GATGPTGTDG ATGPTGPTGT AGVDGATGPT GPTGTSGADG
ATGPTGPTGT SGADGTTGPT GPTGTAGVDG ATGPTGPTGT SGSDGATGPT GPTGTAGADG
ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG
ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG
ATGPTGPTGT AGVDGATGPT GPTGTSGSDG ATGPTGPTGT AGVDGATGPT GPTGTTGTDG
ATGPTGPTGT AAADGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG
ATGPTGPTGT AGVDGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG
ATGPTGPTGT AGADGATGPT GPTGTAGVDG ATGPTGPTGT AGTDGATGPT GPTGTAGADG
ATGPTGPTGT AGTDGATGPT GPTGTAGVDG ATGPTGPTGT AGADGATGPT GPTGTAGTDG
ATGPTGPTGT AGTNGATGPT GPTGTAGADG TTGPTGPTGT AGTNGATGPT GPTGTAGVDG
ATGPTGPTGT SGADGATGPT GPTGTAGTNG ATGPTGPTGT AGADGATGPT GPTGTAGTDG
ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGPTGPTGT AGADGATGPT GPTGTAGADG
ATGPTGPTGT AGADGATGPT GPTGTAGADG ATGATGPTGP TGTAGADGAT GPTGPTGTAG
ADGATGPTGP TGTAGADGAT GPTGPTGTAG ADGATGPTGP TGTAGVDGAT GPTGPTGTAG
ADGATGPTGP TGTAGADGAT GPTGPTGTAG ADGATGPTGP TGTAGVDGAT GPTGPTGTAG
ADGTTGPTGP TGTAGADGAT GPTGPTGTAG ADGATGPTGP TGTAGVDGAT GPTGPTGTAG
ADGATGPTGP TGTAGADGAT GPTGPTGTAG ADGATGPTGP TGTAGADGTT GPTGPTGTTG
VDGATGPTGP TGTAGADGAT GPTGPTGTAG ADGATGPTGP TGTAGADGAT GPTGPTGATG
EVVLAFGSLR GNSVETPGAT FTPVPFNIVG PLSDTITVSL SGNELVVGEN GIYQITISIN
AEATVNPDPD QPYLNAIITV NGAPIFGDTT TFFKISNRSS STFAVQSSLT AGDEVGVSII
TDFPALGYMN RSLTIVQLSN