Gene Dtox_0148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0148
Symbol
ID	8427071
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	164800
End bp	167097
Gene Length	2298 bp
Protein Length	765 aa
Translation table	11
GC content	47%
IMG OID	645032539
Product	YD repeat protein
Protein accession	YP_003189729
Protein GI	258513507
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3209] Rhs family protein
TIGRFAM ID	[TIGR01643] YD repeat (two copies)

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	30
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAAAATGA CTGCGGCGGG AACCACCTAT CAGGACGTTC CCACCTACGC AGGGGAGCCG 
CTAACCTTAT CCGGCATGAT TAATACCAGC GGTGTCAGCG GCAGTGGTGC CTGCTATCGG 
ATCGACTACT ATGACGCCTC GAACAACCTG ATCTCCGGGA CTTCCGTACA AACCGCCTGT 
ATCAGCGGAA CTCAGGGCTG GACAAGAATG GCAAGTATGG CCAACGCTCC TGCAAATGCC 
AATTACGCCC GGCTCCAATG CATACTAAAC GGCAGCGGTA CAGCCTATTT CGACGACGTG 
AAATTGACAC CTATAAACAG CATGCAATAT ACTTACGATA AGACCAGCGA CTATACCAAT 
CCCGGCAGCT ATACCGGAGG AAACTACATG ACCCTCTCGG AAGATGCCCT GGGTATTCAA 
AATGCTTACG CATACGATGC AAACGTCGGC AACATGATAG GACATGCCGA TCCTCTAAAT 
CATATTACCT GGTTTAACTA TGACACCCTG AACCGTCTCA TCAGAGTAAC AGATCCTTTA 
AATCGCAAAG CCTATTACCA GTACGATCCC GTAAGCAACC TGATTTATAC ACGAGATCCC 
AGAAGCGCGT CATCATCGGA CAACACCTAC AGCACATTCT ACGGGCCAAA CAACCTGAAC 
CGGCTTTCTG CCCTGACCGA TTCACAGAAC CGGAGCGCCA CCTATACCTA TGACAGATCC 
GGCAACCTGA CGGGAATTGC CCTGCCCAAC GGCCAAAGCG AAAGCCTGGA ATATGATAAC 
GCCAACCGCC TGAGCAAAAT TACACTAAGT GATGGCAAAT ACTATAACTA TTACTATGAC 
GGAGCCGGAG AACTGATCAG CGTTACAGAT CAAAACGGAG CCGGTTGCTC CTGGAACTAC 
GACGGAGCAC ACAGAGTAAC CGGTACAACA GATCCCTTAG GCTATCAGCT TAACTACTCC 
CTGGATAAAA GCGGCAATCT TACACTCCAA TCCGGCATCA ACTACAGTTG CCGCTACAAC 
TATGACAATG GCAATAAAAT GTACAAAGTA TCCCTGCCCG GTGCAATAAT CTACTATGGC 
CGAGATGACC AAGGGCGTGT TTTTAACGTT GAGTACAACC CGTCCTACAT TGTTAATCAC 
CAACCGCATT ACGCCACCAG CCAAAGAATA ATCAACTATC TGGTCAACGG TTGGTGCAGC 
AGTATTCAGG ATCAGTACTT TCCCTATCGA TCCGGTTACT CCTACGGTTA CTATGCTGAC 
GGTACTATCT CCGGCTACAG CTCGTGGAAC GGCACACACA GTTTCAGCTA TGATGTTGAC 
GGTAGGCTTG CCTCCTGGAC ACACGGAGGA ATTCAACAGA ATTACACATA TGATGCCGCC 
GGCAACCTCA CGACCAAAGG AAACAGGACA TTTGCCTACA ACAACATCAA CGAGATCACG 
AGTCCGGGCT TCACCTACGA TCAAAACGGC AACATGACCG GCGACGGCAG CTTCAATTAT 
ACCTACAACG CCTTGAATCA GCTCGTCCGG GTCAATAAGG TATCCGACGG AAGCCTTGTG 
GCCACCTATA CCTACAACCA CGACGGTACC AGGAGAAATA AAGTCACCGC TCAAGGAACA 
ACCAACTACA ACTGGGATGC CTCCGGGAAC TTAATCAGGG AAATCGGCCC CAATGGTACC 
TATTGTTACT ACTATCCCTT GGGTAAACTA ATCGCCTTCA AGAATAACCA GCAGTTGTAT 
ATAGTGCACG ATAACCTGCG GGGTGATGTC ATCAGCTTAT CAATGACGGA TGACTACGGA 
AACACAGATC AGGAAAACAT GTATGACTAC GACCCATGGG GCACTCCTAT CTGCGAGGAT 
GAATCGGTAA AGTCACCCTT CCGCTACGCC GGTTATTACT ATGATACTGA GACGGGATTG 
TATTATTTAA AGAGCAGGTA TTACAGCCCG GCGTTGGGGA GGTTTTTGAC GAGGGACGAT 
CATAGTTATA TAAAGGATAA AGACCCACAA ACGATGAACC TTTATAGTTA TGCTGGTAAC 
AATCCTGTAA GTAACGTAGA TCCGACAGGG GAGATTCCTG TTTACGCAAC CTGGAAAGCA 
TTTGAAGACA AACTTGGGGA ATTACTTAAT ACTAGCAAAA ATTGGTCAAA AGGATATGGA 
AACAGAATTG TTGATTACAT CACAAAGACA GGAGAAGCTT GGGAAGCCAA ATCGGGTGAG 
TATATATCGA ATAGCCCACA GTTAAGAGAT TTTATGAGAC AATTTGGAGA TAAGTTTAGA 
TTATATAGAA ACGATTAA

Protein sequence

MKMTAAGTTY QDVPTYAGEP LTLSGMINTS GVSGSGACYR IDYYDASNNL ISGTSVQTAC 
ISGTQGWTRM ASMANAPANA NYARLQCILN GSGTAYFDDV KLTPINSMQY TYDKTSDYTN 
PGSYTGGNYM TLSEDALGIQ NAYAYDANVG NMIGHADPLN HITWFNYDTL NRLIRVTDPL 
NRKAYYQYDP VSNLIYTRDP RSASSSDNTY STFYGPNNLN RLSALTDSQN RSATYTYDRS 
GNLTGIALPN GQSESLEYDN ANRLSKITLS DGKYYNYYYD GAGELISVTD QNGAGCSWNY 
DGAHRVTGTT DPLGYQLNYS LDKSGNLTLQ SGINYSCRYN YDNGNKMYKV SLPGAIIYYG 
RDDQGRVFNV EYNPSYIVNH QPHYATSQRI INYLVNGWCS SIQDQYFPYR SGYSYGYYAD 
GTISGYSSWN GTHSFSYDVD GRLASWTHGG IQQNYTYDAA GNLTTKGNRT FAYNNINEIT 
SPGFTYDQNG NMTGDGSFNY TYNALNQLVR VNKVSDGSLV ATYTYNHDGT RRNKVTAQGT 
TNYNWDASGN LIREIGPNGT YCYYYPLGKL IAFKNNQQLY IVHDNLRGDV ISLSMTDDYG 
NTDQENMYDY DPWGTPICED ESVKSPFRYA GYYYDTETGL YYLKSRYYSP ALGRFLTRDD 
HSYIKDKDPQ TMNLYSYAGN NPVSNVDPTG EIPVYATWKA FEDKLGELLN TSKNWSKGYG 
NRIVDYITKT GEAWEAKSGE YISNSPQLRD FMRQFGDKFR LYRND