Gene Dtox_0807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_0807
Symbol
ID	8427745
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	819553
End bp	820992
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	43%
IMG OID	645033163
Product	VWA containing CoxE family protein
Protein accession	YP_003190338
Protein GI	258514116
COG category	[R] General function prediction only
COG ID	[COG3552] Protein containing von Willebrand factor type A (vWA) domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.0395672
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACAATC AAAAGTATAC TCAAATTCTT TCAGAAATAA GCAGCAAGGA TAATAAATCT 
TTGGAGTATA TGGTAGCCAG GTTTGCACAT ATCCTGAGAC ATTTGGATGT CCGGGTGAGC 
GCCTCAGAAA CCATAGATGC TTTAAGGGCT TTATCCATAA TTAACATCAT GGACAGAGAT 
CAAGTTAGAG CAGCTTTAAG AGGCACTCTG GTCAAAGGGG AAATGGAACA TAGAATTTTT 
GACCTGGCTT TTAATAATTT CTTTCTCCCG CCTGAAGAAA AAGCCAGCCT GCGCCTGGAA 
GAGAAGTTGG CCGAGCAGGA TCGTCTGGCC AGCCTGCAGG AAGCAGAGGA GGACTTTTTG 
GCCAGTATGC AGGACGGAGA GTTTCCCTGG AGTGAGGAAT TATTGAAGAA TATCAGGCTG 
ACCAGGGAGC AGAAAGAAAC TTATGCTCAC CTGCCGGAAA AAGAAAAGCA AAGATTAAAA 
GAAATCCTGA CCAGTTTCCA GGGCAATAAT ATCAACAATC CTGATACTTT GATAGCTCAG 
GTGGCCGAAT CTTCCTTAAA TTTCTGGCGT TATCATATGC TGAAGAATAA TGAGGATTTC 
GATGAGCCGG AGCCTCTTGC TCCAGACAGG TTAACCGGCG AGGAAGAGAT GGATGAGGTA 
ATCGAAAGAG TAAGCGCCGA GTTTTTCCGT GACGCGGGCG ATAATATAAT GTATCAGGAT 
ATGAAGAATA TTTCGGATGA AAACTTGCCC CGTGTCATGT CCCTGATCAA AAAGATGACC 
AAGAAGCTGG TAACAAGAGT TTCCCGCCGT ACCAGGTTCA GTAAAATGAA AAAAACCATA 
GACATCCGGC GCAGCATTCG CCAGAATATA AGTTACGGGG GCATTCCTCT GGAACTGCGC 
TACCGGGCCA AAAGGATTCA AAAGCCGCGC CTGTTATTGA TTTGTGACGT ATCTGCCTCC 
ATGGCCCGCT ACGCCAGGTT TGTGATCCAG TTTATATACG GTCTTTCCAA CGCGGTGAAA 
GATATTGAAA GTTTTATTTT TTCTGAGGAT CTGGAACGCA TAACCCCCAT GTTTAAAAGA 
AAAAAAGGTT TTGCTGATAC CATGACTGAA ATCATCAACC AGAGCGGCAT ATGGGGTCAG 
GCAACCGATT TTAACCGGTC ATTAGAGACT TTTGGGCAGA GATATCAAAA TTTATTAACA 
AGTGAAACAT ATTTGATAAT TATGAGCGAT ACAAAAACTC TGGCGGTTGA ACAGGCTGCT 
TTTCGCCTGA AGCAGATGAA AAAGAACCTC AGGGGTGTAA TATGGCTGAA TACTTTGCCC 
AGAAATGAAT GGATACAATA TAAATCAGTC TTTATTTTTC AACAGCAGTC CCGTATGTTT 
GAGTGCAATA CGCTGGCTCA CCTGGATAAA GTTATGCGCA GTCAAATTTT CTCTGTTTGA

Protein sequence

MNNQKYTQIL SEISSKDNKS LEYMVARFAH ILRHLDVRVS ASETIDALRA LSIINIMDRD 
QVRAALRGTL VKGEMEHRIF DLAFNNFFLP PEEKASLRLE EKLAEQDRLA SLQEAEEDFL 
ASMQDGEFPW SEELLKNIRL TREQKETYAH LPEKEKQRLK EILTSFQGNN INNPDTLIAQ 
VAESSLNFWR YHMLKNNEDF DEPEPLAPDR LTGEEEMDEV IERVSAEFFR DAGDNIMYQD 
MKNISDENLP RVMSLIKKMT KKLVTRVSRR TRFSKMKKTI DIRRSIRQNI SYGGIPLELR 
YRAKRIQKPR LLLICDVSAS MARYARFVIQ FIYGLSNAVK DIESFIFSED LERITPMFKR 
KKGFADTMTE IINQSGIWGQ ATDFNRSLET FGQRYQNLLT SETYLIIMSD TKTLAVEQAA 
FRLKQMKKNL RGVIWLNTLP RNEWIQYKSV FIFQQQSRMF ECNTLAHLDK VMRSQIFSV