Gene Dtox_1494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_1494
Symbol
ID	8428451
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	1547438
End bp	1549135
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	54%
IMG OID	645033825
Product	hypothetical protein
Protein accession	YP_003190981
Protein GI	258514759
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	1
Plasmid unclonability p-value	0.000000835765
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	38
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAAGAC GTCTCAACAT TATTCTTGTG TTTGTTCTGC TGATCTCCAT GCTTTTGCCT 
GTTACAGCCC TTGCCACCGA TGGTGAGGGC AACATAGACA ACGGCGGCGG CGGAATGGGC 
AGCGGGACCA ATGAAAATTA CTGGAATGGC GGTGATGAGG GCGTAAGAGT CACAGTGATT 
CGTGCCAGCG ACAGATCACC TGTTACCGTA CCTGTTGATT TCTCGAACAG GATGCCATCA 
ATAGCCGTAC ATTTTGGAAA GGTATCAAAA ATATCATATA CAGTGGGCAG AAGCTTGTCT 
CCTGTTACGA CAACGTATGT TTGTGAAAAG CCGGATATTG CTATGCCGAG AATAATAAGT 
ACAAGCAGCG GACAGGCCAG TATCGATCAG ATAAAACAAT ACTTCTGCTC AGAGTATATG 
GTCATGACGG TTGCTCAGAT TACAGGCATG AACTACGACA TTTTAACCAA CGGCGAATAT 
AAGCTCCTGC TGGAACCAAT CGCCTACATG ACTTTTCAGG GTGTGAAAAT GGCGATGACC 
GCGACCGAAG CCGCACTCTA CGACCAACAG CTGAACGGCG GCCTGCGGAG CAAGATGGTC 
TCACTCAGCC ATAAGAATCT GCCCTTGGCA ATGTTTCTTG AAACGCCTGA TCTCGGCTAC 
CCGGCATGGG GCGGCTCAAC GACCACGGCC GCGTCGAACA CAGACATTCT CTCATCCCTC 
GGCCTCGGTA TTGTGCGTTT CAACGAAGCG GAGCCGGAGC CTCCGGAGGT AACGGCGGCT 
GACTACGAGT ACAGGATTGA TACGGAGGTT GTCACATCGG TAACTGTTCG CGGAGGCCAG 
GCAGATCCCG ACCGTCCTGT CGCGGTCCGC TTCACAATTG GAGGCCAGAC ATATAATGTC 
GGCAGCATAT ACTACCCGGC AGGCGACAGC CAACTGGTAT GGGTGCGCTG GAGGACACCG 
TCCACCCCGC AGACCATGAC CATTCATGTG TCAGTATCGG GCGGAGGCTC CGCAAGTCAG 
GGGACCATTA CAGCGAGGAT CGTGGATCTC TCCGGAAACG AACCGCCCAA TCCGGTGGCC 
GATGACCGGA ATAATTCCTA CACGTTGGCC CCGATACCCA ACAAGGCACA GAAAACCTCT 
GCCTCCTGGG GCGTATGGCG TCCATGGTGG CATGCCCATT GGGTATGGAT TTCTACAGGT 
GAAGATAGCG GCTATTGGGA GGACGAGGGC TGGTGGGAGT TCGACTGGCT TTCATATAAC 
GCCAGCCTTT CATCCTCCAT GAATGTTGTA CCGGACGCCA AAGCCCCGAC CGCATCCGGA 
AACACTTTGA AAAGCGGATA CGGCATCAAT CAGTCTGTCA CCGCCAATGT CAGCACCAAC 
CAATCCTCGG CAGTTACCGA TGCGCAGACA GCCGTCACAT ATTTCCCCGA ATGGAGGTAC 
GAAACGTATT GGCGGCAGCT GGAGCGCACG CAGTCCGGAT ACAGCTCCAA ATTCGAGTTT 
AAGTCCAACA AATACTCAAC CTACAAGCGC CGGACGCATT TCACCCCCAT ATGGTTCCCC 
GATGGGAGCT ATACACCGTA TACCTGGCTC ATCGACTGCT GGACTCCGGT CGGTATGCTT 
TCCATGAACC TCACCGACTC GGTGACCATC CGGGGCAGCC TTTGGGATGA CTGGCACATT 
GCGCCAGTGA AACCGTAA

Protein sequence

MKRRLNIILV FVLLISMLLP VTALATDGEG NIDNGGGGMG SGTNENYWNG GDEGVRVTVI 
RASDRSPVTV PVDFSNRMPS IAVHFGKVSK ISYTVGRSLS PVTTTYVCEK PDIAMPRIIS 
TSSGQASIDQ IKQYFCSEYM VMTVAQITGM NYDILTNGEY KLLLEPIAYM TFQGVKMAMT 
ATEAALYDQQ LNGGLRSKMV SLSHKNLPLA MFLETPDLGY PAWGGSTTTA ASNTDILSSL 
GLGIVRFNEA EPEPPEVTAA DYEYRIDTEV VTSVTVRGGQ ADPDRPVAVR FTIGGQTYNV 
GSIYYPAGDS QLVWVRWRTP STPQTMTIHV SVSGGGSASQ GTITARIVDL SGNEPPNPVA 
DDRNNSYTLA PIPNKAQKTS ASWGVWRPWW HAHWVWISTG EDSGYWEDEG WWEFDWLSYN 
ASLSSSMNVV PDAKAPTASG NTLKSGYGIN QSVTANVSTN QSSAVTDAQT AVTYFPEWRY 
ETYWRQLERT QSGYSSKFEF KSNKYSTYKR RTHFTPIWFP DGSYTPYTWL IDCWTPVGML 
SMNLTDSVTI RGSLWDDWHI APVKP