Gene Dtox_1850 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_1850
Symbol
ID	8428829
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	+
Start bp	1964580
End bp	1965833
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	45%
IMG OID	645034186
Product	hypothetical protein
Protein accession	YP_003191320
Protein GI	258515098
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.182025
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.771462
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAATA ATATGGTTAT TCCGGCCAGT ACCCAGCAGT TAATAATGAA GGAACGGGAA 
AAGATGCTAA ATAATGTGGT CAAAGTTATT GGTCGCATTA GCGAGGAAAT AACCGCCAGC 
ATGGGGGCTG TTGCTGACGA TGAGGTTATC GTAGAGGTGC CTGTAGAGGA AACGAAAAGG 
CCAGAGATTG AAGCGACAAC CGTTGATACT GCCGAGTTAA TTAATACAGC TATTGAGAAA 
ACTTTAGATA GCCGGTTAAA AACGCTATTA CATGATGTTG ATTACCGGAT TAATCTACTC 
TACGACGTAT TAGAGAGGGC CGAGGGTAGA GGTAATAACC GGATAGGCAG CCGTGACCTG 
AACCTGGCTC ATCATATACT GGACGGCTTT ACTTTCAATA ATAACCAGCC GGTAGCAGGT 
TCCGTATCAT GGGTTGGTTG TCATGTTGTT TACAAAGGCA CCGACTATAC AATTACGGAT 
GGTAACAGCA ATAAAAAATA TATATACTGG GCCTTGGCTA CTCCGACTGT ATTTACAACC 
AGCGACACCA AACCGACCCT GACGCTGGAT GATGTTTTAA TCGGGACAAA CGAAGGTGGA 
ACCTTTTACC CCTTGTTAAC CCCTGGTAAA TTAACCACTG GCTCGACACT TGTTGACGGC 
ACTGTTGGCA CAAATGAAAT AGGGACTAAT GCGGTAACTG GTGCTAAGAT TGCAAACGGG 
GCTGTAGGTT CTGCCCATGT TGCTGATAAT GCTATTAGTG CCGCTAAAAT ATTGGACGGT 
GCTGTAGGAA CGGGTAAACT CGCTGCTAAC GCTGTAGACA ATACGATATT AGCCGCTAAT 
GCTGTTACCA GTGGTAAAAT CGCCACTGGT GCCATAAGTA ACTCTGCTGC CTTTGCTACA 
GGTGTAGTAA ATAATGCTGC CATAGCTGCT ACTGCTGTAG ACTCAGGTAA ACTGGCTACT 
GGTGCGGTAA CTGCTGGTAA AATTGCTTCC GGTGCAGTTA ATAACGCTAA CCTATTTACT 
GCCGGTGTTG TAAATGGCAC CGCATTAGCT ACGGGTGCTG TTACTGATGT AAAGATAGGA 
ACAGGGGCGG TTACTAACAC AAAAATTGCT GATAATGCGG TTGATACTAA TAAACTGGCC 
AATAATGCAG TAACTGCCGC CAATATTAGC GACGGTGCAG TTACTGGCAC GAAAATCGGG 
GCCGGGGCTA TTGGGGAATC AAAGTTAAAC CTGGCTACAC ATTTACTTTA TTAA

Protein sequence

MFNNMVIPAS TQQLIMKERE KMLNNVVKVI GRISEEITAS MGAVADDEVI VEVPVEETKR 
PEIEATTVDT AELINTAIEK TLDSRLKTLL HDVDYRINLL YDVLERAEGR GNNRIGSRDL 
NLAHHILDGF TFNNNQPVAG SVSWVGCHVV YKGTDYTITD GNSNKKYIYW ALATPTVFTT 
SDTKPTLTLD DVLIGTNEGG TFYPLLTPGK LTTGSTLVDG TVGTNEIGTN AVTGAKIANG 
AVGSAHVADN AISAAKILDG AVGTGKLAAN AVDNTILAAN AVTSGKIATG AISNSAAFAT 
GVVNNAAIAA TAVDSGKLAT GAVTAGKIAS GAVNNANLFT AGVVNGTALA TGAVTDVKIG 
TGAVTNTKIA DNAVDTNKLA NNAVTAANIS DGAVTGTKIG AGAIGESKLN LATHLLY