Gene Dtox_3607 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dtox_3607
Symbol
ID	8430613
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfotomaculum acetoxidans DSM 771
Kingdom	Bacteria
Replicon accession	NC_013216
Strand	-
Start bp	3803254
End bp	3804444
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	49%
IMG OID	645035835
Product	hypothetical protein
Protein accession	YP_003192942
Protein GI	258516720
COG category	[S] Function unknown
COG ID	[COG3825] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTAATG ATTTTTTTTA TACCCTCAGG CAGGAGGGGG TGCCGGTCAC TCCTACCGAA 
TGGATGACAC TGCACGAAGG TTTAAAAATG GGTTTAGCCT TTTCCGGGCT GACTGGTTTT 
TATTATCTGG GGCGGGCCTG CCTGGTAAAA AGCGAGGCCC ATTATGACCG CTATGATTTG 
GCCTTTCAAC GCTGTTTTGG TCAAATTAAT ACTCCGGAAG ATTTTTTGGA AAAGGTCTTG 
GCCTGGTTAG AGAGTGAATT GCCGCCTTTG GAAACGGAGG AGAGTTCTCC TTTCAAAGCC 
TGGAACCTGG AAGAATTGCG CCTGCTGCTG GAAGACCGGC TGAACCGCCA GGAGGAGAAA 
CACGAGGGTG GCTCGCACTG GATTGGTCCC GGGGGACACT CTCGTCTGGG TCACTCCGGC 
ATTAATCCTG TCGGGCTGAG AATTGACGGG CAGTCTGTAA ACAACAGCGC GGTAAAGGTT 
GCCGGCCAAA GAAAGTACAA GGAACTGCGC ACAGATGAGA CCTTGGAGAC CAGGCATTTT 
GAGGTGGCGC TGCGCAAGCT GAGGCAGCTT ACTACCAGAG AAGACGGTCC ACTGGACGAA 
CTGGATTTGG ATGGGACTAT AGATGCTACC TGCCAAAACG GTGGTTTCCT GAAACTGGAT 
TGGCGCAGGC CGCGCAGGAA TGAACTGAAG GTGGCGCTTT TTATGGATTC AGGCGGATCT 
ATGACTCCCT ATGTGCATAT TGTCAAACGG CTTTTTACCG CCGTAAATAA ATCCAGCCAT 
TTTAAGGATT TGCAGTTCTA TTATTTTCAC AATTGTATTT ACGAAAGAAT TTATGCTAAC 
TCTATGTGTG TGCCCCGTGA TTCTGTGTCT ACCCGCGAGA TACTGAAAAA GCTTGCTTCC 
GACTATCGTA TAATTATAGT TGGCGACGCC AGCATGTCTC CGGGTGAACT GATTATGACG 
GGTGGGGCCA TTGATTGGGG AGTCAGTAAA AATGAGCCAG GCCTGGCCTG GTTGAAAAGG 
TTTTCTAACC GTTTTAGGTA TGCAGCCTGG TTGAATCCGA AACCGGAAAA AAATTGGCAC 
AGCACTGACG GGGCGGAGAC AATAGCCCTT ATACGCCGTT ATTTTTCTAT GTTTGAGTTA 
ACAGTGGAGG GTTTGGAAAG AGCTGTTAAG CGGCTCAAAG TCAGCCGTTA A

Protein sequence

MFNDFFYTLR QEGVPVTPTE WMTLHEGLKM GLAFSGLTGF YYLGRACLVK SEAHYDRYDL 
AFQRCFGQIN TPEDFLEKVL AWLESELPPL ETEESSPFKA WNLEELRLLL EDRLNRQEEK 
HEGGSHWIGP GGHSRLGHSG INPVGLRIDG QSVNNSAVKV AGQRKYKELR TDETLETRHF 
EVALRKLRQL TTREDGPLDE LDLDGTIDAT CQNGGFLKLD WRRPRRNELK VALFMDSGGS 
MTPYVHIVKR LFTAVNKSSH FKDLQFYYFH NCIYERIYAN SMCVPRDSVS TREILKKLAS 
DYRIIIVGDA SMSPGELIMT GGAIDWGVSK NEPGLAWLKR FSNRFRYAAW LNPKPEKNWH 
STDGAETIAL IRRYFSMFEL TVEGLERAVK RLKVSR