Gene Daro_3128 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3128
Symbol
ID	3568179
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3371713
End bp	3373434
Gene Length	1722 bp
Protein Length	573 aa
Translation table	11
GC content	62%
IMG OID	637681599
Product	sulfate thiol esterase SoxB
Protein accession	YP_286328
Protein GI	71908741
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0737] 5'-nucleotidase/2',3'-cyclic phosphodiesterase and related esterases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	0.304524
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATGA ATCGTCGTGA ATTCCTTCAG GTCATGGCCG TTGCCGCAGC CGGCGGCATG 
TCCCTGCACA GCGAGCTGGC CATGGCCGAA AAAGGCGCCG CCAAGCTGTA CGACCTGCCC 
AAATTCGGCA ATGTCAGCCT GTTGCATATC ACCGACTGTC ATGCCCAGTT GCTGCCCATC 
TACTTCCGCG AACCGAACGT CAATCTCGGT TTCGGCGACC AGTTCGGCAA GGTGCCGCAC 
CTGGTGGGTG ACAACCTGCT CAAGCATTTC GGTTTCAAAC CGAACACCAT CGAGGCGCAC 
GCCTATACCT ATCTGAATTT CGAGCAGGCC GCCAAGACCT ACGGCAAGGT CGGCGGCTTT 
GCCCACCTCG CCACGCTGGT CAAGCGCATG AAAGCCAATC GGCCCGGCGC GCTGCTGCTC 
GACGGCGGCG ACACCTGGCA AGGCTCCGGC ACGGCGCTGT GGTCGAACGC GCAGGACATG 
GTCGACGCCT GCAAGGCGCT CGGCGTCAAT GTCATGACCC TGCACTGGGA ATCGACCTAC 
GGCGAGGCCC GGGTCAAGGA AATCGAGGAA AAGGATTTCG CCGGCCAGAT CGACATCGTC 
GCCCAGAACG TCAAGACCAC CGATTTCGGC GATGCCGTCT TCAAGCCCTT CGTGATGAAG 
AACATGAACG GCGTGCCGGT CGCCATCATC GGCCAGGCCT TCCCCTACAC GCCGATTGCC 
AACCCGCGCT GGCAGACGCC GAACTGGAGC TTCGGCATCC AGGAAGAGAA CATGCAGAAG 
ACCGTCGACG AAGCCCGCGC CGCCGGTGCG CAGGTCGTTG TCGTGCTGTC GCACAACGGC 
ATGGACGTGG ACCTCAAGAT GGCTTCGCGC ATCAAGGGTA TCGACGCCAT CCTCGGCGGC 
CACACCCACG ACGGCATGCC GGCACCGGTC GTTGTCAAGA ATGCCGGTGG CCAGACTCTG 
GTCACCAATG CCGGCTCCAA CGGCAAGTAC CTCGGTGTGC TCGATTTCGA CGTCAAGAAT 
GGCAAGATCG CCGACTTCCG CTACAAACTG CTGCCGGTCT TCGCCAACCT GCTGCCGGCC 
GACAAGGACA TGCAGACGTT GATCGACAAG GCGCGTGCAC CGTACCTGTC CAAGCTCAAC 
GAAAAGTTGG CCATCTCCGA AGGCACGCTG TATCGCCGCG GCAATTTCAA CGGCACCTTC 
GATCAGGTCA TTCTCGATGC GCTGATGAAG GTCAAGGACG CCGAAATCGC CTTCTCGCCC 
GGCTTCCGCT GGGGCACCTC GCTGCTGCCC GGCCAGCCCA TCCTGATGGA ACACGTGCTC 
GACCAGACCG CGATCACTTA CCCATGGACG ACGGTGACCA ACATGAGCGG CGAGATGATC 
AAAACGGTGC TCGAAGATGT CTGCGACAAC CTGTTCAATC CGGACCCGTA CTACCAGCAA 
GGGGGCGACA TGGTGCGCGT TGGCGGCCTG CAATGGACCT GCGAGCCGAC CGCCAGGATG 
GGCCAGCGCA TCCAGAACAT GATGCTCAAG GGCAAGCCCA TTGACCCAGC CAAGACCTAC 
AAGGTCGCGG GCTGGGCGCC GGTATCCGAG GAGGCCAAGG GGTCTGGCGC GCCGATTTGG 
GACGTTGTGG CCGAATACCT CCGCGACATC AAGACCGTCA AACCGGTGAG TCTCAACCTG 
CCGACCCTGA AGGGCGCGGC GAACAACCCG GGGATTGCAT GA

Protein sequence

MSMNRREFLQ VMAVAAAGGM SLHSELAMAE KGAAKLYDLP KFGNVSLLHI TDCHAQLLPI 
YFREPNVNLG FGDQFGKVPH LVGDNLLKHF GFKPNTIEAH AYTYLNFEQA AKTYGKVGGF 
AHLATLVKRM KANRPGALLL DGGDTWQGSG TALWSNAQDM VDACKALGVN VMTLHWESTY 
GEARVKEIEE KDFAGQIDIV AQNVKTTDFG DAVFKPFVMK NMNGVPVAII GQAFPYTPIA 
NPRWQTPNWS FGIQEENMQK TVDEARAAGA QVVVVLSHNG MDVDLKMASR IKGIDAILGG 
HTHDGMPAPV VVKNAGGQTL VTNAGSNGKY LGVLDFDVKN GKIADFRYKL LPVFANLLPA 
DKDMQTLIDK ARAPYLSKLN EKLAISEGTL YRRGNFNGTF DQVILDALMK VKDAEIAFSP 
GFRWGTSLLP GQPILMEHVL DQTAITYPWT TVTNMSGEMI KTVLEDVCDN LFNPDPYYQQ 
GGDMVRVGGL QWTCEPTARM GQRIQNMMLK GKPIDPAKTY KVAGWAPVSE EAKGSGAPIW 
DVVAEYLRDI KTVKPVSLNL PTLKGAANNP GIA