Gene Daro_3693 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3693
Symbol
ID	3567905
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3968987
End bp	3969985
Gene Length	999 bp
Protein Length	332 aa
Translation table	11
GC content	56%
IMG OID	637682166
Product	thiosulphate-binding protein
Protein accession	YP_286892
Protein GI	71909305
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1613] ABC-type sulfate transport system, periplasmic component
TIGRFAM ID	[TIGR00971] sulfate/thiosulfate-binding protein

Plasmid Coverage information

Num covering plasmid clones	64
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCAAT TCCGCAAATC GATTACCGCA ATTTTGTTAA GCCTGGTGGC AGGCGCTGCA 
CTGGCTGATT CGACGTTGCT CAACGCATCC TATGATGTTG CTCGCGATGT TTATAAAGAC 
TACAACCCGA TGTTCCAGAA GTATTGGAAG GCCAAGACTG GCGAGAGCAT CGAACTGAAA 
CAATCGCACG GCGGTTCGAC CAAGCAGGTG CGGGCCGTGG CCGATGGCCT GGAGGCCGAT 
GTGGTGACCA TGAATCAGGC CAACGATATT GAATTCCTGG CCGACAAAGG TCTGGTTGCC 
AAGGATTGGG CCAAGAAATT CCCGAACAAT GCCTCGCCTT ATACGTCGAC GATGGTTTTC 
ATCGTGCGCA AGGGCAACCC GAAGGTCCTC AAGGACTGGA ACGACATCGC TGCTCCCGGC 
GTTCAGATGA TCATTCCGCA TCCGAAGAAT ACCGGCAACG GCCGCAACAC CTATTTGTCG 
GCCTGGGCCT GGGCGTTGAA GCGGCCGGGC GGCAATGACA AGACGGCGCA GGAATTTCTC 
GGCAAATTGC TGAAAAATGC CCCGCTGTTC GCCGCCGGTG GCCGTGACGC GACGACGACC 
TTCATGCAGC GCCGGATGGG CGATGTGCTG ATTACCTTCG AATCCGAAGC CGAGATGATT 
GCCAAGGAGT TCGGCAAGGG TGAGTTCGAA GTGGTGTACC CCAGCCTGAC CATGCAGACC 
GAGTTCCCGG TGGCGCTGGT CGAGAAGGTG GTCGACAAAA AGGGCACCCG CAAGCAGGCT 
CAGGCTTATC TGGAATACCT GTGGTCAAAG GAGGGGCAGG AAAATGCCGC CCAGAACTAC 
CTGCGGCCAC GTGATGCCGA ATTGCTGAAG AAGTACGCTG CCTTCTTTCC CCCGGTGAAG 
ACCTTTACCG TCGATGAGGT GTTCGGTGGG GCCAACAAGG CCTTCGCTGC ACACTTCAAG 
GATGGCGGAT CCTTCGACCA GATCTACCAA AGCAAGTAA

Protein sequence

MTQFRKSITA ILLSLVAGAA LADSTLLNAS YDVARDVYKD YNPMFQKYWK AKTGESIELK 
QSHGGSTKQV RAVADGLEAD VVTMNQANDI EFLADKGLVA KDWAKKFPNN ASPYTSTMVF 
IVRKGNPKVL KDWNDIAAPG VQMIIPHPKN TGNGRNTYLS AWAWALKRPG GNDKTAQEFL 
GKLLKNAPLF AAGGRDATTT FMQRRMGDVL ITFESEAEMI AKEFGKGEFE VVYPSLTMQT 
EFPVALVEKV VDKKGTRKQA QAYLEYLWSK EGQENAAQNY LRPRDAELLK KYAAFFPPVK 
TFTVDEVFGG ANKAFAAHFK DGGSFDQIYQ SK