Gene Daro_0700 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0700
Symbol
ID	3569012
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	767883
End bp	768950
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	59%
IMG OID	637679148
Product	bile acid:sodium symporter
Protein accession	YP_283926
Protein GI	71906339
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0798] Arsenite efflux pump ACR3 and related permeases
TIGRFAM ID	[TIGR00832] arsenical-resistance protein

Plasmid Coverage information

Num covering plasmid clones	76
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGCGC AATGCGAAGT GACGATGAAA CGGGCGGAAG GGCTGTCGAT GAGTGGGTTT 
GAGCGTTACC TGACGATCTG GGTATTCCTG TGCATCGTGA CCGGCATCGT GTTTGGCCAG 
GTGTTCCCCG GGTTTTTTCA GGCAGTGGGC GGCATGGAGG TGGCACGTGT CAATCTGCCC 
GTTGGCCTGC TGATCTGGGT GATGATCATT CCGATGCTGG TCAAGGTGGA TTTCGGCGCG 
CTGAGCGAAA TGAAGCAGCA CGCCAGGGGT ATTGGCGTCA CGCTGTTCGT CAATTGGCTG 
GTCAAACCGT TCTCGATGGC TTTTCTCGGC TGGCTGTTTG TACGCCAGCT GTTTGCTGCC 
TATCTGCCGG CCGATCAGCT CGATAGTTAC ATTGCCGGTC TGATCCTGCT CGCTGCCGCG 
CCGTGCACGG CGATGGTCTT CGTCTGGAGC CGGCTGTCGA ATGGTGATCC GCTGTTCACG 
CTGTCGCAGG TGGCGGTCAA CGACACGATC ATGGTTTTTG CCTTTGCCCC CATCGTCGCC 
TTCCTGCTCG GCATCTCGGC TATCACCGTG CCGTGGGAAA CGCTGCTTAC CTCGGTCGTG 
CTCTACATTG TCATTCCAGT TGCGCTGGCT CAGTTCTGGC GCAGGTCGTT GTTGGCTCGA 
GGCCAGGCCG TCTTCGATGC GGCAATGGCG AAAATCGGTC CGTGGTCGAT CTGCGCGCTA 
TTGCTGACCT TGGTCTTGCT GTTTGCCTTC CAGGGCGAGG CGATCCTGCG TCAACCACTG 
GTCATCGCGC TACTCGCCGT GCCCATCCTG ATTCAGGTCT TCTTCAACTC GGCGCTGGCC 
TACTGGCTGA ATCGGGCGGT TGGCGAAAAG CACAACATCG CGTGCCCATC GGCGCTGATC 
GGTGCTTCCA ATTTCTTTGA GCTGGCGGTG GCTGCGGCGA TCAGCCTGTT CGGTTTCGAA 
TCCGGTGCAG CCTTGGCGAC GGTGGTCGGC GTGCTGATTG AAGTGCCGGT CATGTTGCTG 
GTCGTGCGCG TGGTCAATGC CAGCAAGGGG TGGTACGAGG CAAAATAA

Protein sequence

MSAQCEVTMK RAEGLSMSGF ERYLTIWVFL CIVTGIVFGQ VFPGFFQAVG GMEVARVNLP 
VGLLIWVMII PMLVKVDFGA LSEMKQHARG IGVTLFVNWL VKPFSMAFLG WLFVRQLFAA 
YLPADQLDSY IAGLILLAAA PCTAMVFVWS RLSNGDPLFT LSQVAVNDTI MVFAFAPIVA 
FLLGISAITV PWETLLTSVV LYIVIPVALA QFWRRSLLAR GQAVFDAAMA KIGPWSICAL 
LLTLVLLFAF QGEAILRQPL VIALLAVPIL IQVFFNSALA YWLNRAVGEK HNIACPSALI 
GASNFFELAV AAAISLFGFE SGAALATVVG VLIEVPVMLL VVRVVNASKG WYEAK