Gene Daro_3337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3337
Symbol
ID	3566321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	3591244
End bp	3592194
Gene Length	951 bp
Protein Length	316 aa
Translation table	11
GC content	64%
IMG OID	637681809
Product	cation efflux protein
Protein accession	YP_286536
Protein GI	71908949
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1230] Co/Zn/Cd efflux system component
TIGRFAM ID	[TIGR01297] cation diffusion facilitator family transporter

Plasmid Coverage information

Num covering plasmid clones	60
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.00037106
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAAGCAGC CACAACACGA CGTTTCGCGC TGGGCCCACC AACACCAGTA CGGCACCGGC 
AATGCGGCGG CCGAACGCGG CACGCGGGCA GTCATGTGGA TCACCATCGC CACCATGCTG 
GTCGAAATCA TCGCCGGCTG GTGGTTCAAC TCGATGGCCG TGCTGGCCGA CGGCTGGCAC 
ATGAGCTCGC ACGCGCTGGC CATTGGCCTC TCGGCCTTCG CTTATGGCGC GGCGCGCAAG 
TACGCCAGCG ACCCCAGTTT CGCCTTCGGC ACCTGGAAGA TCGAAGTACT GGCCAGCTAT 
ACCAGCGCCA TCTTCCTGCT CGGCGTGGCT GGTGCGATGG TCTTCGGTTC GCTGGAGCGC 
CTGTGGCAGC CGCAAACAAT CCACTACCCG GAAGCGATGG GCGTTGCCAT CTTTGGCCTG 
GCGGTCAATC TGGTTTGTGC GCTGATCCTC GGCCAGGCTG GAGATCACGG CCATCACCAC 
CACGACGATG GCCATGCCCA CCATCATCAC CACGACCTGA ACCTGAAAGC CGCGTATATC 
CACGTCATCA CCGATGCGCT GACCTCAGTG CTGGCGATTG CCGCGCTGGC CGGCGGCTGG 
TTCTACGGCT GGGCCTGGCT CGACCCGGCG ATCGGACTGG TCGGCGCCGT GCTGGTTGCG 
CTCTGGGCGA AAAACCTGAT TTTACAAAGC GGCCGCGTGC TGCTCGACCG CGAGATGGAC 
CATCCGGTGG TCGCCGAAAT CCGCGAGGTC ATCGAACAAC TACCGCTAGC CGGCAGCACG 
CAACTGACTG ACCTGCACGT CTGGCGCGTC GGCAACGGCG CCTACGCCTG CGCACTGAGC 
CTCCTGACCC ACGATCAGGC CCTGACACCG TTGCAAGTTC GCAGCGCCCT GGGCGTGCAT 
GAGGAAATCG TGCATGCCAC GGTCGAAATC CACCGCTGCG ACCTTTGCTA G

Protein sequence

MKQPQHDVSR WAHQHQYGTG NAAAERGTRA VMWITIATML VEIIAGWWFN SMAVLADGWH 
MSSHALAIGL SAFAYGAARK YASDPSFAFG TWKIEVLASY TSAIFLLGVA GAMVFGSLER 
LWQPQTIHYP EAMGVAIFGL AVNLVCALIL GQAGDHGHHH HDDGHAHHHH HDLNLKAAYI 
HVITDALTSV LAIAALAGGW FYGWAWLDPA IGLVGAVLVA LWAKNLILQS GRVLLDREMD 
HPVVAEIREV IEQLPLAGST QLTDLHVWRV GNGAYACALS LLTHDQALTP LQVRSALGVH 
EEIVHATVEI HRCDLC