Gene Daro_3058 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3058
Symbol
ID	3566233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3301292
End bp	3302473
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	59%
IMG OID	637681529
Product	Rieske (2Fe-2S) region
Protein accession	YP_286258
Protein GI	71908671
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	47
Plasmid unclonability p-value	0.312011
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	4
Fosmid unclonability p-value	0.000201005
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGCGGCG GGGTAAAATC CTGCTTTTTA ACCCGCTGGA GGCGTGGAAT GTCCGACGTG 
GCGAATTTGT CCCGTTTGGC CCCAGCAGTT TCCCAACTGC CGGTGGACTG GTACTTCGAT 
GAATCGGTGT ATGAGCTGGA GAAAAAGCTC ATCTTCGATG CCGGTCCGGG CTATGTTGGG 
CACCAGTTGA TGGTGCCGGA AGCGGGTGAC TACCGTTCGC TGGAGTGGAA GGACCACGGC 
CAGATGCTGC TCAACGGCGG CAGTGAGGGC AAGAACGCCG GGGTCTGGCA GATGTCCAAT 
GTCTGCCGTC ACCGTCAGGC GATCATGCTG CAGGGCGCCG GCAAGCTGAA CGGGCCGATT 
GTCTGCCCGA TCCACCGCTG GACATACGAT CATGGCGGCG ACCTGATTGG CGCGCCGCAT 
TTTCCGCAGA ACCCTTGCCT GAACCTGAAC AAGGCGAAGC TGGAGAACTG GAACGGCCTG 
CTCTTTAAGG GCCCGCGTTC GGCCAATGTT GATCTCGGCG GCATGAGTGT TGCCCGCGAC 
CTCGATTTCA CCGGCTACAA GCTCGACCAC GTCGAGATGC ACGAGTGCAA CTACAATTGG 
AAGACCTTCA TCGAGGTCTA TCTCGAGGAC TACCACGTCG TGCCCTACCA CCCGGGCCTG 
GGAAACTTCG TTACCTGCGA CGATCTGGCC TGGCAGTTTG GCGACTGGTA TTCGGTGCAA 
AAGGTTGGCA TCACTTCGCT GATGAAGTCG GGGTCCGCCG CCTATGACCG CTGGCAGAAG 
GTGGTTCGGG AGTATTACGG CGACCGGGGC GAGAAACCGC CGCAAGGGGC GATCTGGTTG 
ACCTACTACC CGAACATCAT GGTTGAGTGG TATCCGCACG TGCTGGTCGT GTCGACGCTG 
ATTCCGCAGG GGCCGCACAA GACGATCAAT GTCGTCGAGT TCTACTACCC CGAGGAAATC 
GTCGATTTCG AACGCGAATT CATCGAGGCC GAACGCGCTG CCTACATGGA AACCGCCGTT 
GAGGATGACG ATATCGGTGA GCGTATGGAT CGCGGTCGGA TGGCGCTACT GGCCGAAGGG 
CGCAACGAGG TCGGCCCTTA CCAGAGCCCG ATGGAAGATG GCATGCAGCA TTTCCACGAG 
TTTTACCGGC GGATCATGCA GAAGGATATC GAGGCGCGCT GA

Protein sequence

MRGGVKSCFL TRWRRGMSDV ANLSRLAPAV SQLPVDWYFD ESVYELEKKL IFDAGPGYVG 
HQLMVPEAGD YRSLEWKDHG QMLLNGGSEG KNAGVWQMSN VCRHRQAIML QGAGKLNGPI 
VCPIHRWTYD HGGDLIGAPH FPQNPCLNLN KAKLENWNGL LFKGPRSANV DLGGMSVARD 
LDFTGYKLDH VEMHECNYNW KTFIEVYLED YHVVPYHPGL GNFVTCDDLA WQFGDWYSVQ 
KVGITSLMKS GSAAYDRWQK VVREYYGDRG EKPPQGAIWL TYYPNIMVEW YPHVLVVSTL 
IPQGPHKTIN VVEFYYPEEI VDFEREFIEA ERAAYMETAV EDDDIGERMD RGRMALLAEG 
RNEVGPYQSP MEDGMQHFHE FYRRIMQKDI EAR