Gene Daro_0370 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0370
Symbol
ID	3569673
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	402501
End bp	404165
Gene Length	1665 bp
Protein Length	554 aa
Translation table	11
GC content	63%
IMG OID	637678812
Product	phenylacetic acid degradation protein paaN2
Protein accession	YP_283599
Protein GI	71906012
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID	[TIGR02288] phenylacetic acid degradation protein paaN

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	5.52975e-18
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	0
Fosmid unclonability p-value	0.0000000651019
Fosmid Hitchhiker	No
Fosmid clonability	unclonable

Sequence

Gene sequence

ATGTCCCACC CCCTGCTCGA CAAGCACCGC GCCACGCTCG ATGGCGCCCT TAATGCCATC 
GCCACCCGTG CCTATTGGTC GGCCTATAAC GAGATGCCGA GTCCGAAGAC CTACGGTGAA 
ACCGCGGCTG AAGATGGCAA GAAGGCTTTC GAAGCCCATC TTGGCAAGCA GTTCGATCTG 
GGGCAGCCGG GGGCGACGGG TTGGGCCGGT GGCGAGCAAT CGCCCTACGG TATCGATCTG 
AACGTTCAGT ATCCGGTCTG CAACTATGAA ACATTGATCG CCGCCGGCCA GCAGGCCATG 
GGCGGCTGGC AGAAGATCGG GGCCGATGGC CGCACTGGCA TCTGTCTCGA AATCCTGGCT 
CGCCTGAATC AGCAGAGCTT CGAGCTGGCC CATGCGGTCA TGATGACCAC CGGCCAGGGC 
TGGATGATGG CTTTCCAGGC CGGCTCGCCG CACGCCCAGG ACCGTGGCCT CGAAGCGGTT 
GCCTATGCCT ATCGCGAACA GAGCTTCGTG CCGGCCGAAA CGACCTGGGA CAAGCCGCAG 
GGCAAGAACC CGCCGCTGGT CATGAAGAAG CATTTCGAAA TCGTCGGTCA CGGTGTCGGC 
GTCGTTGTCG GCTGCGGCAC CTTCCCGACC TGGAATACCT ACCCCGGCCT GTTTGCCGCG 
CTGTCCACCG GCAATGCCGT GATCGTCAAG CCGCATAGCA ATGCCATCCT GCCGGCCGCC 
ATTACCGTGC GCACCATTCG CGCCGTGCTG GCCGAGAACG GCATTGACCC CAACCTGGTC 
ACGCTGTGCG TGGCCGATCG TGCCGCCACG CAGAAGCTGG TCACCCACAA GGCCGTCAAG 
TCCATCGACT TCACTGGCGG TAATGTCTTC GGCCAGTGGC TGATCGACAA CTGCCGCCAG 
GCCCGCGTCT ATGCCGAGCT GGCCGGCGTC AACAACATCG TGATCGATTC GACCGATGCC 
TACAAGCCGA TGCTGCGCAA CCTGGCTTTC ACGCTGTCGC TGTATTCCGG CCAGATGTGC 
ACCACCTCGC AGGCCATCTT CGTGCCGGCC GCTGGCATTG AGACCGAAGA CGGCCACAAG 
TCCTACGACG ACGTCTGTGC CGATCTGGCC CGTGCCGTGT CCGGCTTCCT GTCCAAGCCG 
GAGGTCGCGC TGGCCGTGCT CGGTGCCATG CAATCGGCTG ATACCATCAA GCGTATCGAC 
ATGGCTGACA GCGGCACGCT GGGCAAGGTG GTGCTGGCTT CCACCAAGCT GGACAACCCG 
GAATTCCCGA AAGCTGCCGT CCGTACCCCG GTCCTGCTCG CCTGTGATGC GGCCGACGAG 
CATGCCTATA TGGAAGAGCG TTTTGGCCCG ATCAGCTTCA TCGTCAAGGT GGCTGATACC 
GCTGCCGCCA TCGCGCTGTC CGAGCGCATT GTGTCTACCC ACGGTGCGCT GACGGCCGGT 
ATCTACTCGA CCAAGCCGGA AGTGATCGAC GCGATGACCG CCGCCACGAT GCGCGCCAAG 
GTTGCCCTGT CGATCAACCT GACCAGTGGC GTGTTCGTCA ATCAGTCGGC CGCTTACTCC 
GATTACCACG GTACCGGCGG CAACCCGGCT GCCAACGCGT CCTACGCCGA TGCCGCCTTT 
GTCGCCAACC GCTTCGTAGT CGTCCAGCGC CGTTACCACA TCTAA

Protein sequence

MSHPLLDKHR ATLDGALNAI ATRAYWSAYN EMPSPKTYGE TAAEDGKKAF EAHLGKQFDL 
GQPGATGWAG GEQSPYGIDL NVQYPVCNYE TLIAAGQQAM GGWQKIGADG RTGICLEILA 
RLNQQSFELA HAVMMTTGQG WMMAFQAGSP HAQDRGLEAV AYAYREQSFV PAETTWDKPQ 
GKNPPLVMKK HFEIVGHGVG VVVGCGTFPT WNTYPGLFAA LSTGNAVIVK PHSNAILPAA 
ITVRTIRAVL AENGIDPNLV TLCVADRAAT QKLVTHKAVK SIDFTGGNVF GQWLIDNCRQ 
ARVYAELAGV NNIVIDSTDA YKPMLRNLAF TLSLYSGQMC TTSQAIFVPA AGIETEDGHK 
SYDDVCADLA RAVSGFLSKP EVALAVLGAM QSADTIKRID MADSGTLGKV VLASTKLDNP 
EFPKAAVRTP VLLACDAADE HAYMEERFGP ISFIVKVADT AAAIALSERI VSTHGALTAG 
IYSTKPEVID AMTAATMRAK VALSINLTSG VFVNQSAAYS DYHGTGGNPA ANASYADAAF 
VANRFVVVQR RYHI