Gene Daro_3814 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3814
Symbol
ID	3567970
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4098547
End bp	4099941
Gene Length	1395 bp
Protein Length	464 aa
Translation table	11
GC content	63%
IMG OID	637682288
Product	aromatic hydrocarbon degradation protein
Protein accession	YP_287012
Protein GI	71909425
COG category	[I] Lipid transport and metabolism
COG ID	[COG2067] Long-chain fatty acid transport protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	0.0090168
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0676668
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACAA GAAAAATCAT GGCCTCGGTG CTGGTTTCGG GTCTGGCCGG CTTTAGCAGC 
CTGGCGCAGG CGACTGATGT GTTCCGCCTG GAAGGTTACG GCGCGGTATC GCGCGGTATG 
GGTGGTACGG CGGTCGCCCA CGATGTCGGC CCGGCCGGCA TGATGACCAA TCCGGCCACG 
CTGTCGCTGA TGCAGGAGGG CGACCAGGTC ATGGGCGGGC TGGATCTGGT GACGACCGAC 
ATCGAGGTCA GGAACAAGAA CACCGGCGAG CGCGTTTCGT CGGGCGAACA CGCCAGTAAC 
CGGGGGCCGT ATGCTGCGCC GGAGCTGGCC TATACCAAAC GCTTCGGCGA CTGGGCGGTG 
GGCGTCGGGG CTTTTGCCCA GGGCGGCCTC GGCACCGAAT ACGGTACCGG TAGCTTCCTG 
TCGAGAGCGG TCGGTGGACT CAACACCGGC CTCGATAATT CCAGCCGCCT GCTGGTCCTG 
AACATTCCCT TTGCCGCGAG TTTCAAAGTC AGCGAAAAAC TGGCCGTCGG CGGCAGCTTC 
GATGCGATGT GGCAGGGCCT GAACCTGAAC CTGCTGCTCG GCGCCGATCA GGTCGGCAGC 
CTGCTGAGCT CCGGCCGGGC GACCGGTACC CTGGTGCCGG TTCTGGGTGG CCTGCCTGAT 
CTGCGCGGCG CTCACTTCAG CCTGACCAAG AACCAGCCGC TGGGCAGCGG CGTCGATGCC 
TGGGGCTACA GCGGCAAGCT GGGCATGATC TACAAGGCAA CCCCGGAGAC GACACTGGGC 
GCCTCCTATA CCTTCAAGAG CCAGATGGAC GACATGGAGG GTGGTGCCAC CCTGACGGCG 
GTGGACGGCA TTGCCGGCCA GATTCCGCTG AAGGGCAAGA TCAAGATCCA GGATTTCCAG 
ATGCCGGCCC ATCTCGATCT CGGCTTCAAC CAGCGCCTGT CGGCACAATG GACGGTCGCG 
GTCGATGTCT CGCAGGTCTT CTGGAAGGAT GTGATGAAGG ACATCAAGGT GGCCTTCGTG 
GCTGACCCGA GCGCGGCCGT GCCGACCGGC GGCACGCTCA ATATCCTGCT GCCGCAGGAC 
TACAAGGATC AGACCATCCT GTCCCTGGGC ACGGCCTACG ACCTGAGCGA TCAGCTGACG 
CTGCGCGGCG GTCTGCGTTT CGCGACCCAG GCCTTGCGCT CCTCGACGCT GTTTGCGGTG 
ATCCCGGCCA CGCCGAGAAC GCATTTGTCG GCCGGCCTGA CCTATGCCCT GTCGAAGCAG 
AGCAAGATCG ATTTCGCCTA CTCCCACGCC CTCAAGGAAA CGATGGATAA CAGCAGCCTG 
CCGAACACCT CCGATCCGAT TCAGGTCAAG CACGCACAGA ACAACGCGAC CATCAATTTC 
CGCTATAACT TTTGA

Protein sequence

MTTRKIMASV LVSGLAGFSS LAQATDVFRL EGYGAVSRGM GGTAVAHDVG PAGMMTNPAT 
LSLMQEGDQV MGGLDLVTTD IEVRNKNTGE RVSSGEHASN RGPYAAPELA YTKRFGDWAV 
GVGAFAQGGL GTEYGTGSFL SRAVGGLNTG LDNSSRLLVL NIPFAASFKV SEKLAVGGSF 
DAMWQGLNLN LLLGADQVGS LLSSGRATGT LVPVLGGLPD LRGAHFSLTK NQPLGSGVDA 
WGYSGKLGMI YKATPETTLG ASYTFKSQMD DMEGGATLTA VDGIAGQIPL KGKIKIQDFQ 
MPAHLDLGFN QRLSAQWTVA VDVSQVFWKD VMKDIKVAFV ADPSAAVPTG GTLNILLPQD 
YKDQTILSLG TAYDLSDQLT LRGGLRFATQ ALRSSTLFAV IPATPRTHLS AGLTYALSKQ 
SKIDFAYSHA LKETMDNSSL PNTSDPIQVK HAQNNATINF RYNF