Gene Daro_4068 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_4068
Symbol
ID	3566909
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	4364033
End bp	4365658
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	66%
IMG OID	637682540
Product	hypothetical protein
Protein accession	YP_287264
Protein GI	71909677
COG category	[R] General function prediction only
COG ID	[COG0433] Predicted ATPase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	53
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAAC CTCTCTACCT CGCCAAGTCC GAAGACGGTT ATCCCGCATT GCTGCCGCAG 
ATGGCCAACC GCCACGGGCT GATCACCGGC GCCACCGGCA CCGGCAAGAC GGTCACCCTG 
CAGTCGATGG CCGAACGCCT GTCCTACGCC GGCGTGCCGG TCTTCATGGC CGATGTGAAG 
GGCGACCTCT CCGGCATGGG CGCCGCCGGC ACCCTGACCC CGAAGCTGGA AACCCGCCTC 
AAGGACCTCG GCCTCGAAGG CTTCGCCCCC TACGCCAACC CGGTTGCCTT CTGGGATGTC 
TTCGGCCAGG GCGGCGTGCC GGTGCGCGCC ACCATCTCCG ACATGGGCCC GCTGCTCCTC 
GCCCGCCTGC TGAACCTGAA CGACACCCAG ACCGGCGTCC TGCAACTGGT CTTCAAGATC 
GCCGACGACA AGGGCCTGCT GCTGATCGAC CTGAAGGACC TGCGCGCCTG CATCCAGTAC 
GTCGGCGAAA ACGCCAAGGA CTTCACCACC GAATACGGCA ATGTCTCGAC CGCCTCGATC 
GGCGCCATCC AGCGCGGCCT GCTGACGCTG GAAGAGCAGG GCGGCGACCG GTTCTTCGGC 
GAACCGATGC TCAATATCAA CGACCTGATG AAGGTCGACG AAAACGGCCG CGGCGTCATC 
AACGTCCTCG CCGCCGAAAA GCTGGTCCAA GCCCCGGCGC TCTACTCCAC CTTCCTGCTC 
TGGCTGCTCT CCGAACTGTT CGAACAACTC CCGGAAGCCG GCGATCTGGA CAAGCCCAAG 
CTCGTCTTCT TCTTCGACGA AGCCCATCTG CTGTTCACCG ACGCCCCGCA GGCGCTGACC 
GACAAGGTCG AGCAGGTGGT CCGTCTGATC CGCTCCAAGG GCGTCGGCGT CTATTTCGTC 
ACGCAGAACC CGCTCGACGT CCCTGAAAAG ATCCTCGGCC AGCTCGGCAA CCGCGTCCAG 
CATGCCCTGC GCGCCTTCAC GCCGCGTGAC CAGAAGGCCG TCCAGGCAGC AGCGCAAACC 
ATGCGCGCCA ACCCGAAATT CGATGCCGCC ACCGTGATCA CCGAACTCGG CGTCGGCGAA 
GCGCTGGTTT CCTTCCTCGA CGAAAAGGGC AGGCCAACCA TGGTTGAGCG CAGCACCATC 
TTCCCGCCCG CCTCCCGCCT CGGCCCACTG ACCGCCGACG AACGCCAGGC CATGATCAAC 
GCCTCGCCGA TGCTCGCCAC CTACGGCCAG ACCGTCGACC GCGAATCCGC CTACGAAATC 
CTGCGCGGCA AACCCGCCGC CACGCAAGCC GCCCCCGGCG CCATTCCGGC GCCACCGGCC 
GGCAACAGCA GCCTCAACGA CAGCGACTGG GGCAACCATG CCAACCAGCA ACAGCCGCGC 
TATGAACAAG CCCCGCAACC CCGACAGAGC GCCCCCGCCC CGCAGGAAAG CTCGGGCGGT 
GGTCTGTTCG GCGGCCTCGG CGACATCCTG ACCGGCACCA CCGGCCCACG CGGTGGTCAT 
CGCGAAGGCG TGCTCGAAAG TGCCGCCAAG AGCGCCGCTC GCGGCGTTGC CGGCACGGTT 
GGCCGGGAGA TTGGGAAGCA GATTCTGCGC GGGGTGCTGG GGTCAATCCT GGGCGGACGA 
CGCTAA

Protein sequence

MSEPLYLAKS EDGYPALLPQ MANRHGLITG ATGTGKTVTL QSMAERLSYA GVPVFMADVK 
GDLSGMGAAG TLTPKLETRL KDLGLEGFAP YANPVAFWDV FGQGGVPVRA TISDMGPLLL 
ARLLNLNDTQ TGVLQLVFKI ADDKGLLLID LKDLRACIQY VGENAKDFTT EYGNVSTASI 
GAIQRGLLTL EEQGGDRFFG EPMLNINDLM KVDENGRGVI NVLAAEKLVQ APALYSTFLL 
WLLSELFEQL PEAGDLDKPK LVFFFDEAHL LFTDAPQALT DKVEQVVRLI RSKGVGVYFV 
TQNPLDVPEK ILGQLGNRVQ HALRAFTPRD QKAVQAAAQT MRANPKFDAA TVITELGVGE 
ALVSFLDEKG RPTMVERSTI FPPASRLGPL TADERQAMIN ASPMLATYGQ TVDRESAYEI 
LRGKPAATQA APGAIPAPPA GNSSLNDSDW GNHANQQQPR YEQAPQPRQS APAPQESSGG 
GLFGGLGDIL TGTTGPRGGH REGVLESAAK SAARGVAGTV GREIGKQILR GVLGSILGGR 
R