Gene Daro_0009 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0009
Symbol
ID	3570033
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	12950
End bp	13990
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	60%
IMG OID	637678438
Product	ApbE-like lipoprotein
Protein accession	YP_283238
Protein GI	71905651
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1477] Membrane-associated lipoprotein involved in thiamine biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	44
Plasmid unclonability p-value	0.109653
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0510654
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGCTG TCCTGAATCT TTTCCTGTCT GGCGTTTGCG TACTGCTGCT TGCCAGCTGT 
GGTCGGACGC AGCTGCAAGA ACAGCAGGCC TACGTCTTTG GTACCCGTGT TGAGGTGCTG 
GTCGTCAGCG AGGATCCGGA ACAGGGCCGC AAAGCGATTG CCGCCGTCTT GCGCGAATTC 
GACCGCCTGC ACCGCGCCTA CCACGCTTGG CAGGACTCGG AACTGATGGC CTTGAACACG 
GCATTTGCCC AGGGAAAAAC CCGACAGGTC AGCCCTGAAC TCGCCGCCTT CGTTCAGGAA 
GCACAGGCCC TTTCCCAACA GGGCGACACC CTGTTCGATC CCGGCATTGG TCAGTTGATC 
AAACTGTGGG GCTTCCAGGC CGACGAATTC AAGGCAGAAC TGCCTGCTGC AGCCGATATC 
AAGGCCTGGT TGGCCAGCAA GCCATCCATT GCCGACGTCG TGATCGACGG CACCAATATC 
CGCAGCCGCA ATCGTAACGT TGCCCTCGAT TTCGGCGGCT ACCTGAAGGG TGTCGCCCTT 
GATCGCGCCT CGGCCATCCT CCACGCTCAA GGTATCCACA ACGCCCTGAT CAACATCGGC 
GGCAATGTCA TGGCGCTGGG CAGCAAGGAA GGCAAGAAGT GGCGCGTCGG CATCCAGCAT 
CCACGTCAGC CGGGTCCGAT GGCCACGGTC ACGCTCGATG ACGGCGAAGC GATCGGCACC 
TCCGGCGACT ATCAACGCTT CTTCGAGGTC GACGGACGAC GTTACGCCCA CCTGCTCGAT 
CCTCGCACCG GCTACCCGGT GGAACACACG CAGGCTGTCA CGGTGCTCAT CCCCAAGGGG 
CCAAAAGCAG GCACCTTGTC CGATGCGGCC TCCAAGCCGA TTTTCATTGC AGGACCGGAT 
GGCTGGCGCG ATATGGCGCG AAAAATGGGA ACCAGTCTCG TTTTGCGCGT CGACCATAGC 
AATCAGATTT TCGTCACCGA GGCACTGCGC CAGCGTCTTG AATTCATCGG CGCCCCCCCG 
AAACTCAACG TTGTCCAATA A

Protein sequence

MRAVLNLFLS GVCVLLLASC GRTQLQEQQA YVFGTRVEVL VVSEDPEQGR KAIAAVLREF 
DRLHRAYHAW QDSELMALNT AFAQGKTRQV SPELAAFVQE AQALSQQGDT LFDPGIGQLI 
KLWGFQADEF KAELPAAADI KAWLASKPSI ADVVIDGTNI RSRNRNVALD FGGYLKGVAL 
DRASAILHAQ GIHNALINIG GNVMALGSKE GKKWRVGIQH PRQPGPMATV TLDDGEAIGT 
SGDYQRFFEV DGRRYAHLLD PRTGYPVEHT QAVTVLIPKG PKAGTLSDAA SKPIFIAGPD 
GWRDMARKMG TSLVLRVDHS NQIFVTEALR QRLEFIGAPP KLNVVQ