Gene Daro_0907 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_0907
Symbol
ID	3570064
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	981608
End bp	982639
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	62%
IMG OID	637679365
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_284133
Protein GI	71906546
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	40
Plasmid unclonability p-value	0.0284448
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTTTGC GCGGCAAGAA CGTCACCGTC CACGACATGA CCCTGCGGGA TGGCATGCAT 
CCCAAGCGTC ACCTGATGAC CCTCGACCAG ATGGTCAGCA TCGCCACCGG CCTCGACGAA 
GCCGGTATTC CGCTGATCGA AGTCACCCAC GGCGATGGTC TCGGTGGTTC CTCGGTTAAC 
TACGGCTTCC CGGCCCATAC CGATGAAGAG TATCTCGGCA CCGTCATCCC GAAGATGAAG 
AATGCCAAGA TCTCGGCCTT GCTGTTGCCG GGTATCGGGA CTGTCGATCA CCTGAAGATG 
GCACGTGACC TCGGCGTGCA CACCATTCGC GTCGCCACGC ACTGTACTGA GGCTGATGTC 
TCCGAACAGC ACATCACCAT GGCCCGCAAA CTGGACATGG ACACCGTCGG CTTCCTGATG 
ATGAGCCACA TGAACGGTGC CGAAGGTCTG GTCAAGCAAG CCAAGCTGAT GGAAGGCTAC 
GGCGCCAACT GTATCTACGT CACCGACTCG GCCGGCCACC TGCTGCCGGA AGGCGTCAAG 
GAACGTCTCG GTGCCGTCAG AAAAGCCCTG AAGCCGGAAA CCGAACTCGG TTTCCATGGC 
CACCACAACC TGGCCATGGG CGTCGCCAAC TCGATCGCCG CCATCGAAGT CGGGGCCAAC 
CGCATCGACG CAGCGGCGGC CGGCCTTGGC GCCGGCGCAG GCAACACGCC GATGGAAGTG 
CTGATTGCCG TGTGCAGCCT GATGGGCATC GAGACTGGGG TTGATGTCGC CAAGATCACC 
GACGTGGCCG AAGACCTGGT GGTGCCGATG ATGGACTTCC CGATCCGCAT TGACCGCGAT 
GCACTGACGC TCGGCTATGC CGGCGTCTAT GGTTCCTTCC TGCTCTTTGC CAAGCGCGCT 
TCCGCCAAGT ACGGCGTACC GGCCCGCGAC ATTCTGGTCG AGCTGGGCCG GCGCGGCATG 
GTCGGTGGGC AGGAGGACAT GATCGAGGAT ACGGCCATCA CCATGGCGCG GGAACGTGGG 
CTGAAGGTCT GA

Protein sequence

MSLRGKNVTV HDMTLRDGMH PKRHLMTLDQ MVSIATGLDE AGIPLIEVTH GDGLGGSSVN 
YGFPAHTDEE YLGTVIPKMK NAKISALLLP GIGTVDHLKM ARDLGVHTIR VATHCTEADV 
SEQHITMARK LDMDTVGFLM MSHMNGAEGL VKQAKLMEGY GANCIYVTDS AGHLLPEGVK 
ERLGAVRKAL KPETELGFHG HHNLAMGVAN SIAAIEVGAN RIDAAAAGLG AGAGNTPMEV 
LIAVCSLMGI ETGVDVAKIT DVAEDLVVPM MDFPIRIDRD ALTLGYAGVY GSFLLFAKRA 
SAKYGVPARD ILVELGRRGM VGGQEDMIED TAITMARERG LKV