Gene Daro_3238 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3238
Symbol
ID	3566584
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3488214
End bp	3489275
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	65%
IMG OID	637681709
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_286438
Protein GI	71908851
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	45
Plasmid unclonability p-value	0.193087
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCCGA ACAAGAAAAT CTACATCTCC GACGTCACGC TGCGCGACGG CTCGCACGCC 
ATTCGCCATC AGTACAGCGT CGAAAACGCC GTGCAGATCG CCCGTGCGCT CGACAAGGCC 
AAGGTCGACT CGATCGAGGT CGCCCACGGC GACGGCCTGC AGGGCTCCAG CTTTAATTAC 
GGCTTTGGTG CCCACACCGA TCTGGAGTGG ATCGAGGCGG TGGCCGACAC GGTCAAGCAC 
GCCAAGGTCG CCACCCTGCT GCTGCCCGGC ATCGGTACCG TGCATGACCT GAAGGCGGCC 
TACAGTGCCG GCGCCCGCAT CGTCCGCGTC GCCACGCACT GCACCGAGGC CGACGTTTCC 
CGCCAGCACA TCGAAGTCGC CCGCAATCTC GGCATGGAAG CCGTCGGCTT CCTGATGATG 
AGCCACATGA CGACGCCGCA GGCACTGGCC GAGCAGGCCA AATTGATGGA AAGCTACGGC 
GCGACCTGCT GCTACGTGGT CGATTCCGGC GGCGCGCTGT CGATGAACGA TGTGCGCGAC 
CGTTTCCGCG CCTTCAAGGA AGTACTGAAG CCGGAAACCG AAACCGGCAT CCACGCCCAC 
CACAACCTCA GCCTCGGCGT TGCCAACAGC ATCGTCGCGG TCGAGGAGGG CTGCGATCGC 
GTCGACGCCA GTCTGTCCGG CATGGGCGCC GGGGCCGGCA ATGCGCCGCT CGAGGTGTTC 
ATCGCCGCGG CCGACCGCAT GGGCTGGAAC CATGGTTGCA ACCTCTACAC CCTAATGGAT 
GCCGCCGACG ATATCGTCCG CCCATTGCAG GATCGCCCGG TCCGTGTCGA CCGCGAAACC 
CTGGCCCTCG GCTACGCCGG CGTCTATTCC AGCTTCCTGC GCCACTCCGA AGTCGCCGCC 
AAAAAATACG GCCTGAAGGC GGTTGATATC CTGGTCGAGC TGGGCCGTCG CCGCATGGTC 
GGCGGCCAGG AGGACATGAT CGTCGACGTC GCACTCGATC TGCTCAAGGG CCACGAGCAT 
GACGCCGAGC ACGCCATTCC GACCATGAGC GAAGCAGGCT GA

Protein sequence

MNPNKKIYIS DVTLRDGSHA IRHQYSVENA VQIARALDKA KVDSIEVAHG DGLQGSSFNY 
GFGAHTDLEW IEAVADTVKH AKVATLLLPG IGTVHDLKAA YSAGARIVRV ATHCTEADVS 
RQHIEVARNL GMEAVGFLMM SHMTTPQALA EQAKLMESYG ATCCYVVDSG GALSMNDVRD 
RFRAFKEVLK PETETGIHAH HNLSLGVANS IVAVEEGCDR VDASLSGMGA GAGNAPLEVF 
IAAADRMGWN HGCNLYTLMD AADDIVRPLQ DRPVRVDRET LALGYAGVYS SFLRHSEVAA 
KKYGLKAVDI LVELGRRRMV GGQEDMIVDV ALDLLKGHEH DAEHAIPTMS EAG