Gene Daro_1356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_1356
Symbol
ID	3569246
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	+
Start bp	1475220
End bp	1476245
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	63%
IMG OID	637679824
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_284575
Protein GI	71906988
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.00000000315609
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.0000118499
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCCTCA AAGGCAAAAA AGTCACCGTC CATGACATGA CCCTGCGCGA TGGCATGCAT 
CCCAAGCGTC ACCTGATGAC TCTCGACCAG ATGACCGCCA TCGCCACCGG CCTCGACGCC 
GCCGGCGTGC CGCTGATCGA AGTCACCCAC GGCGATGGCC TGGGTGGTTC CTCGGTCAAC 
TACGGCTTCC CGGCCCATAC CGATGAAGAG TATCTCGGCG CCGTCATCCC GAAGATGAAG 
AACGCCAAGG TCTCCGCCCT GCTGCTGCCC GGTATCGGCA CTGTCGATCA CCTGAAGATG 
GCACGTGACC TCGGCGTGCA CACTATTCGT GTCGCCACCC ACTGTACGGA AGCGGATGTC 
TCCGAACAGC ACATCACCAT GGCCCGCAAG CTGGAGATGG ACACCGTCGG TTTCCTGATG 
ATGGCCCATA TGAACAGTGC CGAAGGCCTG GTCAAGCAAG CCAAACTGAT GGAGTCCTAC 
GGTGCCAACT GCATCTATGT GACCGACTCG GCCGGCCACC TGCTGCCGGA AGGCGTCAAG 
GAAAGACTCA GTGCAGTGCG CGCCGCGCTG AAGCCGGAAA CCGAACTTGG CTTCCACGGC 
CACCACAACC TGGCCATGGG CGTCGCCAAC TCGATCGCCG CCATCGAAGT CGGGGCCAAC 
CGGATCGACG CCGCTGCGGC TGGCCTCGGT GCCGGGGCCG GCAACACGCC GATGGAAGTG 
CTGATTGCCG TGTGCAGCCT GATGGGCATC GAGACCGGCG TCGATGTCGC CAAGATCACC 
GACGTCGCCG AAGACCTGGT CGTGCCGATG ATGGACTTCC CGATCCGCAT TGACCGCGAT 
GCGCTGACGC TCGGTTATGC CGGCGTCTAT GGCTCCTTCC TGTTGTTTGC CAAGCGCGCC 
TCCGCCAAGT ACGGCGTACC AGCGCGCGAC ATTCTGGTCG AGCTGGGCCG GCGCGGCATG 
GTCGGCGGGC AGGAAGACAT GATTGAAGAT ACCGCCATCA CGATGGCACG CGAACGGGGT 
GTGTGA

Protein sequence

MTLKGKKVTV HDMTLRDGMH PKRHLMTLDQ MTAIATGLDA AGVPLIEVTH GDGLGGSSVN 
YGFPAHTDEE YLGAVIPKMK NAKVSALLLP GIGTVDHLKM ARDLGVHTIR VATHCTEADV 
SEQHITMARK LEMDTVGFLM MAHMNSAEGL VKQAKLMESY GANCIYVTDS AGHLLPEGVK 
ERLSAVRAAL KPETELGFHG HHNLAMGVAN SIAAIEVGAN RIDAAAAGLG AGAGNTPMEV 
LIAVCSLMGI ETGVDVAKIT DVAEDLVVPM MDFPIRIDRD ALTLGYAGVY GSFLLFAKRA 
SAKYGVPARD ILVELGRRGM VGGQEDMIED TAITMARERG V