Gene Daro_3782 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3782
Symbol
ID	3567938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4068799
End bp	4069830
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	62%
IMG OID	637682257
Product	4-hydroxy-2-ketovalerate aldolase
Protein accession	YP_286981
Protein GI	71909394
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0119] Isopropylmalate/homocitrate/citramalate synthases
TIGRFAM ID	[TIGR03217] 4-hydroxy-2-oxovalerate aldolase

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	0.132255
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.000807704
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACCCTCA AAGGCAAAAA AGTCACCGTC CATGACATGA CCCTGCGCGA TGGCATGCAT 
CCCAAGCGTC ACCTGATGAC TCTCGACCAG ATGACCGCCA TCGCCACCGG CCTCGACGCC 
GCCGGCGTGC CGCTGATCGA AGTCACCCAC GGCGATGGCC TGGGTGGTTC CTCGGTCAAC 
TACGGCTTCC CGGCCCATAC CGATGAAGAG TATCTCGGCG CCGTCATCCC GAAGATGAAG 
AACGCCAAGG TCTCCGCCCT GCTGCTGCCC GGTATCGGCA CTGTCGATCA CCTGAAGATG 
GCACGTGACC TCGGCGTGCA CACTATTCGT GTCGCCACCC ACTGTACGGA AGCGGATGTC 
TCCGAACAGC ACATCACCAT GGCCCGCAAG CTGGAGATGG ACACCGTCGG TTTCCTGATG 
ATGGCCCATA TGAACAGTGC CGAAGGCCTG GTCAAGCAAG CCAAACTGAT GGAGTCCTAC 
GGTGCCAACT GCATCTATGT GACCGACTCG GCCGGCCACC TGCTGCCGGA AGGCGTCAAG 
GAAAGACTCA GTGCAGTGCG CGCCGCGCTG AAGCCGGAAA CCGAACTTGG CTTCCACGGC 
CACCACAACC TGGCCATGGG CGTCGCCAAC TCGATCGCCG CCATCGAAGT CGGGGCCAAC 
CGGATCGACG CCGCTGCGGC TGGCCTCGGT GCCGGGGCCG GCAACACGCC GATGGAAGTG 
CTGATTGCCG TGTGCAGCCT GATGGGCATC GAGACCGGCG TCGATGTCGC CAAGATCACC 
GACGTCGCCG AAGACCTGGT CGTGCCGATG ATGGACTTCC CGATCCGCAT TGACCGCGAT 
GCGCTGACCC TGGGTTATGC CGGGGTCTAT GGTTCCTTCC TGCTGTTCGC CAAGCGCGCT 
TCGGCCAAGT ACGGCGTACC GGCCCGCGAC ATTCTGGTCG AGCTGGGCCG GCGCGGCATG 
GTCGGCGGGC AGGAAGACAT GATTGAAGAT ACCGCCATCA CGATGGCACG CGAACGGGGA 
TTGCTGAAAT GA

Protein sequence

MTLKGKKVTV HDMTLRDGMH PKRHLMTLDQ MTAIATGLDA AGVPLIEVTH GDGLGGSSVN 
YGFPAHTDEE YLGAVIPKMK NAKVSALLLP GIGTVDHLKM ARDLGVHTIR VATHCTEADV 
SEQHITMARK LEMDTVGFLM MAHMNSAEGL VKQAKLMESY GANCIYVTDS AGHLLPEGVK 
ERLSAVRAAL KPETELGFHG HHNLAMGVAN SIAAIEVGAN RIDAAAAGLG AGAGNTPMEV 
LIAVCSLMGI ETGVDVAKIT DVAEDLVVPM MDFPIRIDRD ALTLGYAGVY GSFLLFAKRA 
SAKYGVPARD ILVELGRRGM VGGQEDMIED TAITMARERG LLK