Gene Daro_2386 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_2386
Symbol
ID	3568600
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	2571595
End bp	2572905
Gene Length	1311 bp
Protein Length	436 aa
Translation table	11
GC content	58%
IMG OID	637680853
Product	homoserine dehydrogenase
Protein accession	YP_285592
Protein GI	71908005
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0460] Homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	55
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCCA TCAATGTTGG CCTTATCGGC ATCGGCACCG TCGGCGGTGG CACCTGGACC 
GTTCTTAAGC GCAACGAGGA AGAGATTACC CGTCGTGCCG GTCGGCCGAT TCGCATCACC 
GCTGTGGCCG ACAAGAACGT TGAACTCGCC AAGCAGATTA CTGGTGGTGC AGCCCGTGTT 
ACCGACGATG CCTTTTCGTT GGTCAATGAC CCGGAAATCG ATATCATCGT CGAACTGATC 
GGCGGTTATG GTGTTGCCAA GGAAGTGGTC ATGCAGGCCA TCGCCAACGG CAAACATGTC 
GTGACGGCCA ACAAGGCACT GCTTGCCGTG CATGGCACTG AAATCTTTAC GGCCGCTCAA 
CAAAAGGGCG TGATGGTCGC TTTCGAAGCG GCAGTAGCCG GCGGCATTCC CATCATCAAG 
GCATTGCGCG AGGGCCTGAC GGCCAATCGC ATCGAGTGGG CGGCCGGCAT TATCAATGGT 
ACGACCAACT TCATCCTGTC TGAAATGCGC GACAAGGGCC TGTCCTTTGG CGATGTGCTG 
AAAGAAGCTC AGCGTCTTGG TTATGCCGAA GCAGATCCGA CTTTCGACAT CGAAGGTGTC 
GATGCGGCCC ACAAGGCGAC ATTGATTGCT TCGATTGCCT ATGGCATTCC GGTCCAGTTC 
GACAAGGCTT ACATCGAAGG CATCACCAAG CTGGAAGCCT CCGATATCAA GTATGCCGAA 
CAGCTCGGTT ACCGCATCAA GCTGCTTGGC ATCGCCAAGC GTCGCGAGAA GGGTATCGAG 
TTGCGCGTCC ATCCGACCCT GATCCCGGCA AAGCGCCTGC TGGCCAATGT CGAAGGTGCG 
ATGAATGCCG TCATGGTCAA GGGCGACGCG GTTGGCATCA CCCTGTATTA CGGCAAGGGG 
GCTGGTGCTG AGCCGACCGC TTCCGCCGTG GTGGCTGATC TGGTCGATGT TGCTCGTCTG 
GCCACCGCTG ATGCCGCGCA CCGCGTGCCG CACCTGGCCT TCCAGCCGGA CGCCATGTCC 
AACCTGCCGA TCCTGCCAAT GAGCGAAGTC GAGACTGGTT ATTACCTGCG TTTGCGCGTT 
GAAGACAAGC CTGGGGTACT GGCAGATATC ACTCGCATCC TGGCCGATCA GGGTATTTCT 
ATCGATGCCA TGCTGCAGCG CGAGCCGGAA GAGGGTGAGG GCGAGACCGA CATTATCATC 
CTGACCCACA TCTGCAAGGA AAGTGCGGCC GATGCGGCGA TTGCCAAGAT CGAAGGCTTG 
TCTGCGCAAA AGGGCAAGGT CAAGCGTATT CGCCTGGAAG AGCTGCAATA A

Protein sequence

MKPINVGLIG IGTVGGGTWT VLKRNEEEIT RRAGRPIRIT AVADKNVELA KQITGGAARV 
TDDAFSLVND PEIDIIVELI GGYGVAKEVV MQAIANGKHV VTANKALLAV HGTEIFTAAQ 
QKGVMVAFEA AVAGGIPIIK ALREGLTANR IEWAAGIING TTNFILSEMR DKGLSFGDVL 
KEAQRLGYAE ADPTFDIEGV DAAHKATLIA SIAYGIPVQF DKAYIEGITK LEASDIKYAE 
QLGYRIKLLG IAKRREKGIE LRVHPTLIPA KRLLANVEGA MNAVMVKGDA VGITLYYGKG 
AGAEPTASAV VADLVDVARL ATADAAHRVP HLAFQPDAMS NLPILPMSEV ETGYYLRLRV 
EDKPGVLADI TRILADQGIS IDAMLQREPE EGEGETDIII LTHICKESAA DAAIAKIEGL 
SAQKGKVKRI RLEELQ