Gene Daro_3387 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3387
Symbol
ID	3567117
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	3640204
End bp	3641505
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	61%
IMG OID	637681859
Product	histidinol dehydrogenase
Protein accession	YP_286586
Protein GI	71908999
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0141] Histidinol dehydrogenase
TIGRFAM ID	[TIGR00069] histidinol dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	60
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTCGCCA TTAAACGTCT TGCGACGGTC GACGCCGATT TCAAGGCGCA AATGGATGCG 
CTGCTCGCTT TCGAGGCAGC GCAGGATGAA GGCATCGAAC GCACCGTCAT CGGCATTTTG 
GCCGATGTGA AGGCGCGCGG TGATGCCGCA GTAGTCGAAT ACAGCAACAA GTTCGACCGT 
CTGACTGCCA GTAGCATGGC CGACCTCGAG TTGTCGAAGG CCGAAATGCA GAAGGCACTC 
GACGGCTTGC CCGCTGATCA GCGTCAGGCG CTGGAGGCGG CCGCTCACCG CGTTCGCGTT 
TATCACGAAA AGCAGCGGAT GGAAGGCTGG TCCTATACTG AAGCCGACGG CACCATGCTC 
GGTCAGATGA TCACTCCGCT CGACCGCGTC GGCCTCTATG TGCCGGGCGG CAAGGCGGCT 
TACCCTTCTT CCGTGCTGAT GAATGCGATT CCGGCCAAGG TGGCAGGCGT CAAGGAACTG 
ATCATGGTTG TCCCGACGCC GGGTGGTGAG CACAACCAGT TGGTGCTGGC GGCTGCTTGT 
CTGGCCGGCG TCGACCGTGT TTTCACCATC GGTGGGGCGC AGGCCGTTGG CGCGCTGGCC 
TACGGCACCG AGGCTGTGCC GCAGGTCGAC AAGATTGTTG GTCCTGGCAA TGCGTATGTG 
GCCTGTGCCA AGCGTCGGGT GTTTGGTATC GTCGGCATCG ATATGATTGC CGGTCCGTCG 
GAGATTCTGG TTGTGGCTGA TGGCAGTAGC GATCCTGACT GGGTGGCGAT GGACCTCTTC 
TCGCAGGCCG AGCATGATGA ACTGGCGCAA TCGATCCTGA TCTGCACTGA TGCCGCCTAT 
ATCGACCGCG TGCAGGCCAG CATTGAAAAA CTGCTGCCGA CCATGCCGCG TCGCGAAGTG 
ATCGAAACCT CGCTGACCAA CCGCGGGGCG CTGATCCTCG TGCGTGATCT CGAAGAAGCC 
TGCGCCATTG CCAACCGCGT GGCACCGGAA CACCTCGAGC TGTCGCTGGC CGATCCAGAT 
CCCTGGGTTG CCAAAATTCA CCACGCCGGT GCCATCTTCA TCGGTCACTA CACCTCCGAG 
TCGCTTGGCG ACTACTGTGC CGGCCCGAAC CACGTACTCC CGACGTCCGG CAGTGCGCGC 
TTCTCGTCTC CGCTGGGTGT CTATGACTTC CAGAAGCGAA CCAGTCTGAT CAAGGTGTCC 
AAGGCTGGTG CGCAGACCTT GGGCAAGATC GCCTCGACGC TGGCCCATGG CGAAGGACTG 
CCGGCGCACG CCAAGTCGGC AGAGTTCCGG CTCGAAAATT GA

Protein sequence

MVAIKRLATV DADFKAQMDA LLAFEAAQDE GIERTVIGIL ADVKARGDAA VVEYSNKFDR 
LTASSMADLE LSKAEMQKAL DGLPADQRQA LEAAAHRVRV YHEKQRMEGW SYTEADGTML 
GQMITPLDRV GLYVPGGKAA YPSSVLMNAI PAKVAGVKEL IMVVPTPGGE HNQLVLAAAC 
LAGVDRVFTI GGAQAVGALA YGTEAVPQVD KIVGPGNAYV ACAKRRVFGI VGIDMIAGPS 
EILVVADGSS DPDWVAMDLF SQAEHDELAQ SILICTDAAY IDRVQASIEK LLPTMPRREV 
IETSLTNRGA LILVRDLEEA CAIANRVAPE HLELSLADPD PWVAKIHHAG AIFIGHYTSE 
SLGDYCAGPN HVLPTSGSAR FSSPLGVYDF QKRTSLIKVS KAGAQTLGKI ASTLAHGEGL 
PAHAKSAEFR LEN