Gene Dole_1208 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1208
Symbol
ID	5694042
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	1441112
End bp	1442386
Gene Length	1275 bp
Protein Length	424 aa
Translation table	11
GC content	61%
IMG OID	641263801
Product	homoserine dehydrogenase
Protein accession	YP_001529091
Protein GI	158521221
COG category	[E] Amino acid transport and metabolism
COG ID	[COG4091] Predicted homoserine dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAAAAGC AAAACGGCTC AGACCCCGCA AAAATCAGGA TCGGCATTAT CGGCATCGGC 
TCCATGGGCA AGGGGCTGGT ATACCAGGCC CACATCACCC CGGGGGTGCG GTGCGTGGCC 
GTGTGCGATA CCGATGTCAA ACGGTGCACG GCCGTGCTCA CATGGCTGCA TATACCCCAT 
TCGATTGCCA CCAGCCGGGC CGTCATGGAG GATGTGACCC GCCGGGGAGA AGTGGCGGTT 
TGCGAAGATG GTTTATGGGT TGCCGAATGC GCGGACGTCG ACGTTGTCAT TGAGGCGTCC 
AGCGCCATTC TTCCAGCGGC AGAATTCGCC CTGGCCACCC TGAACAGCGG CAAGCACCTG 
GTTCTGATGA ACTCTGAGAT CGATCTGTTG TTCGGCCCGC TGCTGGCGGA CATCGCCCGT 
AAAAACGGCG TGGTCTGCAC CAGCTGCGAC GGCGACCAGT ACGGCGTGCT CAAGCACCAG 
ATCGACGACC TGGCGTTATG GGGGCTGGAC CTGGTCATGG CCGGCAACAT CAAGGGATTC 
CTGGACCGCT CGGCCAACCC CACCTCCATC GTTCCCGAAG CGGACATCCG CAACCTTGAC 
TACCGCATGT GCACCTCCTA CACGGACGGC ACAAAACTCA ATATCGAGAT GGCCATCATT 
GCCAACGCCT GCGGCCTGAT CACCACAACG CCGGGCATGC ACGGGCCCCG GGCCGCCCAT 
GTCCAGGACG TGTTCAATTG CTTTGATTTT GACGCCCTGT GGAAGGACCG CCGCCCCTTT 
GTGGATTACA TCCTGGGGGC CGAGCCCGGC GGCGGGGTGT TTGTGATCGG CCATTGCGAC 
AATCCCTATC AGCGGGAGAT GCTGGCCTAC TACAAGATGG GGCCCGGCCC GTTCTACCTG 
TTTTACCGGC CCTACCACCT GTGCCATATC GAGGCCATGG GAACCGTCCT TCAGGCAGCA 
CGGCGGCAAA CGCCCTTCCT TGTTCCGGAT TACGGGTTCC AGACCCAGGT GTATGCCTAT 
GCCAAACGCG ACCTGAAAGC CGGTGAAGTG CTGGACGGCA TCGGTGGCTA CTGCTGCTAC 
GGCCTGATTG AAAATTTTAA GGAAAACCAC GCCTCACCCG GCCTGCCCAT CGGCCTGGCC 
GATAACGTGG CCCTGAGACG CGATGTGCCG GAACAGGGGC GAATTTCCCT GGATGACGTG 
AGTTACGATC CCGCACGCCT GGATTTTGCG CTTTTTGACC GGGCCTTCGG GCTTCCTGCC 
AATGCGGCGG TATGA

Protein sequence

MQKQNGSDPA KIRIGIIGIG SMGKGLVYQA HITPGVRCVA VCDTDVKRCT AVLTWLHIPH 
SIATSRAVME DVTRRGEVAV CEDGLWVAEC ADVDVVIEAS SAILPAAEFA LATLNSGKHL 
VLMNSEIDLL FGPLLADIAR KNGVVCTSCD GDQYGVLKHQ IDDLALWGLD LVMAGNIKGF 
LDRSANPTSI VPEADIRNLD YRMCTSYTDG TKLNIEMAII ANACGLITTT PGMHGPRAAH 
VQDVFNCFDF DALWKDRRPF VDYILGAEPG GGVFVIGHCD NPYQREMLAY YKMGPGPFYL 
FYRPYHLCHI EAMGTVLQAA RRQTPFLVPD YGFQTQVYAY AKRDLKAGEV LDGIGGYCCY 
GLIENFKENH ASPGLPIGLA DNVALRRDVP EQGRISLDDV SYDPARLDFA LFDRAFGLPA 
NAAV