Gene Dole_3159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_3159
Symbol
ID	5696021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	3785401
End bp	3786696
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	61%
IMG OID	641265778
Product	3-isopropylmalate dehydratase large subunit
Protein accession	YP_001531039
Protein GI	158523169
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0065] 3-isopropylmalate dehydratase large subunit
TIGRFAM ID	[TIGR00170] 3-isopropylmalate dehydratase, large subunit [TIGR01343] homoaconitate hydratase family protein [TIGR02086] 3-isopropylmalate dehydratase, large subunit

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000000477252
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGAAAAA CGATTGCACA GAAAATTTTT GACGCGCATA GTGTGGACCA GCCCTTTGGA 
GAGGTTCATG TGATAAGGCT TGACGGTGTG TTCTGTCATG AGATCACCAC ACCCACAGCC 
ATCTGCGACC TGATGGAAAA AAATAAGGAC CGGGTCTTTG ATCCGTCAAA GATCAAGGCG 
GTGATCGACC ACGTGACCCC GGCCAAGGAC TCCAAGACCG CGGCCCAGGG AAAGATCCTG 
CGGCAGTGGG CCCGGCGTCA CGGCATCGAC GGGTTTTTCG ATATCGGCCG CAACGGCGTG 
TGCCACGCGC TTTTTCCTGA GCAGGGGTTT GTGCGGCCCG GCCACACCAT TATCATGGGA 
GACTCCCACA CCTGCACCTA CGGCGCTTTT GGCGCCTTTG CCGCGGGCGT GGGCACCACC 
GACCTGGAGG TGGGTATTTT AAAGGGCGTC TGCGCCTTAA ACTATCCGTC CACCATCAAG 
GTGGTGTTAA ACGGGAAGCT TTCCCCCGGC GTTTATGCCA AGGACGTGAT CCTGGCGGTG 
ATTGCCGAGC TGGGGGTCAA CGGCGCCACC AACCGGGTGA TTGAGTTTAC CGGCCCCTGC 
GTGGACGCTA TGAGCATGGA GGCCCGCATG ACCCTGTGCA ACATGGCCAT CGAGGCCGGG 
GGCACCTGCG GCATCTGCTA TCCGGACAAG ACCACCGTGG CCTACCTGTG GGAGTTCATC 
AAGGGCGAAT ACCCTTCCCG GCAGGCGGCT CTCAAGGCGT TCAAGAAACT GGTATCCGAC 
CCGGACGCGG ATTACGACCG GGTACTGGAA ATGGATATCA GCGACCTGTC GCCCCGGGTG 
ACCTACGGCT ACAAGCCGGA CTGTGTCAAA CCCGTGGCCG AGATGGAGGG CACCCCCATC 
GACCAGGTCT ATATCGGCTC GTGCACCAAC GGCCGGCTGG AGGACCTGCG GGTGGCCGCA 
AAAGTACTGA AAGGCAAAAA GGTGCATCCG TCGGTGCGGG GCATTGTCTC TCCGGCCACG 
CCCACGGTGT TTCAGGCCGC GCTTGAGGAG GGACTGATCG CGACGTTCAT GGCCGCGGGT 
TTCTGTGTCA CCAACCCCAC CTGCGGGGCC TGCCTGGGCA TGAGCAACGG CGTGCTGGCC 
CCGGGCGAGG TGTGCCTGTC CACCACCAAC CGGAATTTCA ACGGCCGCAT GGGCAAGGGC 
GGCATGGTTC ACCTGGCCAG CCCGGCCACG GCCGCGGCCG GCGCCATTGC CGGTTGCATC 
ACCAACTCGA AACTGTATAA AAAACGCGCG GAGTAG

Protein sequence

MGKTIAQKIF DAHSVDQPFG EVHVIRLDGV FCHEITTPTA ICDLMEKNKD RVFDPSKIKA 
VIDHVTPAKD SKTAAQGKIL RQWARRHGID GFFDIGRNGV CHALFPEQGF VRPGHTIIMG 
DSHTCTYGAF GAFAAGVGTT DLEVGILKGV CALNYPSTIK VVLNGKLSPG VYAKDVILAV 
IAELGVNGAT NRVIEFTGPC VDAMSMEARM TLCNMAIEAG GTCGICYPDK TTVAYLWEFI 
KGEYPSRQAA LKAFKKLVSD PDADYDRVLE MDISDLSPRV TYGYKPDCVK PVAEMEGTPI 
DQVYIGSCTN GRLEDLRVAA KVLKGKKVHP SVRGIVSPAT PTVFQAALEE GLIATFMAAG 
FCVTNPTCGA CLGMSNGVLA PGEVCLSTTN RNFNGRMGKG GMVHLASPAT AAAGAIAGCI 
TNSKLYKKRA E