Gene Dret_1100 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1100
Symbol
ID	8418925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	1290553
End bp	1291644
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	60%
IMG OID	645037672
Product	3-isopropylmalate dehydrogenase
Protein accession	YP_003197966
Protein GI	258405224
COG category	[C] Energy production and conversion [E] Amino acid transport and metabolism
COG ID	[COG0473] Isocitrate/isopropylmalate dehydrogenase
TIGRFAM ID	[TIGR00169] 3-isopropylmalate dehydrogenase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.757445
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	0.166084
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCACAT TTACTATCTG TTGTCTGCCA GGGGATGGCA TCGGCCCGGA GATCACCACT 
GAAGCCCAAA ACGTTCTGAC TGCGATTGGA AGGCAGTTTG GTCATACTTT TACGATGACC 
GACGAGCCCA TCGGTGGCGC GGCGATCGAC ACGCATGGCG TTCCGTTGCC GGAGGCGACT 
CTCCAGGCCT GCCGCGAGAG CCACGCAGTG CTCCTGGGTG CGGTCGGCGG GCCGAAGTGG 
GATGCACTGG AGACAGCCAT CCGTCCGGAA AAAGGATTGC TGGCCCTGCG CAAGGGATTG 
TCCCTGTATG CCAACCTCCG TCCCGCGGTT ATTTTTCCGG AACTCAAAGA GGCGTCTTAC 
CTGCGTCCGG ATATTGTGGC CGACGGCGTG GACGTGCTGG TTGTGCGGGA ACTGACCGGG 
GGGATTTATT TCGGCGAACC GCGCGGGCGC GAAGGCGAAC CGGGACAACG CCGGGCCATG 
AACACCATGG TCTACGATGA GACCGAAGTA CGCCGTATCG GCCGGCTCGC TTTCGAAGCC 
GCACAGCAAC GGGACAAACG GCTGTGTTCC GTGGACAAGG CCAATGTTCT TGAAGTCTCG 
CAATTATGGC GGGAAGTCAT GAACGAACTG GCTCCCTCCT ATCCGGATGT CACCCTGGAG 
CACATGTATG TCGACAATGC AGCCATGCAA CTGGTTCGGG ATCCGAAACA ATTCGATGTT 
GTGGTCACTT CCAATCTTTT TGGGGATATC CTCTCCGATG AAGCCGCGAC AATCACCGGA 
TCCATCGGCA TGTTGCCTTC GGCCTCCCTC GGCGACGAGA AGCCGGCTCT GTTTGAACCG 
ATCCATGGCT CAGCTCCGGA TATCGCCGGT CAGGACAAGG CCAATCCGCT GGCGACCATC 
CTTTCCGTGG GCATGTTGCT CCGATTCGGC CTCGGCCTGG AACAGGAGGC CGACGCCGTG 
GACGCGGCAG TAGCCGACGT CATTGCCCAA GGTCTGCGTA CCGGGGATAT CGCCGGTCCT 
GGCGAAGCTG TGCTCGGATG CCGTGCCATG GGTGCGGCTG TGGTTGACCG TCTCCAGGCC 
CGTAAGGACT GA

Protein sequence

MATFTICCLP GDGIGPEITT EAQNVLTAIG RQFGHTFTMT DEPIGGAAID THGVPLPEAT 
LQACRESHAV LLGAVGGPKW DALETAIRPE KGLLALRKGL SLYANLRPAV IFPELKEASY 
LRPDIVADGV DVLVVRELTG GIYFGEPRGR EGEPGQRRAM NTMVYDETEV RRIGRLAFEA 
AQQRDKRLCS VDKANVLEVS QLWREVMNEL APSYPDVTLE HMYVDNAAMQ LVRDPKQFDV 
VVTSNLFGDI LSDEAATITG SIGMLPSASL GDEKPALFEP IHGSAPDIAG QDKANPLATI 
LSVGMLLRFG LGLEQEADAV DAAVADVIAQ GLRTGDIAGP GEAVLGCRAM GAAVVDRLQA 
RKD