Gene Dret_0439 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0439
Symbol
ID	8418244
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	541603
End bp	542763
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	62%
IMG OID	645037000
Product	Isocitrate dehydrogenase (NADP(+))
Protein accession	YP_003197314
Protein GI	258404572
COG category	[C] Energy production and conversion
COG ID	[COG0538] Isocitrate dehydrogenases
TIGRFAM ID	[TIGR00183] isocitrate dehydrogenase, NADP-dependent, prokaryotic type

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.364858
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACGAAC GTCAAGTCTA TTGGATTGAG GGCGACGGCA TCGGGGCTGA AGTCTGGCGT 
GCGGCGCGCC CGGTATTGGA CGGGGCAATC CGAGCCGCGT ACGGGGAATC GCGCCGGCTG 
GTCTGGGAAG AGTTGCTGGC TGGAGAAAAG GCCTACGCCG AAACCGGGAA CTATCTCCCG 
GAGGCGACCC TTGCTGCGCT GCAGGGGGCG GATCTGGCCA TGAAAGGGCC CTTGGCGACT 
CCGGTGGGAA CCGGCTTTCG CAGTCTCAAT GTGACTTTGC GCCAGACCCT GGAACTCTAT 
GCCTGCATTC GGCCGGTGCA GTATTTCCAG GGGATCGAGT CGCCGCTCAA GGCCCCGGAG 
AAGGTGGATA TGGTCGTTTT CCGGGAAAAT ACCGAGGATG TCTATGCCGG TATCGAATGG 
CCGGCTGGAA GTAAAGAGGC CCGGAAGCTG GCGGCCTTTT TGCGCGAGGA ACTCGGGGCT 
CGGATCGATG ACCTGGCCGG GATCGGCATC AAGCCGATGA CCGAAAAAGG CAGCAAGCGG 
CTGGTGCGCA AGGCCCTGCA ATTCGCTCTC GACCAGCGGC GCGAGAGCGT GACCCTGGTG 
CACAAGGGCA ATATCATGAA ATACACCGAA GGCGCCTTTC GTGGCTGGGG CTACGAATTG 
GCCGAAGAGG AATTCGGAAC GCAGACGGTG ACCGAAAGCC AGGACGCTGG CGGCAAACTG 
GTGGTCAAGG ACCGCATTGC CGACGCCATG TTCCAGGAGG TCCTGATTTC TCCGGAAAAA 
TACGATGTCA TCGCCACGAC GAATCTCAAT GGCGACTATC TCTCCGATGC GCTGGCAGCG 
CAGGTCGGCG GTCTGGGATT GGCGCCGGGC GTGAATATGA GCGACCAACT CGGCTTTTTC 
GAGCCGACCC ACGGCACGGC CCCGACCATC GCCGGCCAGG ACAAGGCCAA TCCCGGAAGC 
CTGATCCTGT CCGGGGCGCT GTTGCTGGAC CACATTGGAT GGCATGAGGC GGCTGGGCTG 
GTGCGTGCCG GGGTTGAAGC CGCGCTGGCG ACCAAGGAGG TGACCGTGGA TCTGGCCTCG 
CAGATCAGCG GCGCGAAGAC TGTTGGCTGC CAGGGATTTG GGGAACGGAT TCTTCAGGGT 
GTGGAAGACG CCGCACAATA G

Protein sequence

MDERQVYWIE GDGIGAEVWR AARPVLDGAI RAAYGESRRL VWEELLAGEK AYAETGNYLP 
EATLAALQGA DLAMKGPLAT PVGTGFRSLN VTLRQTLELY ACIRPVQYFQ GIESPLKAPE 
KVDMVVFREN TEDVYAGIEW PAGSKEARKL AAFLREELGA RIDDLAGIGI KPMTEKGSKR 
LVRKALQFAL DQRRESVTLV HKGNIMKYTE GAFRGWGYEL AEEEFGTQTV TESQDAGGKL 
VVKDRIADAM FQEVLISPEK YDVIATTNLN GDYLSDALAA QVGGLGLAPG VNMSDQLGFF 
EPTHGTAPTI AGQDKANPGS LILSGALLLD HIGWHEAAGL VRAGVEAALA TKEVTVDLAS 
QISGAKTVGC QGFGERILQG VEDAAQ