Gene Dret_0833 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0833
Symbol
ID	8418651
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	985526
End bp	987373
Gene Length	1848 bp
Protein Length	615 aa
Translation table	11
GC content	59%
IMG OID	645037401
Product	indolepyruvate ferredoxin oxidoreductase, alpha subunit
Protein accession	YP_003197702
Protein GI	258404960
COG category	[C] Energy production and conversion
COG ID	[COG4231] Indolepyruvate ferredoxin oxidoreductase, alpha and beta subunits
TIGRFAM ID	[TIGR03336] indolepyruvate ferredoxin oxidoreductase, alpha subunit

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.187423
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	0.439959
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACATC CTTTGCTTGC CGATGCCCCG GGAACAACGC ACCTCTTGCT GGGTAACGAG 
GCCATAGCCC GCGGCGCCCT CGAGGCCGGT GTTGGTTGTG TGACCTGTTA TCCCGGCACC 
CCATCCTCTG AAGTCCCGGA CACTTTGTTC AGGGTCTCTC CAGAGGGGAA CTTCCACTTT 
GAATATTCAG TCAACGAAAA AGTGGCCTTG GAAGTCGGCG GAGGGGCTGC CCTGGGAGGC 
GTCCCCACTC TGGTGACCAT GAAACATGTC GGGGTCAATG TGGCCGCCGA TCCCTTGATG 
ACCCTGGCCT ATATCGGCAC ACCGGGAGGT CTGGTCCTGT TGAGCGCCGA CGACCCGGGC 
TGCCACTCCA GCCAGAATGA GCAGGATAAT CGGGCCTACG CCCGGCTGGC CGGGATGCCG 
TGCTTTGAAC CGTCAACGGC TCAGGAAGCC AAAGACATGA CCCGTGACGC CCTCCTGCTC 
TCGGCCAAAT GGCAGCAGCC TGTTATGCTT CGAACGACCA CCCGGGTGAA CCACCTCCGG 
GGCCCTGTGC GCTTCGACGC GTTGCCGCCC GCCAAACGGA CCGGCCAATT TGAAAAAAAT 
CCCATGCGCT TTGTGCCCAT TCCAGCTGTG GCTCGGGACA GGCACCCGAA GCTATTGCAC 
CAACTCGCCT CCATCGAAGA GGAAATCCAG AATCAAGAGT GGAATACGGT TTCCGGGCAA 
GGCCCTGTGG GCATCATCGC CAGCAGCATC TGCCGTGCCT ATGTCCAGGA CGCCTTGCTG 
GACATGCCTC AGGCCGACCA GTTCAGCCTG CTGGAACTCA AGGTCAGCTA TCCTCTGCCC 
CAGCACCAGC TCCTGGAATT CATTCAGGGA CGTGACAAGG TAGTTGTCGT CGAGGAACTG 
GAACCTTTTG TGGAAAGCGC CATTCGGGAA ATGGCCCAAC GCCATCAGCT GGATCTGGAA 
ATCATCGGGA AAAGCGAGTT CCTGCCGCGT TGCGGGGAAT TTTCCACCAG GACAGTCGCT 
CACGCCCTGG CCCAGGCAGT GGCAGGCACC CCGCCCTCTG CACCGGCCTG CCAAGGCCAG 
GAAGGACTTC CCAATCGACC GCCCAACCTG TGCGCCGGGT GTTCCCACCG GGCAACCTAT 
TACGCCGTGC GCCAGGTTTT CGGTGACGAG GCTATTTATT CCTCAGATAT CGGCTGCTAC 
ACCCTGGGCA TCCTGCCCCC GCTCAAGGCT GCGGACTTTT TGTTCTGCAT GGGATCTTCG 
GTTTCCGGAG GGTCCGGCAT GGCCGCGGCC ACGGGGCGGG ACGTTGTCGC TTTCATCGGC 
GACTCCACGT TCTTCCACTC CGGCATTACC GGATTGGTCA ATGCGGTCTA TAACGACCAC 
GACATCCTGG TTGTGGTCCT CGACAACCGT ACCACAGCCA TGACCGGCCA CCAGCCCCAC 
CCAGGGGTTG ACCAGACCGC TCTTGGCGAA AATGCAAACA AAGTGGACAT TGAGCAGATC 
GTCCGTGGTT GCGGTGTCAG TCAGATCAAG ACTGTCAAAC CGTTCAACCA CAAGGCCACT 
CTTGAGGCAT TGCAGGAACT CAAGGCCATG TCGGGTGTCC GAGTGCTCAT CGCCAAGGAT 
CCATGTGCGC TTTTTGCCAA ACGAGTGCTG AAGAAAAAGG CCCCGCAAGT GGCGTATGTA 
GCCCAACAGG GTCAGGAAGT GCTCCAGTGC GCCGAACAAG TGGCCTGTCC CGCCTTCACC 
ATCTCCGAAG GACAGGTGAC CATCAGCGAA GACCAGTGCA CGGGGTGCAT GCTCTGCGTT 
CAGATTTGCC CTGATATCAA AGCTCGGAAA AGGAGCGATA ATGGATAA

Protein sequence

MPHPLLADAP GTTHLLLGNE AIARGALEAG VGCVTCYPGT PSSEVPDTLF RVSPEGNFHF 
EYSVNEKVAL EVGGGAALGG VPTLVTMKHV GVNVAADPLM TLAYIGTPGG LVLLSADDPG 
CHSSQNEQDN RAYARLAGMP CFEPSTAQEA KDMTRDALLL SAKWQQPVML RTTTRVNHLR 
GPVRFDALPP AKRTGQFEKN PMRFVPIPAV ARDRHPKLLH QLASIEEEIQ NQEWNTVSGQ 
GPVGIIASSI CRAYVQDALL DMPQADQFSL LELKVSYPLP QHQLLEFIQG RDKVVVVEEL 
EPFVESAIRE MAQRHQLDLE IIGKSEFLPR CGEFSTRTVA HALAQAVAGT PPSAPACQGQ 
EGLPNRPPNL CAGCSHRATY YAVRQVFGDE AIYSSDIGCY TLGILPPLKA ADFLFCMGSS 
VSGGSGMAAA TGRDVVAFIG DSTFFHSGIT GLVNAVYNDH DILVVVLDNR TTAMTGHQPH 
PGVDQTALGE NANKVDIEQI VRGCGVSQIK TVKPFNHKAT LEALQELKAM SGVRVLIAKD 
PCALFAKRVL KKKAPQVAYV AQQGQEVLQC AEQVACPAFT ISEGQVTISE DQCTGCMLCV 
QICPDIKARK RSDNG