Gene Dole_2063 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2063
Symbol
ID	5694906
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2514490
End bp	2515647
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	57%
IMG OID	641264664
Product	4Fe-4S ferredoxin iron-sulfur binding domain-containing protein
Protein accession	YP_001529944
Protein GI	158522074
COG category	[C] Energy production and conversion
COG ID	[COG1148] Heterodisulfide reductase, subunit A and related polyferredoxins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000008917
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCGACA AAGAAGCAGT TGAACAGAAA TTCAAAAAGG CAGCGGGACT GATCTCAAGC 
GCGGGCATGA TTCCCTTTGC GGTGACCGAT ACGCTTTTAG AGATCGTCAG GTTCTATCTG 
GATGAAGCGG ATGCCGACTT TATCAATGCC GCCTTTGACG GTGCCAAATC CCTCTCCATA 
GACCAGCTCA AAGAGAAGAC CGGTCTTTCG GAAGAGGAGA TAACAGCCAG AACCGATTCG 
CTGGCCAAAA AAGGCATTCT GTTCAACCAG CCCAACAGCC GGGGCGTCAT GGTTTACCGG 
TTGTTGCCCC TGATCCTGGT GGGGGCCTTT GAATATACCT TCATGAACAA ATTGCCCGAG 
GGAAAAGAGC GGGAGCCGCT TGAAAAGATC GCAAAGCTTT ATCACACCCT GCTGCAGGAG 
TTGCGGGATA ACATGCAGCG CGGTTACGAC AACCTGCTGC CGATCTTTGA GCAGCAGCCC 
CCGGTGGACC GGACCGTTCC CACTTTTACC ACGGAAACCG GCAACACCAT TCAGATCAAC 
AGGGCCATTG GGGCCGAAGA CACCGTGCTG CCGGCCCAGA CCGTTGAAGA AATCATCAAC 
AAGTTTGACG ATATCGCCGT GGGCCACTGT TTCTGCCGGA ACTACAACAA GGTGCTGGGC 
CATGACTGCG AAATTCATGC ACCCGCCGAG GTCTGCTTTA CCTTCGGCAA GTCCGCCCGC 
CACACCGTGG CCCAGGGGTT TGCCCGGCTG GTGTCAAAAG AGGAGGCCCT GGCCATCATG 
AAGCAGGCGG AAGAGGCCGG CCTGGTCCAC AAAGCCTTTC ACAACGGCTC GAATATCAGC 
AAGGAAGAAA ACAGCATCTG CAACTGCTGC AAGGACTGCT GCGACACCTT TACCCTCTGG 
CGCAACGGCG CCACACCCAT GATCAACTCC ACCAACTACC TGTCCGTCAT TGACGAGGAC 
ACGTGCACCG GCTGCGGCAT CTGCGTGGAA CGCTGCCCGG TGGATGCCAT TGTGCTGGGC 
AGTGAGGGCA CGGCGGTTCG CGAGGAAAAA TACTGCATCG GCTGCGGCAT CTGCGCCCGT 
TTCTGCCCCG AAGGGGCCAT CTCCCTTCAG GAGGGCATGA GACGGGTTTA TGTTCCGCCC 
CCACGCTTGA GAGCATAG

Protein sequence

MSDKEAVEQK FKKAAGLISS AGMIPFAVTD TLLEIVRFYL DEADADFINA AFDGAKSLSI 
DQLKEKTGLS EEEITARTDS LAKKGILFNQ PNSRGVMVYR LLPLILVGAF EYTFMNKLPE 
GKEREPLEKI AKLYHTLLQE LRDNMQRGYD NLLPIFEQQP PVDRTVPTFT TETGNTIQIN 
RAIGAEDTVL PAQTVEEIIN KFDDIAVGHC FCRNYNKVLG HDCEIHAPAE VCFTFGKSAR 
HTVAQGFARL VSKEEALAIM KQAEEAGLVH KAFHNGSNIS KEENSICNCC KDCCDTFTLW 
RNGATPMINS TNYLSVIDED TCTGCGICVE RCPVDAIVLG SEGTAVREEK YCIGCGICAR 
FCPEGAISLQ EGMRRVYVPP PRLRA