Gene Dole_2251 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_2251
Symbol
ID	5695099
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2728370
End bp	2729431
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	62%
IMG OID	641264857
Product	4Fe-4S ferredoxin iron-sulfur binding domain-containing protein
Protein accession	YP_001530132
Protein GI	158522262
COG category	[C] Energy production and conversion
COG ID	[COG0437] Fe-S-cluster-containing hydrogenase components 1
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.000010611
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGTGT CACGAAGAAA GTTTCTGGCC TGGATGGGAA CCGCCGGCGT CGGCCTGACC 
GGCGTTGGGC AGGCGGTCGC CGCCGGTCCC AAGGAGTTCA AGGGATACGC GAATTCGGTG 
GGTGTTCTTT TTGACGCCAC CCGGTGCGTG GGGTGCCGGT CCTGCGAAGC GGCCTGCAAC 
AAGGTCAACC AGTTACCGGC CCCGGAAAAA CCGTTTGACG ACCTGTCCGT ACTTGACGAA 
AAACGCCGCA CCGATGCGGA ATCGTTTACC GTGGTCAATC GTTACACCCC GCCGGGGGCC 
GCCAGGCCCG TGTTCCGAAA GATTCAGTGC AACCACTGCC TGGAACCGGC CTGCGCATCG 
GCCTGTTTTG TCAAGGCCTT CAAAAAGACT CCCCAGGGGC CGGTCACTTA CGACGCTTCA 
GTCTGCGTGG GATGCCGCTA TTGCATGATC GCCTGTCCCT TTGAAATCCC GTGTTACGAA 
TATGATAAAG TCCTTACGCC CCGGGTCACC AAGTGTACCC TGTGCGCGCC CCGGCTCAAA 
CAGGGGCTGC TGCCCGGCTG CGTGTCGGCC TGCCCCATGG AGGCCCTTAC CTTCGGCAAG 
CGGGAAGACC TGTTGAAAAT CGCCCACGAA CGCATTCGCG CCTATCCCGG GCGATACGTA 
GACCATGTCT ACGGCGAGCG TGAGATGGGC GGCACCAGCT GGCTCCACCT GTCCGGGGTT 
CCCTTTGGCC AGATCGGCAT GCGCGAGGAC CTGGGCACCA CGCCGGCGCC CCAGCTCACC 
AAGGGCGCCC TGTCCGTGGT TCCCATGGTG ACCGGTCTGT GGCCGGTACT GCTGGTGGGC 
ATCTATGCCA TCACCCAGCG CAAGAACAAG ATCGCCCGGG AGGAACAGGC CGAGGCGGTG 
GCCACTGCCG TGGCCCAAAC CCAGGCCGAG GCCGAGGCCA AGCTGGCCAA GGCCAGGGAA 
GCCGCTGAAA AACAGAAACA GACCGCCATT GACCAGGCCG TGAAAAAGGC CCTGGAAGAA 
GCGGCGGCAG AAGAAAAAAG TCAAGATACG GAGGAGTCCT GA

Protein sequence

MSVSRRKFLA WMGTAGVGLT GVGQAVAAGP KEFKGYANSV GVLFDATRCV GCRSCEAACN 
KVNQLPAPEK PFDDLSVLDE KRRTDAESFT VVNRYTPPGA ARPVFRKIQC NHCLEPACAS 
ACFVKAFKKT PQGPVTYDAS VCVGCRYCMI ACPFEIPCYE YDKVLTPRVT KCTLCAPRLK 
QGLLPGCVSA CPMEALTFGK REDLLKIAHE RIRAYPGRYV DHVYGEREMG GTSWLHLSGV 
PFGQIGMRED LGTTPAPQLT KGALSVVPMV TGLWPVLLVG IYAITQRKNK IAREEQAEAV 
ATAVAQTQAE AEAKLAKARE AAEKQKQTAI DQAVKKALEE AAAEEKSQDT EES