Gene Dhaf_2235 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dhaf_2235
Symbol
ID	7259204
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfitobacterium hafniense DCB-2
Kingdom	Bacteria
Replicon accession	NC_011830
Strand	+
Start bp	2414422
End bp	2415600
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	49%
IMG OID	643562124
Product	Rubrerythrin
Protein accession	YP_002458704
Protein GI	219668269
COG category	[C] Energy production and conversion
COG ID	[COG1592] Rubrerythrin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.00102881
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTGCAA TTAGAAATAT TGATCTCTGT ACCAAGGATT GCCTGTGTCT TTATGTTTGC 
CCGACAGGAG CAACCGATAC AGAAACAGGT CAGATTGACC CTGACAAATG CCTGGACGGA 
TGCCGGGCCT GCGTCGACGC CTGCCCATCC CACGCCATAT CCTTTGTGCC TGAGGTATAT 
CCTCCTCAGC AAGGAAAATC CCCTTCGGTA AAAAGAGCCA TGTTATCTTT ATCGGCAAGT 
AAAACCAAAC AGGAAAAGAT CGCGGCCCAA GTGGCGGAGC GATCAGGCAG CCCGATTTTG 
CGGCAGTTTG CCGAAGCCTT AAGCGCCTCC AACCGGCTCA TGGCCGAAGA TATTCTGCGT 
GAAGCCGGGT ATCTGCTGCC TCAGAGCGTC AACGCTCAGG ATTTTCTTCA ATCCTTGCTG 
GACAGCCCCC AAGGGGAGGA TTTTCCCAGG GAAGCGGCGG CAAGATTATT AGCGAAACTG 
AAAACCAATC AGGCAAAAGG GCAGGAGGAG AAAAAAATGA CTCACTATCG TTGTTCAATT 
TGTGGTTACC TTCATGAAGG AGAATTAACC GCGGACTTTA AATGTCCAAT CTGTAAACAA 
CCCGCTTCCG TATTTCAACT GGTAGAAGAG AAGGGGAGTG CAGGCAATCC TTACGCCGGC 
ACCAAAACAG AGAAAAATCT TCTGGACGCC TTTGCCGGAG AAAGCCAGGC CAGAAATAAA 
TATACTTATT TCGCCGCCAT AGCCCAAAGA GAGGGATACG ATCAAATTGC CGAACTCTTT 
TTGCATACGG CAAGGAATGA GCAGGAACAT GCCCGCATCT GGTATGAAGA GCTGGGCAAT 
CTGGGCAGGA CCGCCGAAAA CCTTTTGCAT GCGGCTGAAG GGGAAAACTA TGAATGGACG 
GATATGTACG ACCGCTTTGC CAAGGATGCT GAAGCGGAAG GGTTCAAGGA TTTAGCGGCA 
AGATTCCGCA AAGTGGGTGC TATCGAGAAA GCCCATGAAG AAAGATACCG TGCCTTGCTG 
AAAAACGTGG AAATGCAGCA GGTCTTTGCC AAAGGGGAAG AAGCCATGTG GGAATGCCGT 
ATCTGCGGGC ATCTTGTCAT GGGCAGGAAA GCCCCCGATG TTTGCCCGGT ATGTAAGTAT 
TCCCAGAGTT ATTTTGAAGT AAGAAAAGAA AACTATTAA

Protein sequence

MPAIRNIDLC TKDCLCLYVC PTGATDTETG QIDPDKCLDG CRACVDACPS HAISFVPEVY 
PPQQGKSPSV KRAMLSLSAS KTKQEKIAAQ VAERSGSPIL RQFAEALSAS NRLMAEDILR 
EAGYLLPQSV NAQDFLQSLL DSPQGEDFPR EAAARLLAKL KTNQAKGQEE KKMTHYRCSI 
CGYLHEGELT ADFKCPICKQ PASVFQLVEE KGSAGNPYAG TKTEKNLLDA FAGESQARNK 
YTYFAAIAQR EGYDQIAELF LHTARNEQEH ARIWYEELGN LGRTAENLLH AAEGENYEWT 
DMYDRFAKDA EAEGFKDLAA RFRKVGAIEK AHEERYRALL KNVEMQQVFA KGEEAMWECR 
ICGHLVMGRK APDVCPVCKY SQSYFEVRKE NY