Gene Dret_1037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1037
Symbol
ID	8418860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	1224904
End bp	1226202
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	58%
IMG OID	645037607
Product	protein of unknown function DUF224 cysteine-rich region domain protein
Protein accession	YP_003197903
Protein GI	258405161
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.106795
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	0.550231
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTGCGG ATTTGCAAGA ACTTGCAAAA CTCTTGCGAG ATATAGACGA CCAGTTGGTC 
AGCTGCATGA AATGCGGTAT GTGCCAAGCG GCCTGCCCCC TGTTTGCTGA GACAGGCCGT 
GAGGCTGACG TCGCGCGCGG CAAGATCGCC TTGCTCGAGA ACCTGGCCAA CGAAATGATA 
GAAGACCCCA AAGGCGTCAA AGACCGCCTT GACAAGTGCC TGCTGTGCGG ATCCTGTGCG 
GCCGCCTGTC CCAGCGGGGT CAAGGTCCTG GACATCTTCA TCAAGGCCCG AGCCATCATC 
ACCGGCTATA TGGGGCTGTC CCCGGCCAAG AAAGCCATCT TCCGGGGCAT GCTCCAGCAC 
CCCGAACTCT TCAACAATGT CGTGGGTGTG GCCTCGAAAT TCCAAGGGCT GTTTACCAAG 
CCGGTAAACG ACATGATCGG TTCCTCCTGT GCGCGGTTCA TGTCCCCGCT CATTGGGGAC 
CGCCACTTCC AGCCCTTGGC CAAGGAGCCG CTGCACAAAA AATACGGCAA AGTGGACACG 
GCCGCCGGCA AAAGCGGCAT CAAGGTCGCC TTGTACCCCG GCTGCCTCGT GGACAAAATC 
TTCCCGCGCG TCGGCGATGC GGTCATGAAA ATCCTGGAAC ACCACGGTGT CGGAGTCTAC 
ATGCCGCTGA AGCAGGCCTG CTGTGGCATC CCGGCCATCT CCTCCGGAGA CAAGCAGACC 
TACGACAAGC TGGTCAAACA AAACCTCGAG GTGTTTGAAA AAGGCGACTT CGATTACCTC 
CTGACGCCGT GCGCGACGTG CACCTCGACG ATCAAAAAGA TCTGGCCCCT TATGGCCGAA 
GATTACGAAG GCGCCCTGCG CAACCGGGTC AACCTCCTCT CTGACAAGAC CATGGACGTC 
AACGCATTTC TGGTCGACGT CCTCGGAGTG AAGGGAATCG CGGAGCCCAA TGCTACGGCT 
AAATCCATCA CCTATCATGA CCCCTGTCAC CTCAAGAAAT CCCTTGGCGT GGCCGCACAG 
CCCCGGACGC TGCTGCATAC CAACCCCGGA TATGAGCTCA AGGAAATGTC CGAGTCCGAT 
CGGTGCTGTG GCATGGGCGG CAGCTTCAAC ATCCAGCACT ACGACCTTTC GGAAAAGATT 
GGCGGGCACA AACGCGACAG CATCCTGGCC ACCAAGGCTC AGGTTTTGGC CACTGGATGC 
CCGGCTTGCA TGATGCAGAT CTCCGATCTG CTTTCGCACA GCGACGCTCA GATCGCCATC 
AAGCACCCGG TTGAAATCTA CGCCGAAACA TTGCCCTAA

Protein sequence

MSADLQELAK LLRDIDDQLV SCMKCGMCQA ACPLFAETGR EADVARGKIA LLENLANEMI 
EDPKGVKDRL DKCLLCGSCA AACPSGVKVL DIFIKARAII TGYMGLSPAK KAIFRGMLQH 
PELFNNVVGV ASKFQGLFTK PVNDMIGSSC ARFMSPLIGD RHFQPLAKEP LHKKYGKVDT 
AAGKSGIKVA LYPGCLVDKI FPRVGDAVMK ILEHHGVGVY MPLKQACCGI PAISSGDKQT 
YDKLVKQNLE VFEKGDFDYL LTPCATCTST IKKIWPLMAE DYEGALRNRV NLLSDKTMDV 
NAFLVDVLGV KGIAEPNATA KSITYHDPCH LKKSLGVAAQ PRTLLHTNPG YELKEMSESD 
RCCGMGGSFN IQHYDLSEKI GGHKRDSILA TKAQVLATGC PACMMQISDL LSHSDAQIAI 
KHPVEIYAET LP