Gene Dbac_1047 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dbac_1047
Symbol
ID	8376708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfomicrobium baculatum DSM 4028
Kingdom	Bacteria
Replicon accession	NC_013173
Strand	+
Start bp	1141869
End bp	1143158
Gene Length	1290 bp
Protein Length	429 aa
Translation table	11
GC content	57%
IMG OID	645000287
Product	protein of unknown function DUF224 cysteine-rich region domain protein
Protein accession	YP_003157576
Protein GI	256828848
COG category	[C] Energy production and conversion
COG ID	[COG0247] Fe-S oxidoreductase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACTGCAG ACGTACATCA ACTGGCCAAA ATGCTGCATG AACTCGACGA CCAGATGGTC 
GCGTGCATGA AGTGTGGCAT GTGCCAGGCG GTATGCCCGG TGTTTGCCGA AACCATGAAT 
GAGGGGGATG TGGCCCGGGG CAAGATCGCG CTCCTGGAAA ACCTGTCCCA TGAAATGATC 
AAGGACCCCG AAGGCGTTCA GGAAAAGCTC AACATGTGCC TCTTGTGCGG CTCATGCGCG 
GCCAACTGTC CCAGCGGCGT GAAAGTGCTG GACATCTTCC TGAAAGCCCG CGTCATCGTG 
AATACGTACA TGGGCTTGCC CGCAGTCAAG AAGGCCATTT TCCAGGGTCT TTTGACCAAG 
CCCGGCGTGT TCAATTCCGT GATGGACCTG GCTTCCAAGT TCCAGGGCGT GTTCACCAAG 
CCCGCCAACG AAGTCATCGG ATCGTCCTGT TCACGTATCG ATCTGGCTGC CATCGAAGGC 
CGCCATTTCA TGCCTCTGGC CAAGAAGTCC TTGCGCAAGC TGGAGCCGTC CCGCAACACC 
CGCCCTGGCA AGAGCGGATA CCGCGTGGCC TTTTTTCCGG GCTGCGTCAT CGACAAGATA 
TTCCCGCATG TCGGGCAGGC CGTGCTCAAG GCTCTGACGC ATCATGAGGT TGGCATCTAC 
ATGCCGACAG GGCAGGCTTG CTGCGGTATC CCGGCTCTGG CTTCGGGCGA CAAGGGGTCT 
TTTGACAAGC TTGTGAAGCG TAATCTGGAG ATCTTTGAAA AAGAGAACTT CGATTATCTG 
CTCACTGCCT GCGCGACCTG CACGGCGACC ATGCATGAAC TGTGGCCGCT CATGTCCGGG 
GACAAGACCC AGAGCATGCA GGATCGCATC GCGGCCATGT CGGCCAAGGT CATGGACGTG 
AACCAGTTCA TGGTTGACGT GCTGAAGGTC TCCATGCCTG TCAGCGGACA CGGGACCAAG 
GTCACGTATC ATGATCCCTG TCACCTCAAA AAATCCATGA AGGTTTTTGA ACAGCCCCGT 
GCGCTCTTGA AGTCCAACCC GAACGTGGAG CTTGTTGAGA TGGCCGATGC GGACCGCTGC 
TGCGGTTGCG GCGGCAGCTT CAACCTGCAG CACTACAGCG TATCGAAGAG TATCGGCGAC 
CAGAAACGGG ACAATATCGT TGCTTCCGGA GCTCAGGTAG TGGCCACAGG ATGCCCGGCG 
TGCATGCTGC AGATTTCCGA CATGCTTTCA CAGCACAAGG ATCAGATCGC AGTCAAACAC 
GTCATGGAAA TCTACGCGGA AACGCTTTAA

Protein sequence

MTADVHQLAK MLHELDDQMV ACMKCGMCQA VCPVFAETMN EGDVARGKIA LLENLSHEMI 
KDPEGVQEKL NMCLLCGSCA ANCPSGVKVL DIFLKARVIV NTYMGLPAVK KAIFQGLLTK 
PGVFNSVMDL ASKFQGVFTK PANEVIGSSC SRIDLAAIEG RHFMPLAKKS LRKLEPSRNT 
RPGKSGYRVA FFPGCVIDKI FPHVGQAVLK ALTHHEVGIY MPTGQACCGI PALASGDKGS 
FDKLVKRNLE IFEKENFDYL LTACATCTAT MHELWPLMSG DKTQSMQDRI AAMSAKVMDV 
NQFMVDVLKV SMPVSGHGTK VTYHDPCHLK KSMKVFEQPR ALLKSNPNVE LVEMADADRC 
CGCGGSFNLQ HYSVSKSIGD QKRDNIVASG AQVVATGCPA CMLQISDMLS QHKDQIAVKH 
VMEIYAETL