Gene Daud_1042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1042
Symbol
ID	6026860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	+
Start bp	1095001
End bp	1096458
Gene Length	1458 bp
Protein Length	485 aa
Translation table	11
GC content	62%
IMG OID	641593854
Product	nickel-dependent hydrogenase, large subunit
Protein accession	YP_001717186
Protein GI	169831204
COG category	[C] Energy production and conversion
COG ID	[COG0374] Ni,Fe-hydrogenase I large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.90765
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTGGCG CACGGAAAAT AGTTGTGGAT CCGGTAACCC GGATTGAGGG CCACCTGAAA 
ATCGAGGTCG AGTTGGACGG GAACCGGGTG CACGACGCCT GGTCCACGGG CCTGCTTTTC 
CGTGGTTTGG AAATCATCTT AAAAGGGCGT GATCCGCGGG ACGCCCAGCA TATCACCCAA 
CGCATCTGCG GCGTCTGACC GATCTCGCAC GGCATCAGTT CGGTGCTATG TCTCGATGAC 
GCCTTTGGGA TCATTCCGCC TAAGAACGGC CGTATTCTGA GAAACCTGAT TCAGGGTGCC 
AACCTGATTC AGTCACACAT TCTTCATTTT TACCATCTGG CCGCGCTTGA CTACGTGAAG 
GGACCGGAAA CCGCGCCTTT CGTGCCGCGT TACGAGGGCG ACTATCGTTT ACCGCCGGAC 
GTGACAGCGG TGGTGGTGGG ACACTACATC CAGGCGTTAG CGATGCGCCG CAAAGCCCAC 
GAAATGGCAG CGATCTTCGG GGCGAAAATA CCCCACACCA CGGTGTTTAT CCCCGGTGGC 
GTAACCTCCA CGGTCACGGC TGAGCAGGTG GAGGCCTACG CCCAAAAACT CCGCGAACTG 
ATTTCCTTCA TCGACAACGT GTATATCCCC GATGTGCTGG CGGTGGCCGG CGCCTACGAG 
GACTGGTTCT CAGTCGGCGT GGGCACCAAG AACCTGCTGT CCTACGGCGC TTACCCGTTG 
ACGGACGAGA AAGACCCGAA TGGAAAGAAC CTCTTCTTCA CCCGCGGGGT CTACGCGGGA 
GGCTCGTTTA TGCCGATGTC CGCCGATCAT ATCCGTGAAC ACGTCACGCA CTCGTGGTAC 
GAGTCAAAGG CTGGCGGCAA GCACCCCTTC GAGGGAGAGA CGGTGCCGGC GGTGGACAAA 
CGGGGTGGGT ATTCCTGGAT CAAGGCTCCC CGGTACGAGT CCTATTCCTG TGAAGTCGGG 
GCCCTGGCCC GGCAGTGGGT CGGACGCGAC CCGCAGGTGA TCGGTCTTGG GGACAAAGCC 
TTCTCTGTGA TGGGACGGCA TTTCGCCCGG GCGATCGAGA CGACCAAGGT CGCGCACGCC 
ATGCTGGGCT GGCTCGAAGA ACTGGAGCCT GGGCAGCCCG CCTTCCGGCC GCACGATGTC 
CCGGAGAAAG CCAAGGGCTT CGGCCTGACC GAAGCGCCGC GGGGTGCCCT GGGGCACTGG 
ATCGAGATCG AAAACCACGT GATCAAGAAC TACCAGGCCG TGGTGCCCAG CACCTGGAAC 
ATCGGGCCGC GGGACGACAA GGGCGTCCGG GGACCGCTGG AAGAAGCGCT GGTGGGGACC 
GAGGTGGCCG ACCCGGACAA CCCGATCGAA CTGGTCCGGA TCGTGCGCGC ATTCGACCCC 
TGCATCGCCT GCGCCGTCCA CGTGATGGAG GTGCGCGGTG GTTCCGGCGT CTCCAGGTTT 
GTGGTCTCCG GCCGTTAA

Protein sequence

MAGARKIVVD PVTRIEGHLK IEVELDGNRV HDAWSTGLLF RGLEIILKGR DPRDAQHITQ 
RICGVUPISH GISSVLCLDD AFGIIPPKNG RILRNLIQGA NLIQSHILHF YHLAALDYVK 
GPETAPFVPR YEGDYRLPPD VTAVVVGHYI QALAMRRKAH EMAAIFGAKI PHTTVFIPGG 
VTSTVTAEQV EAYAQKLREL ISFIDNVYIP DVLAVAGAYE DWFSVGVGTK NLLSYGAYPL 
TDEKDPNGKN LFFTRGVYAG GSFMPMSADH IREHVTHSWY ESKAGGKHPF EGETVPAVDK 
RGGYSWIKAP RYESYSCEVG ALARQWVGRD PQVIGLGDKA FSVMGRHFAR AIETTKVAHA 
MLGWLEELEP GQPAFRPHDV PEKAKGFGLT EAPRGALGHW IEIENHVIKN YQAVVPSTWN 
IGPRDDKGVR GPLEEALVGT EVADPDNPIE LVRIVRAFDP CIACAVHVME VRGGSGVSRF 
VVSGR