Gene Daud_1102 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1102
Symbol
ID	6027553
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	+
Start bp	1159833
End bp	1160909
Gene Length	1077 bp
Protein Length	358 aa
Translation table	11
GC content	62%
IMG OID	641593916
Product	NADH-ubiquinone oxidoreductase, chain 49kDa
Protein accession	YP_001717245
Protein GI	169831263
COG category	[C] Energy production and conversion
COG ID	[COG3261] Ni,Fe-hydrogenase III large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCGAGGA TGACCTTTCC GTTCGGCCCG CAGCATCCTG TGCTCCCGGA AGCGATTCAG 
CTAAAGCTGA CCGTGGAGGA TGAAAGAGTC GTCGAGGTGC TGCCGGCGAT CGGGTACATG 
CACCGGGGCA TCGAGAAGGC GGCCGAACGG AACCCGTACA TCAACAATGT GTTTCTGTGC 
GAGCGGATCT GCGGGATCTG CAGTTTCATC CACGGGATGG CTTACTGCCA GACGATCGAG 
GAGATCATGA AGGTGGAAGT GCCGCCCCGC GCCAAATACC TGCGGGTAAT GTGGAGCGAG 
CTTTCGCGTC TGCACAGCCA CCTATTGTGG CTCGGGCTAC TGGCCGACTC CTTCGGCTTT 
GAGAGCCTGT TCATGCAGTG CTGGCGTGCC CGGGAGATCG TGCTCGATAT GCTGGAGATG 
ACCACCGGGC AGCGGGTGAT CCAGTCCACC TGCGTCATCG GCGGTGTGAG GCGGGACATC 
GACGCCGACC AGGCTGCCCG CCTGCGGGAA ATGCTGAAAA CATTGAAGCC GCAGATCGAC 
GCCGTGATCC CAGTGTTCAA GCATGACTAC ACCATCAAGT CCCGCACGGT AGGCAGGGGT 
GTGCTGCCGA AGGATCAGGC CTGGACTCTG GGCGCGGTCG GGCCGACCTT GCGTGGCAGC 
GGCGGCACCT GGGACGCCCG CTCAACCGGT TACGCGGCGT ACGGCGAGCT TGAGTTTGAG 
CCGGTGGTCG AGACCGACGG CGACAGCTAC GCGCGGACCA TGGTGCGGGT CCGGGAAACG 
TATCAGGCTT ACGAACTGGT GTTGAAGGCG CTGGACCGGC TGCCGGAAGG CGAGACCAGG 
GTCAAGGTGA AAGGTTCCCC GAATGGTGAA GCCGTAATGC GGGTCGAGCA GCCGCGCGGG 
GAGCTTTTCT ACTACGCTCT GGGCAACGGA ACCGTGCGCC TGGAGCGATT GAAGGTGCGC 
ACGCCGACGT TCGCCAACAT TCCGGCGCTG CTGACCATGC TGCCCGGCTG TGAGATCGCC 
GACGTTCCGG TCATCGTACT GTCGATCGAC CCGTGCATGT CGTGTACCGA AAGGTGA

Protein sequence

MPRMTFPFGP QHPVLPEAIQ LKLTVEDERV VEVLPAIGYM HRGIEKAAER NPYINNVFLC 
ERICGICSFI HGMAYCQTIE EIMKVEVPPR AKYLRVMWSE LSRLHSHLLW LGLLADSFGF 
ESLFMQCWRA REIVLDMLEM TTGQRVIQST CVIGGVRRDI DADQAARLRE MLKTLKPQID 
AVIPVFKHDY TIKSRTVGRG VLPKDQAWTL GAVGPTLRGS GGTWDARSTG YAAYGELEFE 
PVVETDGDSY ARTMVRVRET YQAYELVLKA LDRLPEGETR VKVKGSPNGE AVMRVEQPRG 
ELFYYALGNG TVRLERLKVR TPTFANIPAL LTMLPGCEIA DVPVIVLSID PCMSCTER