Gene Daud_1041 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daud_1041
Symbol
ID	6027582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Desulforudis audaxviator MP104C
Kingdom	Bacteria
Replicon accession	NC_010424
Strand	+
Start bp	1094025
End bp	1094981
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	61%
IMG OID	641593853
Product	hydrogenase (NiFe) small subunit HydA
Protein accession	YP_001717185
Protein GI	169831203
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.225928
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGCGCAAGC TTACCAGGCG GGAATTCGTA AAAATGTGCG GTATGTCCGC CGCCGGGCTG 
AGCCTGATGT CGCTGCTGGG TCCCCAGATC ACCCACGCAC TGGCCAAGGC GGTCGAGGAC 
AAGGTGCCCG TCGTCTGGAT TCAGGGTGCG AGCTGCACCG GATGTTCGGT TTCGCTCCTG 
AATGCCGTGG ATCCGTCCAT TGAGAAAGTG CTGCTCGAGG TTATCAGCCT GCGCTACCAC 
CCGAACATAA TGGCCGCTTC CGGGTATCTG GGCACCGCGG TCATCGAGGA TGTGGCCGCC 
CGGTTCGCCG GGGAGTTCAT CCTGGTCGTC GAAGGCGGCA TACCGGTGAA CGAGAAGGGC 
AAGTATTGCG TAATCGGCAA ATTCGGTAAG AAAGAAATGA CCGCCCACGA GGCTCTGCTG 
ACCCTGGGCG CCAAAGCCAA GGCGGTCGTG GCCGCCGGTC AATGTGCCGC CTTCGGCGGG 
ATCCCGGCAG GGGCTCCGAA CCCGACCGGT GTGTTGGGCG TTGACGCGGT GCTCAATCCG 
ATGCGCTATC GCCGGCCGCT GGCTAAAAAC GTGATCAATA TTTCCAACTG CCCGCTGCAT 
CCGGACCACT TCCTCGGCAC CCTCACCTAT GTGTTGACCT ATAACGAAAT CCCCGAACTT 
GACCGTTACG GGCGCCCGGT GATGTTTTAC GGGCAGTCCA TTCACGACAA CTGCCCCCGG 
CGGCCTGACT TTGAAGCCGG CCGTTTCGCC GCCGTAATCG GGGACGAGGG CTGTCTGGCA 
GGCCTGGGCT GCAAGGGGTT TATTGCTATG TCGGATTGTC CGCGACGGGG CTGGAACAGC 
GGGACAAACT GGTGCATCGC GGCCGGGGCG CCGTGTTATG CTTGTTCGGA GCAGATCTTT 
CCGGACGGGT GTTCCCCGAT TTACGGTGCG ATGCCGGTAA CCGGGAACGG CAGATAA

Protein sequence

MRKLTRREFV KMCGMSAAGL SLMSLLGPQI THALAKAVED KVPVVWIQGA SCTGCSVSLL 
NAVDPSIEKV LLEVISLRYH PNIMAASGYL GTAVIEDVAA RFAGEFILVV EGGIPVNEKG 
KYCVIGKFGK KEMTAHEALL TLGAKAKAVV AAGQCAAFGG IPAGAPNPTG VLGVDAVLNP 
MRYRRPLAKN VINISNCPLH PDHFLGTLTY VLTYNEIPEL DRYGRPVMFY GQSIHDNCPR 
RPDFEAGRFA AVIGDEGCLA GLGCKGFIAM SDCPRRGWNS GTNWCIAAGA PCYACSEQIF 
PDGCSPIYGA MPVTGNGR