Gene Ddes_1039 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ddes_1039
Symbol
ID	7284720
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio desulfuricans subsp. desulfuricans str. ATCC 27774
Kingdom	Bacteria
Replicon accession	NC_011883
Strand	-
Start bp	1215541
End bp	1216488
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	58%
IMG OID	643581840
Product	hydrogenase (NiFe) small subunit HydA
Protein accession	YP_002479624
Protein GI	220904312
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.370707
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTATTG CCGTGGGTCT GGGCAAAGAA GGCGGAGAAG AGCGTTTGGA GCGCCAGGGC 
ATCAGCCGCC GCGATTTCAT GAAATTTTGT ACAGCGGTGG CCGTGGCCAT GGGCATGGGA 
CCGGCTTTTG CTACCGATGT GGCTGCCGCC CTTACTGGGC GTCGTCCTTC GGTGGTGTAC 
CTGCACGCCG CCGAGTGCAC GGGCTGTTCC GAAGCGCTGT TGCGCACCTA TCAGCCCTTC 
ATTGACACTC TTATTCTTGA CACCATTTCT CTTGACTATC ACGAAACCAT CATGGCCGCC 
GCCGGTGAAG CTGCCGAAGA GGCCCTTCAG GCCGCCGTCA ACGGGCCTGA CGGTTTCATC 
TGCCTTGTCG AAGGCGCTAT CCCCACGGGC ATGGACAACA AGTACGGCTA TATTGCCGGA 
CACACCATGT ACGACATCTG CAAAAACATC CTGCCCAAGG CCAAGGCCGT TGTCAGCATC 
GGCACCTGTG CCTGTTACGG CGGCATTCAG GCGGCCAAGC CCAATCCCAC CGCCGCCAAG 
GGCATCAATG ACTGCTATGC GGATCTGGGC GTCAAGGCCA TCAACGTGCC TGGCTGCCCG 
CCCAACCCCC TGAATATGGT TGGTACTCTT GTGGCTTTCC TCAAGGGCCA AAAAATCGAG 
CTGGACGAAG TGGGCCGCCC CGTTATGTTC TTTGGACAGA GCGTGCATGA CCTCTGCGAA 
CGCCGCAAGC ATTTCGACGC CGGTGAGTTT GCGCCTTCCT TCAACTCTGA AGAAGCGCGC 
AAGGGCTGGT GCCTCTACGA TGTCGGCTGT AAAGGACCAG AGACCTACAA CAATTGTCCC 
AAGGTTCTTT TCAACGAGAC CAACTGGCCG GTGGCTGCCG GGCATCCCTG CATAGGCTGC 
AGTGAGCCCA ATTTCTGGGA CGATATGACG CCGTTCTACC AGAACTAG

Protein sequence

MRIAVGLGKE GGEERLERQG ISRRDFMKFC TAVAVAMGMG PAFATDVAAA LTGRRPSVVY 
LHAAECTGCS EALLRTYQPF IDTLILDTIS LDYHETIMAA AGEAAEEALQ AAVNGPDGFI 
CLVEGAIPTG MDNKYGYIAG HTMYDICKNI LPKAKAVVSI GTCACYGGIQ AAKPNPTAAK 
GINDCYADLG VKAINVPGCP PNPLNMVGTL VAFLKGQKIE LDEVGRPVMF FGQSVHDLCE 
RRKHFDAGEF APSFNSEEAR KGWCLYDVGC KGPETYNNCP KVLFNETNWP VAAGHPCIGC 
SEPNFWDDMT PFYQN