Gene Dbac_1970 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dbac_1970
Symbol
ID	8377643
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfomicrobium baculatum DSM 4028
Kingdom	Bacteria
Replicon accession	NC_013173
Strand	-
Start bp	2264138
End bp	2265085
Gene Length	948 bp
Protein Length	315 aa
Translation table	11
GC content	55%
IMG OID	645001195
Product	hydrogenase (NiFe) small subunit HydA
Protein accession	YP_003158474
Protein GI	256829746
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTCTTA GCAGACGTGA GTTCGTAAAA CTGTGCTCCG CAGGTGTCGC CGGATTGGGA 
ATTTCCCAGA TTTATCATCC GGGCATCGTG CACGCCATGA CCGAAGGAGC CAAAAAAGCT 
CCGGTCATCT GGGTACAGGG ACAGGGTTGT ACTGGTTGCT CCGTTTCTCT GCTCAACGCA 
GTCCATCCCA GAATCAAGGA GATTCTGCTG GATGTGATCA GCCTTGAGTT CCATCCCACC 
GTCATGGCAA GTGAAGGTGA GATGGCATTG GCGCATATGT ACGAAATTGC TGAAAAGTTT 
AACGGCAACT TTTTCTTGCT GGTGGAAGGT GCCATCCCCA CCGCCAAGGA AGGTCGCTAC 
TGCGTTGTCG GTGAAACTCT GGATGCCAAA GGGCATCATC ATGAAATCAC CATGATGGAA 
CTGATCCGGG ATCTGGCACC CAAGTCTCTG GCCACCGTGG CCATAGGTAC TTGTGCCGCT 
TACGGCGGCA TTCCCGCGGC TGCAGGCAAC GTCACCGGCT CCAAGAGCGT GCGTGACTTC 
TTTGCCGAAG AGAAGATCGA AAAACTGCTG GTCAACGTGC CCGGATGTCC GCCCCATCCG 
GACTGGATGG TCGGCACTCT GGTTGCCGCA TGGAGCCATG TCCTCAATCC GACCGAGCAT 
CCCCTGCCCG AATTGGATGA TGACGGCCGC CCGCTGCTGT TCTTTGGCGA CAACATCCAC 
GAGAACTGTC CGTATCTTGA TAAATACGAC AACTCCGAAT TCGCGGAAAC CTTCACCAAG 
CCGGGCTGCA AGGCCGAACT TGGCTGCAAG GGTCCGTCCA CCTATGCCGA TTGCGCCAAG 
CGTCGCTGGA ACAACGGCAT AAACTGGTGT GTCGAGAACG CCGTGTGTAT CGGCTGTGTG 
GAACCGGACT TTCCGGACGG AAAGTCTCCT TTCTATGTAG CGGAATAA

Protein sequence

MSLSRREFVK LCSAGVAGLG ISQIYHPGIV HAMTEGAKKA PVIWVQGQGC TGCSVSLLNA 
VHPRIKEILL DVISLEFHPT VMASEGEMAL AHMYEIAEKF NGNFFLLVEG AIPTAKEGRY 
CVVGETLDAK GHHHEITMME LIRDLAPKSL ATVAIGTCAA YGGIPAAAGN VTGSKSVRDF 
FAEEKIEKLL VNVPGCPPHP DWMVGTLVAA WSHVLNPTEH PLPELDDDGR PLLFFGDNIH 
ENCPYLDKYD NSEFAETFTK PGCKAELGCK GPSTYADCAK RRWNNGINWC VENAVCIGCV 
EPDFPDGKSP FYVAE