Gene Dvul_0719 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_0719
Symbol
ID	4662631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	886711
End bp	887685
Gene Length	975 bp
Protein Length	324 aa
Translation table	11
GC content	64%
IMG OID	639818937
Product	hydrogenase (NiFe) small subunit HydA
Protein accession	YP_966169
Protein GI	120601769
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA) [TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.534448
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTACA CGACACGCAT TCCGGCAAAA CTCCTTGCTC GACAGGCTGA AGACGGTCGC 
ATGACCCGCC GCGAGTTCAT GAAGTTCTGC GGCATCGTCG CCGTCGCCAT GGGCATGGGC 
CCCGGATTCG CCCCTGCCGT CGCCGAGGCG CTTCAGGCAA AGGGGCGCCC CAGCGTGGTG 
TACATGCATG GCGCAGAATG CACTGGCTGC ACCGAAGGTC TTCTCCGTTC CATCGACCCC 
TTCATCGACA TCCTGATGAT GGAGGTCATC TCGCTGGACT ACTGCGAGAC GGTGATGGCG 
GCAGCAGGCA GGGCCGCCCA TCATGCGCTG GAGGACGCCC TTCGCAACCC CGCGGGCTAC 
GTCTGCACCA TCGAAGGTGC CATTCCCACC CGCAAGGGCG GGGTCTACGG GCAGGTCGGT 
GGCGAGACCA TGCTCTCGCT GTTCAGCCGG GTGGCGAGCG GGGCCAAGGC TGTCATCGCC 
ATGGGCACAT GTGCGAGCTT CGGCGGCATA CAGGCAGCCG CCCCCAACCC TTCGGGAGCC 
ATCGGCGTAC GCGAAGCCCT TGCCCCGTTC GGCATCCAGC CCATCAACAT CGCAGGATGC 
CCCCCCAACC CGGTGAACTA CATAGGTACC GTCGTCCATC TGCTCACCAA GGGCATGCCC 
GAACTCGACA GTGTCGGTAG GCCGAAGATG TTCTACGGCA CGACCGTGCA CGACCAGTGT 
GAAAGACGGA AGCACTTCAA CGCCGGCGAG TTCGCCCCCG GCTTCGAATC GAAGGAGGCA 
CGTGAAGGCT GGTGCCTGCA CAAGCTGGGA TGTCGAGGGC CCTACACCTA CAACAACTGC 
CCGACCGCCC AGTTCAATCA GGTCAACTGG CCGGTCAGGG CTGGAGCCCC TTGCATTGGC 
TGCAGCGAAC CCGGCTTCTG GGACGCGCTG GCCCCCTTCA ACAAAGATGT CCGCCAGAAG 
AGCGACAAGG CCTAA

Protein sequence

MSYTTRIPAK LLARQAEDGR MTRREFMKFC GIVAVAMGMG PGFAPAVAEA LQAKGRPSVV 
YMHGAECTGC TEGLLRSIDP FIDILMMEVI SLDYCETVMA AAGRAAHHAL EDALRNPAGY 
VCTIEGAIPT RKGGVYGQVG GETMLSLFSR VASGAKAVIA MGTCASFGGI QAAAPNPSGA 
IGVREALAPF GIQPINIAGC PPNPVNYIGT VVHLLTKGMP ELDSVGRPKM FYGTTVHDQC 
ERRKHFNAGE FAPGFESKEA REGWCLHKLG CRGPYTYNNC PTAQFNQVNW PVRAGAPCIG 
CSEPGFWDAL APFNKDVRQK SDKA