Gene Dvul_2656 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_2656
Symbol
ID	4663165
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	3098525
End bp	3099550
Gene Length	1026 bp
Protein Length	341 aa
Translation table	11
GC content	67%
IMG OID	639820903
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_968095
Protein GI	120603695
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGCG AAACCCTTCT TCTCGATTAC GGCAGCGGCG GGCGCGCATC GCACCGCCTC 
ATTTCCGACC TCTTCCTCCG CCATTTCGAC AACCCCATCC TCGGCACGCT CAACGACGCC 
GCCCGTCTCG ACCTGACAGG CCCCCTCGCC ATGAGCACCG ACAGCTACAC CGTAGACCCC 
ATCTTCTTCC CCGGCGGCGA CATCGGCACG CTGGCGGTGC ACGGCACCGT CAACGACGTC 
TCCATGCTGG GCGCACGGCC GCGCTACCTC AGCTGCGGTT TCATCCTCGA AGAGGGACTG 
GACATGGACA TCCTCGAACG GGTGGTCGCC TCCATGGGGA AGGCCGCGCG TGAGGCGGGG 
GTGTTCATCG TGACGGGTGA TACCAAGGTC GTGCCCCGTG GGGCCTGCGA CAAGATGTTC 
ATCAACACCA CCGGCATCGG CGAGATTCTG GTCGACCCCG CGCCCTCGGG CGACAGGGCG 
CGCCCCGGTG ACGCCATCCT CATCAGCGGC AGTATGGGCG ACCACGGGCT GACCATCCTC 
TCGCAGCGTC AGGGGCTGAA CTTCGCTGCG GATGTGTGCA GCGACTCGGC CTCCCTCAAC 
AGGGTGGTGG AGAAGCTGGT GCTGGAGGTC GGCGACATCC ACGTGCTGCG CGACCCCACC 
CGTGGGGGTC TCGCCACGAC ACTGAACGAG ATAGCGGGCC AGTCGCAGGC CGTGTGCCAT 
GTGCTGGAGA CGGCCGTGCC CGTGCGCGAG TCGGTGCGCA ACGGCTGCTC GTTCCTCGGA 
CTCGACCCGC TGTATCTTGC CAATGAGGGC AAGCTCATCT GCATCCTGCC CGAGGAGAGG 
GCCGAGGCCG CGCTTGCCGT GTTGCGCGAA GGGCCGCACG GTGAACACGC TGCCCGCATC 
GGGAGTGTGA AGTCCGTCGG TGAACTCGGG GCAGCCCGGG CCGGTCAGGT GGTGATGGAG 
ACGGCCCTTG GCGGGCACCG CCTGCTTTCC ATGCTCGAAG GCGAGCAGTT GCCGCGCATC 
TGCTAG

Protein sequence

MSGETLLLDY GSGGRASHRL ISDLFLRHFD NPILGTLNDA ARLDLTGPLA MSTDSYTVDP 
IFFPGGDIGT LAVHGTVNDV SMLGARPRYL SCGFILEEGL DMDILERVVA SMGKAAREAG 
VFIVTGDTKV VPRGACDKMF INTTGIGEIL VDPAPSGDRA RPGDAILISG SMGDHGLTIL 
SQRQGLNFAA DVCSDSASLN RVVEKLVLEV GDIHVLRDPT RGGLATTLNE IAGQSQAVCH 
VLETAVPVRE SVRNGCSFLG LDPLYLANEG KLICILPEER AEAALAVLRE GPHGEHAARI 
GSVKSVGELG AARAGQVVME TALGGHRLLS MLEGEQLPRI C