Gene Daro_3961 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Daro_3961
Symbol
ID	3567460
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Dechloromonas aromatica RCB
Kingdom	Bacteria
Replicon accession	NC_007298
Strand	-
Start bp	4258453
End bp	4259454
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	63%
IMG OID	637682434
Product	uptake hydrogenase accessory protein hupU
Protein accession	YP_287158
Protein GI	71909571
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA)

Plasmid Coverage information

Num covering plasmid clones	51
Plasmid unclonability p-value	0.462451
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAAGTGC TTTGGCTGCA GAGCGGCGGC TGCGGCGGTT GCACGCAGTC CATGCTGTGC 
TCCGAGCCTC GTTCGCTGTT CGACGAACTG CGCGACGCCG GTATCGAGTT TCTCTGGCAC 
CCGGCGCTGT CGGTCGAAAG CGGCGAGGAA GCACTAAGCA TTCTCGAAGA CTGTGCCGAA 
GGTCGCTTGG CCTTCGATGC GCTGTGTATC GAAGGTGCCA TGCTGCGCGG TCCGAATGGA 
ACCGGCAAAT TTCACCTGAT GGCCGGTAGC GGCCGGCCGC TGACTGAATG GGTCGAGCGT 
CTGGCCCGTC ACGCCAAATG GGTCTTTGCG ATTGGCTCGT GCACAGCCTA TGGCGGCTTT 
TCGGCCAACA CGCCGGGCAA TCCGCTGGAA GCCTGTGGCC TGCAATTCGA CGAACAGACG 
CCAGGTGGCC TGCTCGGCGC TGGCTTCCAG TCCTCCGCCG AGCTGCCGGT GATCAACATT 
GCCGGTTGCC CGACGCATCC CGGCTGGGTG GTCGATACGC TGGAAAAGGC TGCGCTGGAA 
GGTATAAGGG CCGATGACCT TGATGAATTC GGCCGGCCAT TGCTTTACGC CGGTGGCCTG 
GTGCACCACG GTTGCGCTCG CAACGAATAT TACGAATTCA AGGCCAGTGC CGAGAAGCAG 
TCCGATCTTG GCTGTCTGAT GGAAAACCTT GGCTGCAAGG GCACCCAGGC TCACGCCGAC 
TGCAACCTGC GGCCGTGGAA CGGCAGCGGC TCCTGCCTGC GTGGCGGCTT TGCTTGCATA 
GCCTGCACCG AGCCGGGTTT CGAATCGCCC GGTCATGCCT TCCAGGAAAC GCCCAAGCTG 
GCCGGCATCC CGATCGGCCT GCCGACCGAC ATGCCGAAAG CCTGGTTCGT CGCGCTGGCT 
GCGCTCTCCA AGTCGGCCAC CCCCAAGCGG GTGCGCAACA ACTCGGTGGC TGACCACCCG 
GTGGTTCTTC CGGCGATTCG CAAGAAGGGC GGCGGCAAAT GA

Protein sequence

MKVLWLQSGG CGGCTQSMLC SEPRSLFDEL RDAGIEFLWH PALSVESGEE ALSILEDCAE 
GRLAFDALCI EGAMLRGPNG TGKFHLMAGS GRPLTEWVER LARHAKWVFA IGSCTAYGGF 
SANTPGNPLE ACGLQFDEQT PGGLLGAGFQ SSAELPVINI AGCPTHPGWV VDTLEKAALE 
GIRADDLDEF GRPLLYAGGL VHHGCARNEY YEFKASAEKQ SDLGCLMENL GCKGTQAHAD 
CNLRPWNGSG SCLRGGFACI ACTEPGFESP GHAFQETPKL AGIPIGLPTD MPKAWFVALA 
ALSKSATPKR VRNNSVADHP VVLPAIRKKG GGK