Gene BBta_2005 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_2005
Symbol	hupK
ID	5150434
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	+
Start bp	2070104
End bp	2071210
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	67%
IMG OID	640556946
Product	hydrogenase expression/formation
Protein accession	YP_001238102
Protein GI	148253517
COG category	[C] Energy production and conversion
COG ID	[COG3259] Coenzyme F420-reducing hydrogenase, alpha subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.432728
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTGG CGTTTCGCAA CCACATCGAT GTCACGCTGT CGGTTGCAGC TCAGATGATC 
GTCGGTGTCA CGATCGAACC GCGCTCGCGG CCGCCGCTCG GTCGGCTGTT TGCCGGCAAG 
CCGGCCGAGA CGCTGCTGGC GGCGTTACCG CGGCTGTTCT CATTATGCGC CATCGCGCAT 
CAGGTCGCCC TTTTGTCTGC GCTCGAAGCT GCACGTGGCC ATCAGGCGCC GCCGCTGACG 
CGGCATCGGC GCATCACCGC CGTGATCATG GAGCGGTTCG CCGAGTTGCT GCGTGGCGTT 
CTGGTCAGCC GTCTCGCTTG CGATCGCAGC GCCCTGGCGC AGCTGCAGTT TCTGCTGCAG 
GCGGTGGCCT CGCTCCAGGT GTCCGCGGGC GCCGGAAACG CGCGGCAATC TCGCAGCGCA 
ACCTTGTCGC AGATCAAGAT GGCCCTGGCC GCCCTGGGTT TAGGATCGGT TGCGGAACCC 
GTGGTGCGGG GAACTCCGCT TGCGTCGATC ATGGATGCGG CCCGCAGGGC CGAAGCCGAT 
GGAGGATGGA AGCAGATGCC GGCCGAGCAC GGTGTCCTGT CGGCCGCCGA CGATGACACC 
GTCGTGGCTC GACTGATCGA TCCGCAGGCC GCCTTCGCCG AGGCGCCCGA ACTTGCCGGG 
CGTGTTCCGG AAACCGGAGT CTGGGCGCGG CAAGCATCGC GTCATCGGCA TTCATCCGCG 
GGGTCCGTCG AGCGGCTCTT GGCAAAGTTG GCCGAACTCG CCGAGCTGCT GTGCTGGATC 
GAAGCCGGCG AGGCCGAAGA TGAAGCGGCC GACCAGGACG TCGTTGCAAG CTATGCGCTC 
GGCCCAGGGC GCGGTGCGGC GGCCGTCGAA TGCGCGCGCG GCCGGCTGCA TCACGCGATC 
GAGCTGGATG CGGAAGGCCG TGTCCGCCGG TTCGAATTTC TCGCGCCGAC CGAATGGAAT 
TTTCATCCCC GCGGCCCGGT TGCCGGCAGC CTGACTGGGG CTCGGCTTTG CGGCTCCGCC 
GATCGTGCCG CGATCGAGGC GATGATCAGT TCCTTCGATC CCTGCGTCGG CTACAGTCTC 
GCGGTACGGG AGATGGCTGA TGCATGA

Protein sequence

MTLAFRNHID VTLSVAAQMI VGVTIEPRSR PPLGRLFAGK PAETLLAALP RLFSLCAIAH 
QVALLSALEA ARGHQAPPLT RHRRITAVIM ERFAELLRGV LVSRLACDRS ALAQLQFLLQ 
AVASLQVSAG AGNARQSRSA TLSQIKMALA ALGLGSVAEP VVRGTPLASI MDAARRAEAD 
GGWKQMPAEH GVLSAADDDT VVARLIDPQA AFAEAPELAG RVPETGVWAR QASRHRHSSA 
GSVERLLAKL AELAELLCWI EAGEAEDEAA DQDVVASYAL GPGRGAAAVE CARGRLHHAI 
ELDAEGRVRR FEFLAPTEWN FHPRGPVAGS LTGARLCGSA DRAAIEAMIS SFDPCVGYSL 
AVREMADA