Gene BBta_p0171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_p0171
Symbol	hypE
ID	5148547
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009475
Strand	-
Start bp	126640
End bp	127680
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	65%
IMG OID	640539070
Product	hydrogenase expression/formation protein
Protein accession	YP_001220503
Protein GI	148241002
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACTCGC AGGGAAAAGG CGACTTCGCC TCGTCTGATG GCCGCGTGTC ATTGGCCCAC 
GGCAATGGCG GACGGCGGAT GCGCCAGTTG ATCGAGGAGT TGTTCGTCCG CCACTTGGGG 
AATGCGCTGC TCGATACCGA TGCCGACGCC GCGGCTTTGC CGCCTTTGCC GACAGGCGCC 
ACGCCGATGA TCACCACGGA CGGGTTCACA GTCGACCCGC TGGAATTTCC CGGGGGCAAC 
ATCGGAAGCT TGGCGGTGCA TGGCACTGTA AACGACCTCG CGGTGTCCGG AGCGGAACCG 
TTGTATCTAA CGCTTAACTG CTTCCTCGAA GAGGGGCTCG ATCTGGGCCT GCTGGATCGG 
CTGACCGCAT CCATGGCCGC GGCGGCCACG GAGGCCGGCG TCAAGGTCGT CGCAGGCGAC 
ACCAAAGTGG TCCGGAGAGG CGAGGGCGGC GGGGTTTATC TGGCAACGTC GGGGGTCGGA 
CTCCGCCGCG CCGGTCTTGA TCTCGGTCTG GGGCGGATTG CAGCCGGCGA CCACATCTTG 
GTAAGCGGAC CGGTGGGAGA TCACGGCACC GCCGTCCTTT TGGCTCGCGG CCAATTCGGG 
CTCCGCGGCG ATCTCGTCTC GGACTCGGCA AGCGTGTTGC CGGTGACGCG CGCGCTTGTC 
GACGTGCCCG GACTACGTTT CATGCGTGAT CCGACCCGCG GCGGATTGGC GACCGTGGCG 
CATGAGATCG TTCGGCACAC GGGTATGGGC ATCCGATTGT CCGAGCCGGC TATCCCGATC 
CGCGATCAAG TACGAGCGGT ATGCGAAATG CTCGGTTACA ACCCGTTGTA TCTTGCGAGT 
GAAGGCCGCG TCGTTGCCGT GGTTGATCCT GCCTCGGCGC CCGCCGCGTT GGCGGCCATG 
CGAGGTCCCG GACAATCGCC GGACGCCGTG GAGATCGGCA CGGTCGGCTG CGAGGAACCA 
TACGTCGTAC TGGAGACGGA GATCGGCGGG GAGCGGTTGA TCGAGGAACT CGAAGCCGAT 
CCTCTGCCGC GAATTTGCTG A

Protein sequence

MNSQGKGDFA SSDGRVSLAH GNGGRRMRQL IEELFVRHLG NALLDTDADA AALPPLPTGA 
TPMITTDGFT VDPLEFPGGN IGSLAVHGTV NDLAVSGAEP LYLTLNCFLE EGLDLGLLDR 
LTASMAAAAT EAGVKVVAGD TKVVRRGEGG GVYLATSGVG LRRAGLDLGL GRIAAGDHIL 
VSGPVGDHGT AVLLARGQFG LRGDLVSDSA SVLPVTRALV DVPGLRFMRD PTRGGLATVA 
HEIVRHTGMG IRLSEPAIPI RDQVRAVCEM LGYNPLYLAS EGRVVAVVDP ASAPAALAAM 
RGPGQSPDAV EIGTVGCEEP YVVLETEIGG ERLIEELEAD PLPRIC