Gene BBta_0475 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BBta_0475
Symbol	hypE
ID	5152663
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bradyrhizobium sp. BTAi1
Kingdom	Bacteria
Replicon accession	NC_009485
Strand	+
Start bp	472347
End bp	473417
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	65%
IMG OID	640555493
Product	hydrogenase maturation
Protein accession	YP_001236666
Protein GI	148252081
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	28
Fosmid unclonability p-value	0.254195
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCTTC TGGACCTGCC CCCGCGGCGC TCGCTCGGCC GAGTCCATGT GCCAGCCGTC 
ACACTGGCGC ATGGCGGCGG CGGCAAGGCC ATGAAGGATC TGATCGACGA CGTCTTCGTC 
AGCGCCTTCT GCAATGCCAA GGCGCCGGAT GTACTGGAGG ATCAGGCGCG GCTCGACCTC 
GCGGCGCTTG CCCGCTATGG CGACCGGCTC GCCTTCACCA CGGACTCCTT CGTCGTCGAT 
CCGCTGTTCT TCCCCGGGGG CGATATCGGC AAGCTCGCGG TCTGCGGCAC GATCAACGAT 
CTGGCCGTCG GCGGCGCCAA GCCGCTTTAT CTGTCCTGCG CCGTCGTCAT CGAGGAAGGA 
ATGCCGCTCG ATGCTTTGCG CGGGATTGCG AATTCCATGG CTGAAGCGGC GAGAATGGCT 
GGTGTGCGGA TCGTGACCGG CGATACCAAA GTCGTCCAGC GGGGCGCCTG CGACAAGCTC 
TTTATCACAA CGACCGGCAT CGGCGTGATC CCGCCCCAGA TTGACCTCGG CATTCACCAG 
ATCAAACCCG GAGATGGCAT ACTGGTGAAC GGACTGCTCG GCGACCACGG CGCAGCGATC 
CTCGCGGCCC GAGGCGATCT TGCGCTGGAG ACTGAAGTCG CCAGCGACTG CGCCGCCCTA 
CACGGGCTGA TCGAGGCCCT TCTACGAGCG GCGCCTGGAA CACGCTGCAT CCGCGACGCC 
ACCCGCGGCG GCCTCGCCAC GGTGCTCAAT GAGATGGCGG AGGCCTCCGC GCTGTCGATC 
GAAATCGACG AGTCGGCGAC GCCGCTGCGT GAAGAGGTGC GCGGCTTCTG CGAGATTCTC 
GGGCTTGATC CTCTCTATCT CGCCAACGAG GGCAAGGTGG TCATCGCTGT GCCGCCTGCC 
GAGATCGAAG CCGCGCTTGC GGCAATGCGC GCCCATCCGC TTGGCGCGGG AGCAGCCCTG 
ATCGGCCATG CCAGCGGGGG AATTCCAGCG CGCGTCACCA TGCAGACTGT CTTCGGCGGG 
AAGCGCATCG TCGATATGCT GATTGGTGAA CAGCTTCCAC GCATCTGTTG A

Protein sequence

MNLLDLPPRR SLGRVHVPAV TLAHGGGGKA MKDLIDDVFV SAFCNAKAPD VLEDQARLDL 
AALARYGDRL AFTTDSFVVD PLFFPGGDIG KLAVCGTIND LAVGGAKPLY LSCAVVIEEG 
MPLDALRGIA NSMAEAARMA GVRIVTGDTK VVQRGACDKL FITTTGIGVI PPQIDLGIHQ 
IKPGDGILVN GLLGDHGAAI LAARGDLALE TEVASDCAAL HGLIEALLRA APGTRCIRDA 
TRGGLATVLN EMAEASALSI EIDESATPLR EEVRGFCEIL GLDPLYLANE GKVVIAVPPA 
EIEAALAAMR AHPLGAGAAL IGHASGGIPA RVTMQTVFGG KRIVDMLIGE QLPRIC