Gene Bind_1164 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1164
Symbol
ID	6199231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	+
Start bp	1345626
End bp	1346684
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	63%
IMG OID	641705157
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_001832295
Protein GI	182678149
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	32
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGCG AGGAGCCGAT TTCCGGCATT GGTCCTGGCG GCCGGATCAC TTTGGCGCAT 
GGAGGTGGCG GCACCGCGAT GCGCGATTTG ATCGAACGCG TCTTTGTCGC CACCTTCCAC 
CCCGAAGGGA CGCCACCGCT GGAAGATCAG GCGCGTTTCG ATCTCGCTGC CTTTGCCGCC 
CATGGCGATC GGCTGGCTTT TACCACCGAC GGTTTCGTGG TCGAGCCGCT GGAATTTCCC 
GGCGGTGATA TCGGCAAGCT TGCTGTATGC GGTACCGTGA ATGATCTTGC CGTGGGCGGC 
GCGCGGCCCG TGGCCCTTTC TGCTGGTTTC ATCATTGAGG AAGGTCTGGA ACTGGAGCGT 
CTGCGCCGGA TCGTGACCTC CATGGCGATG GAGGCCGCGC GCGCGCAGGT TCCGATTGTC 
ACTGGTGATA CCAAAGTCGT CCCGCGCGGC GCTTGTGACG GCCTGTTCAT TACCACCACA 
GGCATTGGCG TCATAAGGCC GGATTATCAG ATCAGCATTG CCGGCGCGCG GCCGGGTGAT 
GTGATCCTGA TCAATGGGTC TCTGGGCGAC CATGGCGCGG CGATTCTCTG CGCGCGCGGT 
GATCTCGCGC TTGACGTCAC GATTAAAAGT GATTGCGCGC CTTTGCATGA TCTCGCAGCG 
GCTTTGCTCC AGGCGGTGCC GCAGGTGCGT GCCATGCGGG ATGCCACGCG TGGCGGTTTG 
GCTGGGGTGC TGACGGAATT GGCCGAGGCG AGCCGTGTCG CTATCGGGGT GGATGAAGCG 
GCTCTGCCGG TCAGATCCGA AGTCGCCGGC GTCTGCGAGA TTTTGGGCCT CGATCCGCTT 
TATCTCGCCA ATGAAGGGAA ATTGGTGGCC GTGGTCGCGC CGGAACATGC GGAAGCGGCA 
TTGGAGGCGA TGCGCGCGCA TCCCTTGGGT GTGGATGCGG CGATCATTGG AAAGGTCGCG 
GCAGAAGGTC GGCCCGGCAC CGTGACATTG ATCAATCGTT TCGGTGGACG CCGCGCGGTC 
ACGATGCCGT CCGGCGAACA ACTCCCGCGT ATCTGCTGA

Protein sequence

MSGEEPISGI GPGGRITLAH GGGGTAMRDL IERVFVATFH PEGTPPLEDQ ARFDLAAFAA 
HGDRLAFTTD GFVVEPLEFP GGDIGKLAVC GTVNDLAVGG ARPVALSAGF IIEEGLELER 
LRRIVTSMAM EAARAQVPIV TGDTKVVPRG ACDGLFITTT GIGVIRPDYQ ISIAGARPGD 
VILINGSLGD HGAAILCARG DLALDVTIKS DCAPLHDLAA ALLQAVPQVR AMRDATRGGL 
AGVLTELAEA SRVAIGVDEA ALPVRSEVAG VCEILGLDPL YLANEGKLVA VVAPEHAEAA 
LEAMRAHPLG VDAAIIGKVA AEGRPGTVTL INRFGGRRAV TMPSGEQLPR IC