Gene Msil_2740 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2740
Symbol
ID	7092193
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	3017723
End bp	3018772
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	68%
IMG OID	643466053
Product	hydrogenase expression/formation protein HypE
Protein accession	YP_002363023
Protein GI	217978876
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0309] Hydrogenase maturation factor
TIGRFAM ID	[TIGR02124] hydrogenase expression/formation protein HypE

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGAGCGC CAAGGCTCCG GACCCGCAAG CTGGATCTCC AGAATGGTCG CGTCGACCTT 
TCCCACGGCG CCGGCGGCCG GGCGATGGCC CAGCTCATCG ACGAGATCTT CCGCGAGGCG 
TTCGACAATC CGATGCTCGA TCAAGGCAAC GACCAGGCTG CGTTCGACGT CCCGGCCGGC 
CGCATGGTGA TGTCGACGGA CGGCTACGTG ATCTCGCCGC TTTTCTTTCC CGGCGGCGAT 
ATCGGATCGC TGGCTGTGCA TGGCACGATA AACGACATCG CGATGGCCGG CGCACGCCCC 
CTGCATCTGG CCGCCAGCTA TATCATCGAG GAGGGCTTTC CGCTCGCGGA CCTTCAGCGG 
ATCGCGGGTA GCATGGGGTG CGCTGCGCGC GACGCCGGCG TGGCGATCGT GACCGGCGAC 
ACCAAGGTGG TCGAGCGTGG AAAAGGCGAC GGCGTCTTCA TCGCGACGAC CGGCATCGGC 
GTCGTCCCGC CGGGCCTCCA TCTCTCGGGC GAGCGCGCCC GCCCGGGCGA CCGGGTGATC 
ATTTCCGGCT ACATCGGCGA TCACGGCGTC GCGGTCATGT CGACAAGGCG CGATCTCGGA 
TTCGAGACGG AACTCCTCTC GGACAGCGCC GCCTTGCACG GGCTGGTCGC CGAAATGGCG 
CGCGTCGCGG GTTCCTCGCT CCGGCTCTTG CGCGACCCAA CGCGCGGCGG CCTGGCCACG 
ACCCTCAACG AGATCGCCCA GCAATCGGGC GTCGGATTCC TCATCGATGA GGGCGCGATC 
CCCGTTCGGG CGGAGGTCGC CGCCGCCTGC GAACTCCTCG GATTGGACCC GCTCTATGTC 
GCCAATGAGG GCAAGCTGGT CGCCATCGTG GCGCCGGACG CCGCGGAGAC CCTCGTTGCC 
GCGATGCGCG CGCATCCCCT CGGCCGCGAC GCGGCTCTGA TCGGAGAAGC GACCGCCGAC 
GAACAGCGCT TCGTACAGAT GACGACTTCG TTCGGAGGCG GCCGGATTGC GGATTGGCTG 
ATGGGCGAGC AATTGCCCCG GATCTGCTGA

Protein sequence

MRAPRLRTRK LDLQNGRVDL SHGAGGRAMA QLIDEIFREA FDNPMLDQGN DQAAFDVPAG 
RMVMSTDGYV ISPLFFPGGD IGSLAVHGTI NDIAMAGARP LHLAASYIIE EGFPLADLQR 
IAGSMGCAAR DAGVAIVTGD TKVVERGKGD GVFIATTGIG VVPPGLHLSG ERARPGDRVI 
ISGYIGDHGV AVMSTRRDLG FETELLSDSA ALHGLVAEMA RVAGSSLRLL RDPTRGGLAT 
TLNEIAQQSG VGFLIDEGAI PVRAEVAAAC ELLGLDPLYV ANEGKLVAIV APDAAETLVA 
AMRAHPLGRD AALIGEATAD EQRFVQMTTS FGGGRIADWL MGEQLPRIC