Gene Msil_3751 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_3751
Symbol
ID	7093105
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	4108390
End bp	4109547
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	62%
IMG OID	643467036
Product	hydrogenase expression/formation protein HypD
Protein accession	YP_002363995
Protein GI	217979848
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0409] Hydrogenase maturation factor
TIGRFAM ID	[TIGR00075] hydrogenase expression/formation protein HypD

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	57
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAATATG CCGACGAATT CCGCGACCGC GAGAAGGCGG CGATTTTGAT CCGGGAGATC 
GACAAGCTCG CCGCCACGAT AGAGATCGCC AAAACCCGGC CAATCAACAT CATGGAAGTC 
TGCGGCGGAC ATACCCATTC GATCTTCCGC TATGGACTGG AAGGCCTGCT GCCCGGCGCC 
ATCGAACTGG TGCATGGACC GGGCTGCCCC GTCTGCGTTC TACCGATGGG CCGGGTCGAC 
GACTGCGTGT CCATCGCCGA GCGGCCGGAG GTCATCTTCG CCACCTTTGG CGACGCCATG 
CGCGTGCCCG GATCGAAAAA AAGCTTGCAA CAGGCCAAGG CCCAAGGCGC CGACGTCCGC 
ATGGTCTATT CGCCTCTCGA CGCGCTCGGC CTGGCCCGCA AAAATCCCGG CCGCGAAGTG 
GTCTTCTTCG GGCTCGGCTT CGAGACCACC ATGCCGTCGA CCGCCTTGAC GGTGCTGCAG 
GCCGAGGCTG ACGGCGTCGA GAATTTTTCG GTGTTCTGCA ACCACATCAC CATCGTGCCG 
ACGATGAAGG CGATCCTCGA CAGCCCCGAG CTCAACCTCG ACGGCTTCCT TGGACCCGGC 
CATGTCTCGA TGGTGATCGG CGCGGCGCCC TATCAATTCA TCGCCGATGT CTACAAGCGG 
CCGATGGTGA TCGCCGGCTT TGAGCCGCTC GACGTGCTGC AATCGATCTG GATGGTGCTG 
AAGCAGATCA AGGAGGGCCG CGCCGAGATT GAGAACCAAT ATGCGCGCGT CGCCCCCGCG 
GCGGGCAACG CGGCGGCGCT GAACGCTGTC GGCAAAGTCT ATGAGTTGCG CGAATTTTTT 
GAATGGCGCG GCCTCGGCTC CATCGATCAT TCCGGAGTGA AAATCCGCGA CGAATATGCG 
CGTTTCGACG CGGAGCGGAA ATTCGCCATT CCCAACGTCA AGATCGCCGA TCCGAAATCG 
TGCCAATGCG GCGATGTGCT GAAGGGCGTC ATCAAGCCGT GGCAATGCAA GGTCTTCGGC 
GCAGCCTGCA CGCCGGAGAC GCCGCTCGGC GCGCTGATGG TGTCGTCCGA GGGCGCCTGC 
GCCGCCTATT ATCAATATGG CGGCGTCAAG CGCCATGGCG CCAGTGAGGC GGCTCCGCAA 
CTGGCGACAG CATCATGA

Protein sequence

MKYADEFRDR EKAAILIREI DKLAATIEIA KTRPINIMEV CGGHTHSIFR YGLEGLLPGA 
IELVHGPGCP VCVLPMGRVD DCVSIAERPE VIFATFGDAM RVPGSKKSLQ QAKAQGADVR 
MVYSPLDALG LARKNPGREV VFFGLGFETT MPSTALTVLQ AEADGVENFS VFCNHITIVP 
TMKAILDSPE LNLDGFLGPG HVSMVIGAAP YQFIADVYKR PMVIAGFEPL DVLQSIWMVL 
KQIKEGRAEI ENQYARVAPA AGNAAALNAV GKVYELREFF EWRGLGSIDH SGVKIRDEYA 
RFDAERKFAI PNVKIADPKS CQCGDVLKGV IKPWQCKVFG AACTPETPLG ALMVSSEGAC 
AAYYQYGGVK RHGASEAAPQ LATAS