Gene Mpe_A2807 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A2807
Symbol
ID	4785057
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	2990239
End bp	2991258
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	69%
IMG OID	640091378
Product	hydrogenase small chain
Protein accession	YP_001021996
Protein GI	124267992
COG category	[C] Energy production and conversion
COG ID	[COG1740] Ni,Fe-hydrogenase I small subunit
TIGRFAM ID	[TIGR00391] hydrogenase (NiFe) small subunit (hydA)

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATGG GCGCTGCGGC GGGATTCAAC GTGCTGTGGC TGCAGTCGGG GGGATGCGGT 
GGCTGCAGCA TGTCGCTGCT GTGCGCCGAC ACGACCGACT TCCACGGCCA GTTGCGCGAC 
GCCGGCATCG ACCTGCTGTG GCACCCCTCG CTCTCGATCG AGAGCGGGCA CGAGCTGAGC 
ACCATGCTCG ACCGCATCGC CGATGGCCGC CTGCGGCTCG ACGCCCTGTG CATCGAAGGC 
TCCCTGCTGC GCGGCCCGCA TGGCAGCGGT CGCTTCCACG TGCTGGCCGG CACCGGCATC 
CCGATGATCC ACTGGGTCTC GCGGTTGGCG GCCAGGGCCC GGCACGTGGT GGCGGTCGGC 
AGCTGCGCGG CCTGGGGCGG CGTGACCGCC GGTGGCGACA ACCCCACCGA TGCCTGCGGC 
CTGCAGTTCG AGGACGACCG TCGCGGTGGC CTGCTCGGTG CCGACTTCCG TTCTGAGAGT 
GGCCTGCCGG TGATCAACAT CGCTGGCTGC CCCACGCATC CGAGCTGGGT GATCGACACG 
CTGATGGCGC TGGCCGCTGA GAGCTTCACG GCCGGCGACC TCGACCAGCT GGGCCGTCCG 
CGCTTCTATG CCGATCAGCT GGTGCACCAC GGCTGCACCC GCAATGAATA CTACGAATTC 
AAGGCCAGCG CCGAGAAGCC GTCGGACCTG GGTTGCATGA TGGAGCACAT GGGCTGCAAG 
GGCACACAGG TGCATGCGGA CTGCAACACG CGGCTGTGGA ACGGCGAGGG CTCGTGCACC 
CGGGGCGGCT ACGCCTGCGT CGCCTGCACC GAGCCGGGCT TCCAGGAACC GGGCCACCCC 
TTCCAACAGA CACCCAAGCT AGCCGGCATC CCGATCGGCC TGCCGACCGA CATGCCCAAG 
GCCTGGTTCG TCGCGCTTGC GTCGCTGTCG AAGTCGGCGA CGCCCAGGCG CGTGAAGCTC 
AATGCCGTGG CCGATCACCT GGTGGTCACG CCGGCGGTGC GCAAGACGCG CCTGAAATGA

Protein sequence

MSMGAAAGFN VLWLQSGGCG GCSMSLLCAD TTDFHGQLRD AGIDLLWHPS LSIESGHELS 
TMLDRIADGR LRLDALCIEG SLLRGPHGSG RFHVLAGTGI PMIHWVSRLA ARARHVVAVG 
SCAAWGGVTA GGDNPTDACG LQFEDDRRGG LLGADFRSES GLPVINIAGC PTHPSWVIDT 
LMALAAESFT AGDLDQLGRP RFYADQLVHH GCTRNEYYEF KASAEKPSDL GCMMEHMGCK 
GTQVHADCNT RLWNGEGSCT RGGYACVACT EPGFQEPGHP FQQTPKLAGI PIGLPTDMPK 
AWFVALASLS KSATPRRVKL NAVADHLVVT PAVRKTRLK