Gene Mpe_A1503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A1503
Symbol
ID	4784101
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	1618205
End bp	1619914
Gene Length	1710 bp
Protein Length	569 aa
Translation table	11
GC content	70%
IMG OID	640090070
Product	putative nitrite/sulfite reductase
Protein accession	YP_001020700
Protein GI	124266696
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0155] Sulfite reductase, beta subunit (hemoprotein)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0107318
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.425168
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTACCAAT ACACCCCCTT CGACCGCGCC TTCGTGCACC AGCGCGCAGC GCAGTTTCGC 
GACCAGCTCG AGCGCAACCG CGCCGGCACG CTGGGTGACG ACGAGTTCCG CCCCCTGCGC 
CTGCAGAACG GCTGGTACAT CCAGCGCCAT GCGCCGATGC TGCGCGTGGC GGTCCCCTAC 
GGCGAACTCA GCAGCCGCCA GCTGCGCCAG CTGGCGCGCA TTGCCCGCGA GTTCGACCGT 
GGCTATGCGC ACTTCACCAC GCGCCAGAAC GTCCAGTACA ACTGGATCCC GCTCGACCGG 
AGCGCCGACG TGATGGACCT GCTGGCCGAC GTCGACATGC ACGGCATCCA GACCAGCGGC 
AACTGCATCC GCAACACCAC CAGCGATGCG CTGGCCGGCG TGGCACCGGA CGAGATCGTC 
GACCCGCGGC CCTACTGCGA GATCCTGCGG CAGTGGACCA CGCTGCACCC GGAGTTCGCC 
TTCCTGCCGC GCAAGTTCAA GATCGCCGTC ACCGGCGCCA CCGAGGATCG CGCCGCCACC 
GCCTGGCACG ACATCGGCCT GCACCTGCAC AAGAACGACG CCGGCGAGGT GGGCTTCCGC 
GTGCTGGTCG GCGGCGGCAT GGGGCGCACG CCGATCCCCG GCGTGGTGAT CCGCGAGTTC 
CTGCCCTGGC ACCAGATCCT CGTCTTCATC GAGGCGATCG TGCGCGTCTA CAACCGCTAC 
GGCCGGCGCG ACAACATGTA CAAGGCGCGC ATCAAGATCC TGGTCAAAGC CGAGGGCGAG 
CGCTTCATCG AACAGGTGGG CAAGGAGTTC GAGGCCATCC TGAGCCGCGA CGTCGATGGC 
GACGCGCAAC TGATCCCTGA GTCCGAGCTG GACCGCGTGT CCGCCTGCTT CGTGCTGCCC 
GAGGGCGTCG TCGCCCACGC GAGCGCCGGG GACGGTGCCC CGGCCGATGC CCCCGTGGCC 
TACCGCAAGT GGCTGGAGCG CAACGTGCAC GGCCACCGGC TCGCCGGCTA TCGCGCGGTC 
ACGCTGTCCG TCAAGCGCGC CGGCCAGGCG CCCGGCGACG CCACCGACAC GCAGCTCGAC 
CTGGCCGCCG ACCTGGCCGA CCGCTACTCG CACGGCGAGA CGCGGGTCAC GCACGACCAG 
AACCTGTTGT TGCCCTGGGT GCGCGAGGAA GACCTGTACG CGCTGTGGCG GGCTGCGCGC 
GACGCCGCCT ACGCCACGCC CAACATCGGG CTGCTGAGCG ACATGATCGC CTGCCCCGGC 
GGCGACTTCT GCGGCCTGGC CAACGCGCGC TCGATCCCGG TGGCCGAGCA GATCACCGAG 
CGCTTTGCCG ACATCGACGA GCTCTACGAC ATCGGCGACA TCGACCTGCA CATCAGCGGC 
TGCATCAACT CCTGCGGCCA CCACCACAGC GGCCACATCG GCATCCTCGG CGTCGACAAG 
GACGGCGCCG AGTGGTACCA GGTCACGCTG GGCGGCTCCG ACGGCTCGGC CTTGAGTGGC 
GGCCTGGCCT CGGCGGTGCC GGGCAAGGTG ATCGGCCCGT CGTTCGCGGC CGATGAGGTG 
GCCGACGCCG TTGAGGCGGT GATCGAGACC TACCGCGGCC AGCGCGCCGC GAACGAGCGC 
TTCATCGACA CCGTGCGGCG CGTCGGCCTC GAGCCCTTCA AGACCGCCGC CAACGCGGTG 
CGCCGCAGCA CGGCGAAGGT GGCCGCATGA

Protein sequence

MYQYTPFDRA FVHQRAAQFR DQLERNRAGT LGDDEFRPLR LQNGWYIQRH APMLRVAVPY 
GELSSRQLRQ LARIAREFDR GYAHFTTRQN VQYNWIPLDR SADVMDLLAD VDMHGIQTSG 
NCIRNTTSDA LAGVAPDEIV DPRPYCEILR QWTTLHPEFA FLPRKFKIAV TGATEDRAAT 
AWHDIGLHLH KNDAGEVGFR VLVGGGMGRT PIPGVVIREF LPWHQILVFI EAIVRVYNRY 
GRRDNMYKAR IKILVKAEGE RFIEQVGKEF EAILSRDVDG DAQLIPESEL DRVSACFVLP 
EGVVAHASAG DGAPADAPVA YRKWLERNVH GHRLAGYRAV TLSVKRAGQA PGDATDTQLD 
LAADLADRYS HGETRVTHDQ NLLLPWVREE DLYALWRAAR DAAYATPNIG LLSDMIACPG 
GDFCGLANAR SIPVAEQITE RFADIDELYD IGDIDLHISG CINSCGHHHS GHIGILGVDK 
DGAEWYQVTL GGSDGSALSG GLASAVPGKV IGPSFAADEV ADAVEAVIET YRGQRAANER 
FIDTVRRVGL EPFKTAANAV RRSTAKVAA