Gene MCA1016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1016
Symbol
ID	3103867
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	1067515
End bp	1068624
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	61%
IMG OID	637170201
Product	dioxygenase, iron-sulfur subunit, putative
Protein accession	YP_113492
Protein GI	53804857
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.621392
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCCGAT CGATCAGAAA CCAAGATGTC CCCGAACTGC CCCGTCGGCG GCAGGTCCGC 
ACCGTCGGCA TGAGCGGCAA TTACTGGTAT GTGGTCGAGA TCGACGGCAG GCTCAAGCCC 
CGGCAAGTCA AACGGGTGCG TTTCTGGGGA CAGGACATCG CGTTGTTCCG CGACGCTGCT 
GGCGAACTGC ATGCCGTGGA AGACCGTTGC CCGCATCGGC AACTCCCGCT GTCCCAGGGC 
TTCGTCGAGG GGGGAAACCT GGTCTGTACC TATCATGGAT GGAAATTCGA TGGCTGCGGC 
CGGTGCACCG AAATCCACCA TGAGCTTGGC AAAGGCCGTA CCAGGTTACC TAGAATCCGC 
ATCAGGACCT ATCCCGTCAA GGCGCAATGG GGGCTCATCT GGCTGTTTCC GGGCGATCCC 
GCCCTGGCGG ACGGAACCCC GCTGCCGACG ATCCCCCAGC TCGAAGGGGG ACGGCCCTGG 
CCGTTCTTCC CGATCGACGT GACGATCAAA GCGCACTTCT CGATGATCGT GGAGAACGTT 
TGTGATTTCA ACCACGAATA CCTGCACCGG CACAAACGCC CCTTCCTGCA GCCGATCCTG 
CGCGAGTGGA AGCAGGACGC CGACAGTGTT CGGGTCTACT ACGACACCCG TTTCGACGGG 
AGCCCCGTCG CCAAGCTCTT CATGGAAGGC GGGGCGCGTG ATCTCAACGA GATCGAGATC 
TGGTACCAGT ACCCTTATCA GGGTTCCGAC ATCGGCGGCA AGTACATCCA CTGGCTGTTC 
ATGCTGCCGG AGGACGAGCG CACCACCCGC TGTTTCTTCG TCTTCCTGTT CGGGCCGATC 
CATGTCCCGA TCGTGAACTG GAAGATGCCC GAATTCCTGC GCAAGCCCAT CCTCTGGTTC 
ACCAACAAGT GGTACATCGA GCCCCTGTTG GGCGAGGACA AATGGGCGCT GGAATTGGAG 
CAGGACGGTT TCGAGCGCCA TCCCGATGCG CCGCAGATCG AGCTCAATCC GGCCATCAGC 
TCGTTCCAGA GGTTGTCGCT GGAGAAGTGG AAAGCTTACC AGCAGTCCAT GGAGAGAGCC 
GGGCCAAAGC CGGCGGCAGA CCCGGCATGA

Protein sequence

MSRSIRNQDV PELPRRRQVR TVGMSGNYWY VVEIDGRLKP RQVKRVRFWG QDIALFRDAA 
GELHAVEDRC PHRQLPLSQG FVEGGNLVCT YHGWKFDGCG RCTEIHHELG KGRTRLPRIR 
IRTYPVKAQW GLIWLFPGDP ALADGTPLPT IPQLEGGRPW PFFPIDVTIK AHFSMIVENV 
CDFNHEYLHR HKRPFLQPIL REWKQDADSV RVYYDTRFDG SPVAKLFMEG GARDLNEIEI 
WYQYPYQGSD IGGKYIHWLF MLPEDERTTR CFFVFLFGPI HVPIVNWKMP EFLRKPILWF 
TNKWYIEPLL GEDKWALELE QDGFERHPDA PQIELNPAIS SFQRLSLEKW KAYQQSMERA 
GPKPAADPA