Gene MCA1049 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1049
Symbol
ID	3102274
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	+
Start bp	1099135
End bp	1100334
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	62%
IMG OID	637170233
Product	hypothetical protein
Protein accession	YP_113524
Protein GI	53804792
COG category	[R] General function prediction only
COG ID	[COG1092] Predicted SAM-dependent methyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	8
Plasmid unclonability p-value	0.157301
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGAAT TGTCGGTATT GCGGCTGAAG AAGAACGAGG AGCGCCGTTT GCGGGCGGGG 
CACCTGTGGG TGTTCAGCAA TGAGGTGGAT GGCGAGAAGA CGCCGCTCAA GCGGTTTGCC 
CCTGGCGAAT ACGTGATAGT GGAGGACTCC CGCCAACAGC CGTTGGGTCT GGCTTACGTC 
AACCCGGAAT CGCTGATCTG CGCGCGTCTC CTGAGCCGCG ACCATCGCGT GGCGATCGAT 
CATGCCTTTC TGCTGAAGCG CCTGAGCAGG GCCCTGCATC TGCGCGAAAT GCTTTTCGCC 
AAGCCTTATT ACCGTCTGGT GTATGGTGAA AGCGACGGCC TGCCCGGTCT GGTGATCGAC 
CGCCTGGGCG ACGTGCTGGT GCTGCAGGCC AGTACGCTCG GCGCGGAGCG GCTGCAGGAG 
CAGGTGATGG ACGTGCTCGA CAAGCTGCTC TCACCCCGCA CCCTGGTGGT GAAGAACACT 
TCGAGCCTGC GCCAGTTCGA GAAGCTCGAG AATTATGTCC GGGTGTTGGG TGCGCCGCTC 
GAGGGTCCGA TACCGATCGA GGAGAACGGT GCGAGATTCC TGGTCGATCC AGTGGAGGGG 
CAGAAGACCG GTTGGTTCTT CGACCATCGT CTGAACCGGG CGGTGGCGGC GCGGTTGTCG 
AAGTGCCAGC GGGTGCTCGA TCTGTTCTCG TATACCGGGG GCTGGGGGGT GCAGGCGGCT 
CTGGGCGGGG CGGAATCCGT GGATTGCGTG GACAGTTCCG AATCGGCGCT CGCGCTTGCC 
GCTGAAAACG CCCGGCTCAA TGGCGTGGCG GACCGTATGG GCTTCATCCG CCAGGATGTG 
TTCGAATTCC TGAAGCAGCT TCGGCACAAA CGCCAGCGCT ACGATCTGAT CGTGGCGGAT 
CCGCCCGCCC TCATCAAGCG CAAGAAAGAC GTCAAGGCGG GAGTGGAAGC CTACCACCGG 
CTCAACCAGG CGGCCATGCA AGTGCTGAAT CCCGGTGGGG TCCTGGTGTC GGCCTCCTGC 
TCATTCAATC TGCCGCGCTC CACCCTGCAC GACATCCTGC GTACCAGCAG CCGGCATCTG 
GATCGGCATT TGGTGATCCT GGGCCAGGGT TGCCAGGGGC CGGATCATCC GGTTCACCCC 
GCGATTCCGG AAACCGAGTA CCTCAAGACC TTCTTCTGTC ACCTGTCGAT GCCGCTCTAG

Protein sequence

MSELSVLRLK KNEERRLRAG HLWVFSNEVD GEKTPLKRFA PGEYVIVEDS RQQPLGLAYV 
NPESLICARL LSRDHRVAID HAFLLKRLSR ALHLREMLFA KPYYRLVYGE SDGLPGLVID 
RLGDVLVLQA STLGAERLQE QVMDVLDKLL SPRTLVVKNT SSLRQFEKLE NYVRVLGAPL 
EGPIPIEENG ARFLVDPVEG QKTGWFFDHR LNRAVAARLS KCQRVLDLFS YTGGWGVQAA 
LGGAESVDCV DSSESALALA AENARLNGVA DRMGFIRQDV FEFLKQLRHK RQRYDLIVAD 
PPALIKRKKD VKAGVEAYHR LNQAAMQVLN PGGVLVSASC SFNLPRSTLH DILRTSSRHL 
DRHLVILGQG CQGPDHPVHP AIPETEYLKT FFCHLSMPL