Gene MCA1840 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1840
Symbol
ID	3102351
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	1968909
End bp	1970135
Gene Length	1227 bp
Protein Length	408 aa
Translation table	11
GC content	68%
IMG OID	637170999
Product	hypothetical protein
Protein accession	YP_114277
Protein GI	53803886
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCGTGATG CCGTGCGCCA ATTGCGCAGT GTCGCGGAGC TTGCCTGTCG AGACCTGCTC 
CACGAATGGC GGGTCTCGCT CTGCCTGGCG CTGGCGATCG CCGCCGTGCT GGCGCCCTTG 
CTGGTGCTGT TCGGCCTGAA GTCCGGCATC GTCGATACCC TGACGGCGCA GATGAAATCG 
GATCCGCGCA ACCTCGAGAT CGTCTGGCGG CTGAACGGTT CACTGGACCG CGATTGGCTG 
GAACGGCTGC GCGCGAATCC GCGAGTCGGC TTCGCCGTGC CCAGCACCCG CACCCTCGCC 
GCCACCCTGG ACCTTGCCGC CGCCGACGGG AAGGGTCTGG AGGATGTCGA CCTGATGCCT 
ACGGATGCGG GCGATCCGCT GTTCGGCGTC GAGGATGCAG TTCCGCAAGG GCTGGGCGAG 
CTGGCTTTGA CCCACGAGGC GGCAGACAAA CTCGGCGTTT CGGCCGGCAT GAGCGTGGAA 
GGCGTGGTCT ACCGCAATCT CCACCAGCAG CGGCAGGTGT TGAGGCTGTC GCTGCGGGTG 
AGCGCGGTGC TGGCCGAATC CGTTCATTCC GGCTGGGGTG CGTTCGTGTC CTTACCCCTC 
TTGGAAGCCC TGGAGCATTA CCGCGACGGT TACGCCGTGC CCGAGCTGGG CGTCGCCGAC 
GGGGCGTCTC CCACCTCCGG TGCGTCCCGC TACGCCCGGC TCCGGCTCTA TGCGCGCAGT 
CTGGAAGCCG TGCCGGGGCT GGCCGAATCG CTGCGCGCCC AAGGCTACGA CGTTTCCACC 
CGCAGCAAGG ACATCGAACT GGTCAAGAAC ATCGACCACG CCCTGAGCTT CCTGTTCCGC 
CTGATCGCCG GAGGCGGGAT CGCCGGCTGC GTGCTGTCGC TGGGTGCCAG CCTCTGGGCC 
AGCGTCGAGC GCAAGCGGCG CGACCTGGCG CTGCTGCGCC TGGTCGGCAT CCGCAATACC 
GTGCTTGCCG GCTTCCCCGC CATCCAGGCC GCAGGCGTCG CCGCGGCTGG AATCGCGCTG 
GCGTTCGCCG CCTATTTCGC GGCAGCCGAG GCGATAAACC GGACCTTCCG GGCGGATCTG 
AGCCGGGAAG AGTTCGTATG CCGTCTGCTG CCGAATGACG GAGTGACGGC CGCTTTTCTG 
ACCGAAAGCC TGGCCGTTCT GGCTGCACTG ATCGCCGTGA CGGCCGTGCT GCGGATCGAA 
CCGGGGGAGA GCCTGCGGGA GAACTAA

Protein sequence

MRDAVRQLRS VAELACRDLL HEWRVSLCLA LAIAAVLAPL LVLFGLKSGI VDTLTAQMKS 
DPRNLEIVWR LNGSLDRDWL ERLRANPRVG FAVPSTRTLA ATLDLAAADG KGLEDVDLMP 
TDAGDPLFGV EDAVPQGLGE LALTHEAADK LGVSAGMSVE GVVYRNLHQQ RQVLRLSLRV 
SAVLAESVHS GWGAFVSLPL LEALEHYRDG YAVPELGVAD GASPTSGASR YARLRLYARS 
LEAVPGLAES LRAQGYDVST RSKDIELVKN IDHALSFLFR LIAGGGIAGC VLSLGASLWA 
SVERKRRDLA LLRLVGIRNT VLAGFPAIQA AGVAAAGIAL AFAAYFAAAE AINRTFRADL 
SREEFVCRLL PNDGVTAAFL TESLAVLAAL IAVTAVLRIE PGESLREN