Gene MCA1769 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1769
Symbol
ID	3104231
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	1900555
End bp	1901823
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	59%
IMG OID	637170930
Product	cytochrome c peroxidase family protein
Protein accession	YP_114208
Protein GI	53804187
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1858] Cytochrome c peroxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.391273
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGATTCA TGAAAATATC GAGTCACTTC GTGGTTTTCT TACTGGCTGC GGTTGCCGGC 
ACTCTGGAAG GACATGCGGC TACCGCACTG ACGCCTGGAG AACTGCTCGG CAAGGCGCTC 
TTTTTCGACC CCAGCCTTTC GACCCCGCCA GGACAGTCCT GCGCCGACTG TCATGATCCC 
AAGGCCGGAT GGACCGGCTC GGACCAGGAC ATCAATCTGC ACGGCGGTGT TTATGAAGGT 
GCGGTTGCAA CACGCTTCGG TAACCGCAAA CCACCGACCG CCGCCTATGC TTCGTTCAGC 
CCGAAATTTC ACCGCGACGG TAACGGGGAG TTCGTGGGCG GAAACTTCTG GGACGGCAGA 
GCGACGGGGG AAAGGCTCGG AAATCCCGCG GCGGATCAGG CCCAGGGACC ATTCCTCAAC 
CCTTTGGAGC AGAATGATCC CAGTGCGGCG GACGTTTGCC GGAAGGTGGC GGCTTCCGGT 
TTCGCCGCCC AGCTCACGGG TTCAAGCTAT CCCGATCTGT TCGCGCGCGC CTTCGGGCCG 
GGCACGTTGG ACTGTGATAA TTCATCCGAT ACTTATGACC GCATCGCTCT GGCCATTGCC 
GCCTATGAGG CTTCCAGGGA GGTCAGTTCA TTCAGCTCGA AGTACGATGC ATATCTGAGA 
GGGAGGGCGG TGTTGACGAA ACAGGAGAAG AAGGGGATGG CATTGTTTGA GGGAAAAGCG 
AAGTGCGCGA ATTGCCATTC CACGAGGGGC ATGAGCTACG CCGGCAAATT TCCCCTTTTC 
ACCGATTTCA CCTATGTCAA CACCGGTGTT CCCAGAAACC CGGAAAACCC TTTCTATCAG 
ATGCCCGCCG AGTTCAATCC GCTAGGCGCG GACTGGGTGG ACCCGGGACT GGGCGGATTC 
CTGGCTGGCC GGGTGGAGTA CGCACCGTAC GCGGCCGATA ACAAAGGTAA GCAGAAAGTT 
CCCACCTTGC GGAATGTCGA CAAGCGCCCA TCCTTGGCAT ACCTGAAGGC ATACATGCAC 
AACGGCGCAT TCAAGAGTCT GAAGGAAGTG GTTCACTTCT ATAACACGCG CGATGTGCTG 
GCCGCCTGTG AGCACCTTTC CCATCCGGAG CCCGGCATCA ACTGCTGGCC GGCTGCGGAA 
GAGGCAGCCA ATGTCAACCG GACGGAAACG GGCGATTTGA AATTGTCGGA TGAGGAGGAG 
GATGCCATCG TCGCGTTTCT GAGGACGCTG TCCGACGGCT TCCAGCTTTC AGGCCCAACG 
GCCGACTGA

Protein sequence

MRFMKISSHF VVFLLAAVAG TLEGHAATAL TPGELLGKAL FFDPSLSTPP GQSCADCHDP 
KAGWTGSDQD INLHGGVYEG AVATRFGNRK PPTAAYASFS PKFHRDGNGE FVGGNFWDGR 
ATGERLGNPA ADQAQGPFLN PLEQNDPSAA DVCRKVAASG FAAQLTGSSY PDLFARAFGP 
GTLDCDNSSD TYDRIALAIA AYEASREVSS FSSKYDAYLR GRAVLTKQEK KGMALFEGKA 
KCANCHSTRG MSYAGKFPLF TDFTYVNTGV PRNPENPFYQ MPAEFNPLGA DWVDPGLGGF 
LAGRVEYAPY AADNKGKQKV PTLRNVDKRP SLAYLKAYMH NGAFKSLKEV VHFYNTRDVL 
AACEHLSHPE PGINCWPAAE EAANVNRTET GDLKLSDEEE DAIVAFLRTL SDGFQLSGPT 
AD