Gene MCA1330 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA1330
Symbol
ID	3102120
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	1417183
End bp	1418604
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	62%
IMG OID	637170508
Product	hypothetical protein
Protein accession	YP_113792
Protein GI	53804574
COG category	[R] General function prediction only
COG ID	[COG4783] Putative Zn-dependent protease, contains TPR repeats
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.643696
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGATCGCCG CAACCCTTCC CGCGGCCGGC GAACCCCTCA ACCTCGAGCT GCCGGACATG 
GGCGACTCCA CCGGCACTCT TTTCACGCCC CAGCAGGAAA AAGCGCTGGG CGAGGCCTTT 
TACCGGAATC TGCACCTCCA GGTCCAGATC AACGAAGATC CGGAAGTCAC CGACTACATT 
CAAGCGCTGG GGCGGAAGCT GGTGGAAAAC AGCGACACGC CAGCCCAGCC TTTTTACTTC 
TTCGTCGTCA ATCAGCCGGT CATCAACGCG TTCGCCGGTC CCGGCGGCTA CATCGGCGTC 
AACTCGGGGT TGATCCTCAT CACCGAAAGC GAAAGCGAGC TGGCCTCGGT GCTCGGACAC 
GAAATCGCAC ACATCACCCA GCGCCATCTC TACGAGGCAT TCCAGGCCGC CGGCCGGCTA 
TCGCTGCCGA CCGCGGCGGC CATGCTGGCC GGCGTGCTGC TGGGCGCAGG CACTGGCTCC 
AGTCAGTTGG GCCAGGCTGC AGTCATCGCC GCCACGGCAG CCAGCCAACA GATGCAGATC 
AATTTTACCC GGGACAACGA GGCGGAAGCC GATCGGGTGG GCATGAAAAT CCTCTCTGGC 
TCGAACTTCG ATCCCCGTGC GATGCCCACC TTCTTCGAAC GAATGCAGCA ATCCACCCGC 
TTCTCCACCG GCCGCAGCAC GCCGGAATTT CTCCTGACCC ACCCGGTCAC CGTGTCGCGT 
ATCGCCGACA CCCGCGGGCG GGCCGAACAA TATCCCTACA AGCAATATCC CGACTCGTTC 
ACCTACCAGA TCATCCGGGC CAAGCTGCAC GTTCAGACGA CCCACAATCC TCAGGAAAGC 
GTCGATTATT TCACCGCCAT TTCGGAGGTG GGCACCCGTC AGCAGCAAGA CGTGGCCCAT 
TACGGACTGG CCCTTGCCCT GGTCGCCCAG GGCAAGATTG GTCAAGGCAG ACCCATGCTG 
GAGGAACTCA TCCGCCGCTA TCCCGAGCAG TCGCACTTCT TCAATGCCCT CGCTGACGCG 
GAACGCGAAG CCAAGACCTA CCCCGCCGCC TTCGCTATCT ACGAGGAAGC CTTGAAGCGC 
TTTCCCGGCA ACCGCGCGCT CACTTTGAAC TATGCCCAGA CCCTGGTCCG CGCCGGCAAA 
CCCCTGGAGG CGCGCAAGCG GCTGCAGGAC TACCTGCTCC ATTTTCCCGC TACGCCGGAG 
GTATATGAAC TGCTGGCGCA AGCCCACTCC CAGCTCGGCA ACGAAGCGGA ATCCCACCGA 
TACCTGGCCG AAGCCTATTA CGCCGACGGT CAGACCCGCA ACGCCATCCT GCACCTCAAG 
CTGGCACAGA AAGCACCAGG CCGCGATTTC CAGACCGACG CGGCGATCGA GGAGCGACTG 
AAGGAACTAA TGGAAGAGCA GAGGGAGGAA AGGGAAAAAT GA

Protein sequence

MIAATLPAAG EPLNLELPDM GDSTGTLFTP QQEKALGEAF YRNLHLQVQI NEDPEVTDYI 
QALGRKLVEN SDTPAQPFYF FVVNQPVINA FAGPGGYIGV NSGLILITES ESELASVLGH 
EIAHITQRHL YEAFQAAGRL SLPTAAAMLA GVLLGAGTGS SQLGQAAVIA ATAASQQMQI 
NFTRDNEAEA DRVGMKILSG SNFDPRAMPT FFERMQQSTR FSTGRSTPEF LLTHPVTVSR 
IADTRGRAEQ YPYKQYPDSF TYQIIRAKLH VQTTHNPQES VDYFTAISEV GTRQQQDVAH 
YGLALALVAQ GKIGQGRPML EELIRRYPEQ SHFFNALADA EREAKTYPAA FAIYEEALKR 
FPGNRALTLN YAQTLVRAGK PLEARKRLQD YLLHFPATPE VYELLAQAHS QLGNEAESHR 
YLAEAYYADG QTRNAILHLK LAQKAPGRDF QTDAAIEERL KELMEEQREE REK