Gene MCA2099 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA2099
Symbol	pepA
ID	3104100
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	2257728
End bp	2259221
Gene Length	1494 bp
Protein Length	497 aa
Translation table	11
GC content	64%
IMG OID	637171253
Product	aminopeptidase A/I
Protein accession	YP_114529
Protein GI	53803849
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.41187
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGAGTATT CGACAAGAAC TGACACGCTG GAGCGGCTTT CGACCGATTG TCTGATCGTG 
GGCGTGTTCC AGAAGCGTAA ACTCGCACCC ACGGCCGAGG CGCTGGACGC GCTGTTCGAC 
GGGCTGCTGG CCAGGCTGCT CAAGCGCGAT GACGTGGAAG GCAAGGCCGG CGATACCCTG 
CTGGTCAACC ATGTGCCGGG CGGCCGGATC GACCGGGTGC TGCTGGTCGG GCTGGGGAAA 
CGTGAGGAGC TGAACGTCGC CGCCTATCGT AAAAGTCTGG CGGCGGCCTT CAAGGTGTTG 
AAGGAATCCG GCGCCAAGCA TGCGGTGTCG GCTCTGCACG AGGTGGAGGT TGGCCAGCGG 
GGGGCGGACT GGAAGATCCG TCAGGCCATC GAGCTGCTGG AAAGCGGGCT CTACCGCTTC 
CAGGAGATGA AGGGGGCGTC AGCCGAAGAC CATCCGCCCC GCCTGTCCAG GCTGCAATTC 
CTGTTGGCCT CCGATCAGGA TGCGGCCCCG GTCGAAACGG GAATCCGGGA GGGTCAGGCG 
ATCGCCCACG GCATGACCCT GGCCCGCAAC CTGGGCAATC TTCCGGGGAA CGTCTGCACA 
CCCGCTTACC TCGCCGAACA GGCGCTGAAG CTCGGCAAGG AATACAAGAA GCTGAAGGTT 
TCGGTGCTGG AAGAGAGCGA CATGGAGGAA CTGGGTATGG GAGCCTTGCT GTCGGTGGCG 
CGCGGCAGCC GCCAGCCGGC CAAGCTGATC GTCCTGGAAT ACCGTGGTGC CGCCGGCAAG 
GCCAAGCCTT ATGTCCTCAT CGGCAAGGGT CTGACCTTCG ATGCGGGAGG CATTTCCCTG 
AAGCCTGCCG CCAACATGGA CGAGATGAAA TACGACATGT GCGGGGGCGC CGGCGTCATC 
GGCGCGATCC AGGCGGTGGC GGAGATGGGG CTGCCGTTGA ACGTGGTCGG TCTGGTGCCG 
GCTTCCGAGA ACCTGCCGGA CGGCAATGCC AACAAGCCCG GCGACATCGT CAGGAGCATG 
GCCGGCATCA CCATCGAGAT CCTCAATACC GACGCGGAAG GGCGCCTCAT CCTGTGTGAC 
GCGCTGACCT ATGCCAAGCG TTTCGACCCC GTGGCGGTGA TCGACGTGGC GACCCTGACC 
GGGGCTTGTA TCGTGGCGCT GGGGCGTCAT CCCAGCGGCC TGATGGGCAA TGACGACGCA 
TTGTGCGAGC AGTTGACCCG GGCCGGCGAA ACCACCTGGG ACCGGGTCTG GCGCATGCCG 
ATCTGGGACG ATTACCAGGA ACAGCTCAAG TCCAATTTCG CCGATGTCGC CAACATCGGT 
GGGCCGGATG GCGGCAGCAT CACCGCCGCC TGCTTCCTTT CGCGGTTCGC CAAAGACTTC 
AAATGGGCGC ATCTCGACAT CGCGGGGACG GCCTGGAAAA CGGGAGCCGA CAAGGGCGCT 
ACCGGCCGTC CGGTGCCGCT CCTGGTGCAA TACCTCATCG ACCGGGCGGC ATGA

Protein sequence

MEYSTRTDTL ERLSTDCLIV GVFQKRKLAP TAEALDALFD GLLARLLKRD DVEGKAGDTL 
LVNHVPGGRI DRVLLVGLGK REELNVAAYR KSLAAAFKVL KESGAKHAVS ALHEVEVGQR 
GADWKIRQAI ELLESGLYRF QEMKGASAED HPPRLSRLQF LLASDQDAAP VETGIREGQA 
IAHGMTLARN LGNLPGNVCT PAYLAEQALK LGKEYKKLKV SVLEESDMEE LGMGALLSVA 
RGSRQPAKLI VLEYRGAAGK AKPYVLIGKG LTFDAGGISL KPAANMDEMK YDMCGGAGVI 
GAIQAVAEMG LPLNVVGLVP ASENLPDGNA NKPGDIVRSM AGITIEILNT DAEGRLILCD 
ALTYAKRFDP VAVIDVATLT GACIVALGRH PSGLMGNDDA LCEQLTRAGE TTWDRVWRMP 
IWDDYQEQLK SNFADVANIG GPDGGSITAA CFLSRFAKDF KWAHLDIAGT AWKTGADKGA 
TGRPVPLLVQ YLIDRAA