Gene MCA2997 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	MCA2997
Symbol
ID	3103962
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylococcus capsulatus str. Bath
Kingdom	Bacteria
Replicon accession	NC_002977
Strand	-
Start bp	3170363
End bp	3171721
Gene Length	1359 bp
Protein Length	452 aa
Translation table	11
GC content	63%
IMG OID	637172123
Product	aminotransferase, class I
Protein accession	YP_115385
Protein GI	53802930
COG category	[E] Amino acid transport and metabolism [K] Transcription
COG ID	[COG1167] Transcriptional regulators containing a DNA-binding HTH domain and an aminotransferase domain (MocR family) and their eukaryotic orthologs
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.845231
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGCAGA GCGGCGCCGC AGGCGCGTTT GCTCCCGCGC TGCAAGCCAC GATGTTGTAT 
AGTCGGAAGC TCGCGAACGC TGATGGGCCG ACGGCTTCCG CTCTCGGCCG GGCCTTGGGC 
GAACCCGCCT CGAATTTTTT CAAAACCATC CAGCCGAACC GGCTCGAGCA ACCACACCGG 
ATTTTCATGA CACCTCGACT TTCCCGCCGA ACCGAACGCC TTACCAGTTC CCTCATCCGT 
GACATCCTGC AGATCACTCA GCGGCCCGGG GTCATCTCTT TCGCCGGCGG CTTGCCGGCG 
GAAGAGATGA TGCCGGAACT GGATTTCGGC GCCTGTGCCG CAGACTCCCG CCAATACGGT 
CCCAGTGAAG GCGAGCCGGT GTTGCGGGAT TTGATTGCCC GAGGGCTCTC TGGCCTCGGG 
CTTCGCTGTC AGACCGAACA GGTTCTGGTG ACGACGGGCT CCCAGCAGGG TATCGACCTG 
GTCGGCAAGC TTTTCATCGA CGAAGGAACG CCGGTGTTGC TGGAATCGCC GACGTACCTC 
GCCGCGCTCC AATGTTTCCG GGTCTATGGC GCGGAGTTTC ACGGCCTGCC CTTGCAGGTC 
GGGGGCATCG ATCCGGACGC ACTGAAAGCG GCCATCGTCC GCCACAGACC CGCTTTCGTG 
TATCTCATCC CCAGCTTCCA GAACCCGTCG GGATGCTGTT ACGCCGATGC GGCACGCCGC 
GCCGTCGCGG CGGTGCTCGA TGAGACCGGT ACCCCTTTGG TGGAGGACGA CCCCTACCGG 
GATTTGGTCT ATACGTCATG CGACCGGACG CCGGTCTGCG CTTATCTCGA AAGGGCGCCC 
TGGGTCTATC TGGGCAGCTT TTCCAAAATA ACGGCGCCGG GACTGCGCGT CGGCTACCTC 
GCATCGTCTC CCGGTCTGTT CCCGTGGCTC GTCCGCCTCA AGCAATCGAG CGACCTTCAC 
ACCGGCCGCA CCGGTCAGGC CTGGCTGGCG CGCTTCCTCT CTTCCGGCGA TTTCGGGAAG 
CATCTGGCGC ACATGAACGG CGTCTATGCC GGGCGGCGGG ATACGATGCA GGCTGCCCTG 
GAGCGGCATT TCAGCGGCCT GGCGGAATGG TCGGCACCGG CCGGTGGACT GTTTTTCTGG 
TTGCGGCTGG TAGGGAACAT CGACACTCTG GCTGCACTCA AGGTGGCATT GGGCCGCGAT 
GTGGCATTCA TGCCGGGAGA ACCGTTCTTC CCGGTCGCGG ATCAGCGCTA TCCGGCTTTG 
CGGTTAAACT TCAGTCATGC TACGCCGGAA AAGATCGAGA GGGGCATCGG CCTCCTGTCG 
GAGGTGCTGA GCGAATGCGC CGCTCCTGCC GCCGGTTGA

Protein sequence

MSQSGAAGAF APALQATMLY SRKLANADGP TASALGRALG EPASNFFKTI QPNRLEQPHR 
IFMTPRLSRR TERLTSSLIR DILQITQRPG VISFAGGLPA EEMMPELDFG ACAADSRQYG 
PSEGEPVLRD LIARGLSGLG LRCQTEQVLV TTGSQQGIDL VGKLFIDEGT PVLLESPTYL 
AALQCFRVYG AEFHGLPLQV GGIDPDALKA AIVRHRPAFV YLIPSFQNPS GCCYADAARR 
AVAAVLDETG TPLVEDDPYR DLVYTSCDRT PVCAYLERAP WVYLGSFSKI TAPGLRVGYL 
ASSPGLFPWL VRLKQSSDLH TGRTGQAWLA RFLSSGDFGK HLAHMNGVYA GRRDTMQAAL 
ERHFSGLAEW SAPAGGLFFW LRLVGNIDTL AALKVALGRD VAFMPGEPFF PVADQRYPAL 
RLNFSHATPE KIERGIGLLS EVLSECAAPA AG