Gene Mnod_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_1994
Symbol
ID	7305183
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	+
Start bp	2095478
End bp	2097313
Gene Length	1836 bp
Protein Length	611 aa
Translation table	11
GC content	70%
IMG OID	643599729
Product	Terminase
Protein accession	YP_002497284
Protein GI	220921983
COG category	[R] General function prediction only
COG ID	[COG4626] Phage terminase-like protein, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.447036
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCCTATCT CAGGCCCGTC GCGAAGTGAT CCCACGACCG CCTGGGCGGA AGACGTCGTC 
GCCGGGCGGA TCGTGGCCGG CGAGCTGGTG CGCCATGCCG CCGAGCGGCA CCTGCGCGAC 
CGGCGCGATG GAGCCCGGCG TGGGTTGCAC TGGCGGCCGG AGATCGCAGC CCGGGCGCTC 
GGCTTCCTGC CGGCCGTCCT GACCATCACG GCGGGCGCCA AGGCCGGCGA GCCGTTCGTG 
CCGCTGCCCT GGCACACCTT CGTGATCGGC TCGCTGTTCG GCTGGCGCAA GGACAGCGGT 
CGGATGCGCT TCCGTGCCGG CTGGCTGGAG ACCGGCAAGG GCCAGGCGAA GTCGCCGCTG 
ATGGCCGCGG TTGGGCTCTA CCTGATGGGC TGGGCCGGCA TTCCGCGGTC CGAGGTCTAC 
GCGATCGGGC AGGACCGGGC CACCGCCAAC GTGCTGTTCG GGGACGCGGT GGCGATGTGC 
CGGGCGCCGA TCCCCGGAGC CGAGGACGAC AGTGACACGC TGGAGCAGCG CGGCGAGGTC 
GTGATCCGCG GCGAGGGCGA CAATGCCTGG AAGATCGAGC ACATCGAGAC CGGCTCGAAG 
TTCCGGGCGC TGGCCAACGG CGAGGCGGTG TCTGGCCCGC GGCCCACCGC CGTGCTGGCC 
GACGAGATCC ACGAGTTCAA GGCCAACGCG GCCATCGAGA CGTGGCGGCG GGCGGTGGCG 
AAGATGCCGG GCGACGCGCT GATGCTGCTC GGCACCAACA CGCCGGCCAC GACGCAGATC 
GTTGGCACGG ATTACTCGGA GTTCTACCAG AAGGTAGCGC GGGGCGAGAT CCAGGATGAC 
GAGGCGTTCG CCTTCATCGC CCGGGTCGAC AAGGCCGACC GCGAGAGCGT GTTCGAGGAC 
GAATCCTGCT GGCCGAAGGC GCTGCCGGCG CTGGGCATCA CCTTCCCGAT CGAGAACATC 
CGGGGCGAGG TGAACACGGC CAAGCAGTTG CTCTCGACGG CGCTGTCGGT GAAGCGGCTC 
TACTTCGGCA TCCCGATCGG CGCCACCGCG TTCTGGATCG CTGAGGAGGC CTGGGTCGCG 
GTTCAGGGCA AGGTCGATGC GCAGGCGCTG CGTGGGCAGC CGTGCTGGCT GGCGCTGGAC 
CTGTCCAAGA AGAACGACCT CACGGCCCTC ACGGCGGTGT GGGTCGGGGG AGACGGGCAC 
CACTTTGCCA AGACCTGGTA CTGGACCACG CGGGAAGGGA TTGCGGACCG GGCCCGGGCC 
GATCAGGCGC CCTATGACCA GTGGGCGGAG AGGCCTGAGG AGACGGGCTT GGTCGCCGTT 
CCGGGCGCGG TGATCGACAA GACCTTCGTG GCCGCCGAGG TGGCCCGCCT CGTCGCCGAG 
CACGACGTGC AGTTCCTGGC CTTCGACCCG GCCGGGATGG CGGATTTCGA GGCCGCCTGC 
GAGGAGATCG GGCTTCCGGT GTGGCGCTAC CAGGGGCCGG GCGAGCCCGA AGGCGAGGGG 
TTGAAGCTCG TCGCGCACGG CCAGGGCAAG CGCATCGTGT TCGAGGACCG GGCGCTGTGC 
ATGCCGCGCT CGATCGAACG CCTGGAGGAC CTGATCCTGA CCGGCGGCAT CGCGATCGAC 
GCCTCCCCCG TCACCTACGC CTGCGCCGCC AACGCCCACG TCGATGCGGA CGGCCAGGGC 
AACCGGGCCT TCGACAAGAA GCGGAGCCGG GGCCGCATCG ACGGCCTCGT GACGATCGCG 
ATGGCGGTCG GGGCAGCGTC GGCCGACCTG CCGGACAGCG GCCCGTCCGT CTACGAGACC 
CGCGGCATCC TGGAAATCGA GATCGACGCG ATCTGA

Protein sequence

MPISGPSRSD PTTAWAEDVV AGRIVAGELV RHAAERHLRD RRDGARRGLH WRPEIAARAL 
GFLPAVLTIT AGAKAGEPFV PLPWHTFVIG SLFGWRKDSG RMRFRAGWLE TGKGQAKSPL 
MAAVGLYLMG WAGIPRSEVY AIGQDRATAN VLFGDAVAMC RAPIPGAEDD SDTLEQRGEV 
VIRGEGDNAW KIEHIETGSK FRALANGEAV SGPRPTAVLA DEIHEFKANA AIETWRRAVA 
KMPGDALMLL GTNTPATTQI VGTDYSEFYQ KVARGEIQDD EAFAFIARVD KADRESVFED 
ESCWPKALPA LGITFPIENI RGEVNTAKQL LSTALSVKRL YFGIPIGATA FWIAEEAWVA 
VQGKVDAQAL RGQPCWLALD LSKKNDLTAL TAVWVGGDGH HFAKTWYWTT REGIADRARA 
DQAPYDQWAE RPEETGLVAV PGAVIDKTFV AAEVARLVAE HDVQFLAFDP AGMADFEAAC 
EEIGLPVWRY QGPGEPEGEG LKLVAHGQGK RIVFEDRALC MPRSIERLED LILTGGIAID 
ASPVTYACAA NAHVDADGQG NRAFDKKRSR GRIDGLVTIA MAVGAASADL PDSGPSVYET 
RGILEIEIDA I