Gene Mnod_4081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_4081
Symbol
ID	7303458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	-
Start bp	4148725
End bp	4150425
Gene Length	1701 bp
Protein Length	566 aa
Translation table	11
GC content	72%
IMG OID	643601733
Product	Terminase
Protein accession	YP_002499263
Protein GI	220923961
COG category	[R] General function prediction only
COG ID	[COG4626] Phage terminase-like protein, large subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGAGGGAAT GGAGCACCGC CTGCCCGGAT TGGGAGGAGC GCATCCGGGC CGGGCGCTCG 
CTGCTGCCCT GCGGGCCGCT CTTCCCGGCC GAGGCGGCCG CGGCCATGGA GGTGTTTCGC 
GCGCTGCGGA TCGTGGATGC GCTCGGCAGC CCCACCCTCG GCGAGGTCTG CCGGCCCTGG 
GTCACCGAGT TCGCCGAGGT GATCTTCGGC GCCTACGATC ACGCCAGCGG GCGGCGGCTG 
ATCCGCGAGT TCTTCCTCTG CATCGCCAAG AAGAACGGCA AGTCGACGCT GGCGGCCGGC 
CTCATGCTCA CCGCCCTGAT CCGCAACTGG CGGCGCTCGG CCGAGTTCCT GATCCTGGCT 
CCGACCATCG AGGTGGCCAA CAACGCCTTC CAGCCGGCGC GCGACATGGT CAAGGCCGAT 
GACGAGCTGC GCGCCCTGCT GCACGTGCAG GACCACTACC GCACCATCAC CCACCGCCAC 
ACCGGCGCGG CGCTGAAGGT GGTCGCGGCC GACACCGAGA GCGTGTCGGG CAAGAAGGCG 
ACCAGCGTGC TGGTCGACGA GCTGTGGCTG TTTGGCAAGC GGCCGCAGGC CGAGAACATG 
CTGCGCGAGG CGACCGGCGG CCTGGTCTCG CGGCCCGAGG GCTTCGTGAT CTACGTCTCG 
ACGCATGCGG ACGAGCCGCC CGCGGGCGTG TTCAAGCAGA AGCTGGCCTA CTTCCGCGCC 
GTGCGGGACG GGCGGATCAC GGATCCGCGC AGCCTGGGCG TGCTCTACGA GCATCCCCGG 
GCGATGGTGG AGCGCGGCGA GCACCTCGCT CCGGCGAGCT TTCGCCTCAC CAACCCGAAC 
CTGGGCCTGT CGGTCGACCC GGAGTGGCTC AGCGAGAAGC TGGAGGAGGC GCGGACCGCC 
GGGCCGGCCT CGCTGGCGGG GTTTGCGGCC AAGCACCTCA ACGTGGAGAT CGGCCTGGGG 
CTGCGGGCGG ACCGCTGGCC GGGCGCCGAG TTCTGGGCCC GCCGCGCCGA TCCTGCTCTG 
GCCTCCCCTG TCGAGGATCC GCGGGCGGGT CTGCAGGCCC TGCTCGAGCG CTGCGAGGTG 
GTGGTGGTCG GCATCGACGG GGGCGGCCTG GACGACCTGT TCGGCTTGTG CGTGCTCGGC 
CGCGAGCGGG CGAGCCGCGA CTGGCTGGCC TGGAGCCACG GCTGGTGCCA CGCGGGCGTG 
CTGGAGCGCC GGCCGGCGAT CGCCTCGCGG CTGCGGGATT TCCAGGCGGC GGGCGAGCTC 
ACCATCGTGG GCGACGAGCT GGCCGACATC TCGGCGATCG TCGGCCTGGT CGCGGCGGTG 
AAGGAGCGGG GCCTGCTGGG CGGGGTCGGG GTCGATCCGG CCGGGCTCGG CGAGCTGATC 
GAGGCCTTCG CGGAGATCGG GGTGACGCAG GAGGCCGGCC TGCTGATCGG GGTGCCGCAG 
GGCTACGGGC TGATGACCGG CATCAAGACC GCCGAGCGCA AGCTCGCCAA CGGCACGCTC 
CGGCATGCCG GCTCTGCCCT GGCGGCGTGG TGCGTGGCCA ATCTCAAGAT CGAGCCGACC 
GCGACCGCGA TCCGGGCCAC CAAGCAGAAT GCCGGCGACG CCAAGATCGA CCTGGCCATG 
GCGCTGTTCA ACGCGGTGGT GCTGATGGCG CGCACCCCCG AGGCTCACCG CGAGCCGGAA 
TACGCCATGT ATTTCGCCTA G

Protein sequence

MREWSTACPD WEERIRAGRS LLPCGPLFPA EAAAAMEVFR ALRIVDALGS PTLGEVCRPW 
VTEFAEVIFG AYDHASGRRL IREFFLCIAK KNGKSTLAAG LMLTALIRNW RRSAEFLILA 
PTIEVANNAF QPARDMVKAD DELRALLHVQ DHYRTITHRH TGAALKVVAA DTESVSGKKA 
TSVLVDELWL FGKRPQAENM LREATGGLVS RPEGFVIYVS THADEPPAGV FKQKLAYFRA 
VRDGRITDPR SLGVLYEHPR AMVERGEHLA PASFRLTNPN LGLSVDPEWL SEKLEEARTA 
GPASLAGFAA KHLNVEIGLG LRADRWPGAE FWARRADPAL ASPVEDPRAG LQALLERCEV 
VVVGIDGGGL DDLFGLCVLG RERASRDWLA WSHGWCHAGV LERRPAIASR LRDFQAAGEL 
TIVGDELADI SAIVGLVAAV KERGLLGGVG VDPAGLGELI EAFAEIGVTQ EAGLLIGVPQ 
GYGLMTGIKT AERKLANGTL RHAGSALAAW CVANLKIEPT ATAIRATKQN AGDAKIDLAM 
ALFNAVVLMA RTPEAHREPE YAMYFA