Gene Mnod_1996 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_1996
Symbol
ID	7305185
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	+
Start bp	2097492
End bp	2098913
Gene Length	1422 bp
Protein Length	473 aa
Translation table	11
GC content	69%
IMG OID	643599731
Product	phage portal protein, HK97 family
Protein accession	YP_002497286
Protein GI	220921985
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0457981
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGGGCTGC TCGCCTCGCT CTTCGGCGCT GCGGCCGCGC CCCGCTTCGG CCCGTCAGCC 
TCCGTCTCGG ACGGCGGCTG GCTCATCCGC GCCATCGGTG GCGGGCGCAC CGCCGCTGGC 
ACGGTCGTGA CCGAGCACTC GGCCCTGCGG CTGCCGGTGG TCTACGCCTG CGTCAACCGC 
ATCTCGAACC CGCTGGCCCG CTTCCCGATC AAGATCATGA AGCCCCGCGC CGGCGGGGGC 
AGCGAGGAGG TGACGGACCA TCCCCTGTCG CGCCGGCTCG GCCTGCGGCC CAACGACTTC 
ATGTCGTCGC GCACCCTGCG CAAGACGGCG CAGGCTCATG CTCTCCTGTG GGGCAACGGC 
TACATGGAGA TCGAGCGCAA CGGCCGCGGG CAGGCGGTCG GTCTCTGGCC GCTCCTGCCC 
TGGGCCACGC AGCCGGTGCG CGAGGACGGC GTGCTGGTCT ACCGGACCAC CATCGACGGG 
CAGACCTTCC GCCTCGACCA CGAGGACGTC CTGCACATCA TGGACCTCAG CCAGGACGGC 
TATGTGGGGC ATTCGCCGGT GGCACTGGCC CGCGAGGCCT TGGGGCTCGC GCAGGCCCTT 
GAGCAGTTCG GCGGCAAGTT CTTCGCCAAC GATGCCAAGA GCGGCGGCTT CCTCCTGCAT 
CCCGGCCGGC TCTCGGCCGG CGCACAGGCG AACCTGAGGG CGCAGGGACC GCGCGGGCAG 
CGCGACCCGA ACGCTCCGCG GGTCGAGCCG GGGCGCACCG ACCCCGGCGC GATGCTGGAG 
CGCCAGGGCG GCCTCGACAA CGCGCACCGG GTCAAGGTGC TCGAGGAGGG CATGAAGTAC 
ATCCAGACGA CGATCCCGCC CGAGGATGCG CAGTTCCTCG GCACCCGCGA GATGCAGATC 
GCGGAAATCG CGCGGATGTA CGATGTGCCG CTGATCCTGC TGCAGAGCCA CGAGAAGACG 
ACGTCGTGGG GCTCCGGCAT CGAGCAGCTG ATGATCGGCT TCGTCCGTCA GACCGTCGAG 
CCCTGGGTGA ATGCCTGGGA GCAGGAGATG AACTGGAAGC TCTTCACGGA AGAGGAGCGA 
AAGCAGGGAT ACTTCGTCAA GTTCAACATG AACGCGCTCC TGCGCGGCGA CATGATGAGC 
CGGGCCCGGT TCTACCAGCT TCTGTTCGGC GTGGGCGGCC TCTCGCCCAA TGATATCCTG 
ACGCTGGAGG ACATGGACCC GCTCGGCCCC GAAGGCGATC ACCACTTCGT GCCGGTCAAC 
ATGCACACCC TCAAGAACGC GATCGACACC GTCGGCGTGC CCCAGGGCGG TGCCGTGCCT 
CCCGATCCGA CCCAGGAGGC GCGGCTGGCC GCCGTGGAGG GGCGCGTGGA CGAGCTCGAC 
GTCATCGCTG CCCGTCTCGA CGCTTTGGAG CGCGCCGCAT GA

Protein sequence

MGLLASLFGA AAAPRFGPSA SVSDGGWLIR AIGGGRTAAG TVVTEHSALR LPVVYACVNR 
ISNPLARFPI KIMKPRAGGG SEEVTDHPLS RRLGLRPNDF MSSRTLRKTA QAHALLWGNG 
YMEIERNGRG QAVGLWPLLP WATQPVREDG VLVYRTTIDG QTFRLDHEDV LHIMDLSQDG 
YVGHSPVALA REALGLAQAL EQFGGKFFAN DAKSGGFLLH PGRLSAGAQA NLRAQGPRGQ 
RDPNAPRVEP GRTDPGAMLE RQGGLDNAHR VKVLEEGMKY IQTTIPPEDA QFLGTREMQI 
AEIARMYDVP LILLQSHEKT TSWGSGIEQL MIGFVRQTVE PWVNAWEQEM NWKLFTEEER 
KQGYFVKFNM NALLRGDMMS RARFYQLLFG VGGLSPNDIL TLEDMDPLGP EGDHHFVPVN 
MHTLKNAIDT VGVPQGGAVP PDPTQEARLA AVEGRVDELD VIAARLDALE RAA