Gene Mnod_4078 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mnod_4078
Symbol
ID	7303455
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium nodulans ORS 2060
Kingdom	Bacteria
Replicon accession	NC_011894
Strand	-
Start bp	4144895
End bp	4146268
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	69%
IMG OID	643601730
Product	phage portal protein, HK97 family
Protein accession	YP_002499260
Protein GI	220923958
COG category	[S] Function unknown
COG ID	[COG4695] Phage-related protein
TIGRFAM ID	[TIGR01537] phage portal protein, HK97 family

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.333282
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCGCATCT TCGGGCTGAC GATCACCCGC GAGAAGGCGG CCCCGACTGC CTCTCCGGTC 
GACACCCGCG GCGGCTGGTG GGGCATTGTC CGGGAGGCCT TCACGGGGGC GTGGCAGAAG 
AGTGTCGAGG TGAGGCTCGA CACGGTGCTG ACCTACAGCG CCGTGTTCCG CTGCGTGTCC 
CTCATCGCCT CGGATATCGC CAAGATGCGC CTGCGGCTCG TGTCGCAGGA TGCGGACGGG 
ATCTGGACCG AGACCAGCAG CCCGTCCTTC TCGCCGGTCC TGCGCAAGCC GAACCGCTTC 
CAGAACCGGA TCCAGTTCAT CACGAGCTGG GTCGAGTCGA AGCTGATCCA CGGCAACACC 
TACGTGCTCA AGGAGCGCGA CAGCCGTCGC GTGGTGGTCG CCCTCTCCGT GCTCGACCCC 
ACCCGCGTGA AGCCGCTGGT CGCCCCCGAC GGCGAGGTCT TCTACCAGCT CTCCCGCGAC 
GATCTGGCCG GGGTCAGCGA CCTGGATGCC GCCCTGCTCG TGCCGGCCAG CGAGATCATC 
CACGACCGCT GGAACACGCT CCATCACCCG CTGGTCGGCA CCTCCCCCAT CTACGCCTGC 
GGTCTCGCCG CGGTGCAGGG GATCCGGATC CAGACCAACA GCGCGCACTT CTTCGGCAAC 
GGCTCGCAGC CGAGCGGGAT CCTGGTGGCG CCCGGCCCGG TCTCGGAGGA GAACGCCAAG 
CGCCTGAAGG CGCATTGGGA GCAGAACTTC ACGGGCCCGA ACGTCGGCCG GGTGGCGGTG 
CTGGGCGACG GCCTGCGCTA CGAGCCCATG GCCGTGAAGG CCAGCGATGC CCAGCTGATC 
GAGCAGCTGA AGTGGAGCGC CGAGACGGTC TGCTCGGTGT TCGGGGTGCC GGCCTACAAG 
ATCGGGGTCG GCGCGCCGCC CGCCTACACC AACATCGAGG CCTTGGACGC GCAATACTAT 
GCGCAGTGCC TGCAGATCCA CATCGAGAGC ATCGAGCTGT GCCTCGATGA GGGGCTTGCT 
CTGCCGGCGC CGTATGGGAC CGAGTTCGAG CTCGACACCC TCCTGCGCAT GGATACCGCG 
ACCCAGATCC GGACCTACGC CGAGGGCGTG AAGGGCGGCC TGCTGAAGCC GGACGAGGGC 
CGGGCGAAGC TCGGGCTGCC GCCGGTGACC GGCGGCAACG CGGTCTACCT GCAGCAGCAG 
AATTTCAGCC TCGCGGCGCT GGCCAAGCGC GACGCCCAGG CCGACCCGTT CAATCCCTCC 
GCCCCCGCAT CTCCGCCCCC AGAGCCCGCG CCGCCGCCAG ACGCGGCAGA GGAGGTCAGT 
CGCTTCGCCT CAGCGCTGCG GCTCAAGCTG GCAGAGGCGA TTGTGAATGC GTGA

Protein sequence

MRIFGLTITR EKAAPTASPV DTRGGWWGIV REAFTGAWQK SVEVRLDTVL TYSAVFRCVS 
LIASDIAKMR LRLVSQDADG IWTETSSPSF SPVLRKPNRF QNRIQFITSW VESKLIHGNT 
YVLKERDSRR VVVALSVLDP TRVKPLVAPD GEVFYQLSRD DLAGVSDLDA ALLVPASEII 
HDRWNTLHHP LVGTSPIYAC GLAAVQGIRI QTNSAHFFGN GSQPSGILVA PGPVSEENAK 
RLKAHWEQNF TGPNVGRVAV LGDGLRYEPM AVKASDAQLI EQLKWSAETV CSVFGVPAYK 
IGVGAPPAYT NIEALDAQYY AQCLQIHIES IELCLDEGLA LPAPYGTEFE LDTLLRMDTA 
TQIRTYAEGV KGGLLKPDEG RAKLGLPPVT GGNAVYLQQQ NFSLAALAKR DAQADPFNPS 
APASPPPEPA PPPDAAEEVS RFASALRLKL AEAIVNA