Gene M446_2072 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_2072
Symbol
ID	6134431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	2312855
End bp	2314015
Gene Length	1161 bp
Protein Length	386 aa
Translation table	11
GC content	75%
IMG OID	641642301
Product	hypothetical protein
Protein accession	YP_001768969
Protein GI	170740314
COG category	[S] Function unknown
COG ID	[COG4641] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.236468
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0105803
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCCGCC CCCTCGACCT CGTCGTCCTC GGCCTCAGCC TGTCCTCGTC CTGGGGCAAC 
GGCCACGCCA CCACCTACCG GGCGCTGCTG CGGGCCTTCG CGGCGCGCGG CCACCGCGTC 
ACCTTCCTGG AACGGGACGT GCCCTGGTAC GCGGCCCATC GCGACCTCGC CGCGCCGGAT 
TACTGCGACC TCGTCCTCTA TCCCGACCTC GCGGCCCTGC GCGACCTGCG CCCGCGCCTG 
CTGCGGGCGG ACGCGGTGAT GGTCGGCTCC TACGTGCCGG AGGGCGTCGC GGTCGGCGCC 
CTGGCGGTCG CGACGATGCG GGAGGCGGGG GGCGTCGCCG CCTTCTACGA CATCGACACG 
CCGGTGACGC TCGCCAAGCT CGCCCGGGGC GACCACGAGT ACCTCACCCC CGACCTGATC 
CGCGCCTACG ACCTCTACCT CTCCTTCACG GGCGGGCCGG TGCTGGAGCG CCTGGAGCGG 
GAATTCGGCG CGCCCCGCGC CCGCGCCCTC TACTGCTCGG TCGATCCCGC CCTCTACGCG 
CCGACCGGCG CGGAGCCGGT CTACGACCTC TCCTATCTCG GCACCTACAG CCCGGACCGG 
CAGCCGACCC TGGAGCGGCT CCTGATCGAG CCCGCGCGGC GGGCGCCCGA GCTGCGCTTC 
GTGGTCGCCG GGCCGCAATA TCCCGCCGAC ATCGCCTGGC CGCCGAACGT CGAGCGGCGC 
GACCACGTCG GCCCCGCCGA TCACCCGGCC TTCTACGGCC TGAGCCGCTG GACCCTGAAC 
GTCACCCGCG CCGACATGCG CGCGGCCGGC TACAGCCCGA GCGTCCGCCT GTTCGAGGCC 
GCCGCCTGCG GCACGCCGAT CCTCTCGGAC GACTGGCCGG GCCTCGGCAC GATCCTGGCG 
CCGGGCCGCG AGATCGTGGT GGCCGAGGGC CCCGACGCGG TGCTGTCGGC GCTCACCCGG 
ACGAGTCCGG CCGAGCGCGC CGCCCTGGCG CAGGCGGCCC GCCGCCGGGT GCTGGCCCGG 
CACAGCGCCG CGCAGCGGGC CCAGGAACTC GAGGCGGCGC TCCTCGAGGC GGCGCTGCGC 
GAGGCGGCGG CGCCTTCGCC CAAATACTCG CATGAAGTAT CGAAACTCCC GCTTGCCGAG 
GGCGTTAGGG GGCGGAGCTA A

Protein sequence

MTRPLDLVVL GLSLSSSWGN GHATTYRALL RAFAARGHRV TFLERDVPWY AAHRDLAAPD 
YCDLVLYPDL AALRDLRPRL LRADAVMVGS YVPEGVAVGA LAVATMREAG GVAAFYDIDT 
PVTLAKLARG DHEYLTPDLI RAYDLYLSFT GGPVLERLER EFGAPRARAL YCSVDPALYA 
PTGAEPVYDL SYLGTYSPDR QPTLERLLIE PARRAPELRF VVAGPQYPAD IAWPPNVERR 
DHVGPADHPA FYGLSRWTLN VTRADMRAAG YSPSVRLFEA AACGTPILSD DWPGLGTILA 
PGREIVVAEG PDAVLSALTR TSPAERAALA QAARRRVLAR HSAAQRAQEL EAALLEAALR 
EAAAPSPKYS HEVSKLPLAE GVRGRS