Gene M446_5033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5033
Symbol
ID	6129475
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	+
Start bp	5514099
End bp	5515229
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	75%
IMG OID	641645169
Product	peptidase dimerisation domain-containing protein
Protein accession	YP_001771794
Protein GI	170743139
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0624] Acetylornithine deacetylase/Succinyl-diaminopimelate desuccinylase and related deacylases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.379056
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.00853617
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGTCCCCCG AATCCGCCGC CCCGTCGCCC GAGGAGGCCG TCGCCGCGAT CAGCCGCTGG 
CTCTCGGTCG AGAGCCCGAC CCACCACGCG GCCGGGGTCA ACCGGATGAT GGACCTCGTC 
GCCGACGAGG CCGAGGCGAC CGGCATCCCG TGGGAGCGGA TCGGCGGCAC GCAGGGCCTC 
GGCGACAGCC TGATCCTGCG GGCCGGGCCG CGGACCGGGG AGCCCGCCCT CCTGGTCCTG 
TCGCACCTCG ACACGGTCCA TCCGGTCGGC ACCCTGGCGG AGCTGCCGGT GCGGGTCGAG 
GGCGACCGGC TCTACGGGCC GGGCGTGTAC GACATGAAGG GCGGGGCGTG GCTCTGCCTG 
CAGGGCTTCA TCGCCGCGGC GAAGGGCGGG CAGGCCCGGC GGCCCCTCGT CTTCCTGTTC 
ACGAGCGACG AGGAGATCGG CTCGCCGACG ACCCGCGGGC TGATCGAGGA TCTGGGGCGG 
CGGGCCGAGG CGGTGCTGGT GACCGAGCCC GGCCGGGACG GCGGCCGGGT GGTCACGGGC 
CGCAAGGGCG TCGGGCGCTT CGACATCCAC GTGGAGGGGC GCCCCGCCCA TGCCGGTAGC 
CGCCACGCGG AGGGGCGCAA CGCGATCCGC GAGGCCGCCC GGCTGATCCT GGAGATCGAG 
GCCCTGACCG ACTACGCGCG CGGCATCACC ACCACGGTCG GGCTGGTCCA GGGCGGCACC 
GCCGAGAACG TGGTGCCGCA GCATTGCCGC TTCACCGCGG ACCTGCGGGT GGTGACGGAG 
GAGGACGGGC GGGCCTGCGT GGCGCGCCTC CGCGGCCTGC AGGCCGCGCC CGACTTCACC 
GTGACGGTGA CCGGCGGCAT GAACCGCCCG CCCTATCCGC GCTCGGACCT GACCGGCCGG 
CTCTTCGCGC AGGCGCGCGC CATCGCCGAG CAGGAGCTCG GCCTCGCCCT CGGCGAGGTG 
CCGCTGACGG GCGGCGGCTC GGACGGGAAC TTCACGGCGG CGCTCGGCGT GCCGACCCTC 
GACGGCCTCG GCATCGACGG GGACGGCGCC CACACGCTGT GGGAGTACGG CCTGATCTCC 
TCCATCGCGC CGCGGCGGCG GCTGATGCAG CGGATGCTGG AGACGCTGTG A

Protein sequence

MSPESAAPSP EEAVAAISRW LSVESPTHHA AGVNRMMDLV ADEAEATGIP WERIGGTQGL 
GDSLILRAGP RTGEPALLVL SHLDTVHPVG TLAELPVRVE GDRLYGPGVY DMKGGAWLCL 
QGFIAAAKGG QARRPLVFLF TSDEEIGSPT TRGLIEDLGR RAEAVLVTEP GRDGGRVVTG 
RKGVGRFDIH VEGRPAHAGS RHAEGRNAIR EAARLILEIE ALTDYARGIT TTVGLVQGGT 
AENVVPQHCR FTADLRVVTE EDGRACVARL RGLQAAPDFT VTVTGGMNRP PYPRSDLTGR 
LFAQARAIAE QELGLALGEV PLTGGGSDGN FTAALGVPTL DGLGIDGDGA HTLWEYGLIS 
SIAPRRRLMQ RMLETL