Gene M446_5142 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5142
Symbol
ID	6131708
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	5651448
End bp	5653043
Gene Length	1596 bp
Protein Length	531 aa
Translation table	11
GC content	76%
IMG OID	641645277
Product	4-phytase
Protein accession	YP_001771902
Protein GI	170743247
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.303319
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0209906
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCCCAG CCTGCCCCGC CCTCGTCGGC CTCGTCCTCG CCGCCCTCGC GGCCGCGGCG 
GGCGTTGCCG GGCGGGCGCG GGCCGCGGAG GTGCCCGACG ACGTGCTGGT GGTCGGGCAG 
TCGGCCGAGC CCGCCTCCCT CGATCCCGGC GTCACCACCG CGACGAACGA CGCGCGCATC 
CTCGTCAACC TCTACGACGG GCTGGTGCGC ACCAAGCCCG GCAGCCTGGA GATCGAGCCC 
GCGCTCGCCG AGAGCTGGAG CCTCTCGGAG GATGGCCGCC GCTACACGTT CCGGCTGCGC 
GCGGGCGTGC GCTTCCACGA CGGCAGCCCG CTCGACGCGC GGGCCGTGAC CTTCACCTTC 
GGGCGGCTCC TCGAACCCGC CCACCCGGCG GCGGCGACCG GCCCCTTCCC GCTCGCCTTC 
CTGTTCCGCG CGGTGGAGCG GGTCGAGGCC CTCGATCCCC GGACGGTGCG CTTCACCCTG 
CGCCAGCCCT TCGCGCCCTT CCTGGCCAAC CTCGCGACGC CGACCGGGCT CATCGTCCCG 
CCCGGGGCCG TGATGGCGCG GGGGAAGGAT TTCGGGCGCA ACCCGGTCGG GACCGGGCCG 
TTCCGCTTCG AGGCGTGGCA GAGCAGCCGC AAGGTGACGC TCGCCCGCAA CCCGGGTTAC 
TGGGGCGGGC CGGCCGCCTC GCGGCTCGTG ATCTTCCGCC CGCTCGCCGA CCCGAACACC 
CGCGCGACCG AGATGCTGGC GGGCGACGTC GACGTCGTGG CGGAGATGCC GCCCGACGCC 
CTCGCGCTGT TCCGGCACCG GGCCGGGTTC TCGGTCGCGG AGGCGGTCGG GCCCCACCTC 
TGGTACCTGA TCCTGAATAT GCGGGCCGGG CCGCTGCGGG ACCGCCGGGT GCGCGAGGCG 
GTGAACTGGG CCATCGACCG GCGGGCGCTG GCCGAGCACG TGCTGCAGGG CACGGCCGTG 
CCGGCGCGCG GGATCATCGC CCCGGCCTTC GCGGGCACCT ACGATCCCGA CCTCGCGGGC 
TACGGCCACG ATCCCGCCCG CGCCCGCGCC CTGCTGCGCG AGGCCGGGGC GGAGGGGGCG 
CGGCTCACGC TCCTCGTCGC CGAGGGCGGG TCGGGGATGC TCGACCCGGT GGCGATGGGC 
ACGGCGATCC AAGCCGACCT CGCCCGCGTG GGCCTCGACG TCCGGCTCGT CACCTACGAG 
TGGAACGCCT ACCTGGCCCG GGTCAATCGC GGCCTCGGCG AGGACGCCGA CATGGCCGAC 
ATGGCCGAGA TGGCCTGGAT GACCAACGAT CCCGACCAAT TGCCCTCGCT CGCCCTCGCG 
AGCGACGCGC TGCCGGGGAA GGGCGGCTTC AACGCGGGCG GCTACGCCAA CCCGGATCTC 
GACCGGCTCC TCGACGAGGC CCGCCGCAGC ACCGACCCGG CGCGCCGCCG GGATCTCGAC 
CGGGCCGCGG AGCGCCTCGT CGTGGCGGAC GCGCCCTTCG CGGTCGTGGT CCACGGCAAG 
CAGGCGGCGG TGGTGCGGGA GGCCGTGCGC GGCTTCGCCC TCGACCCGAC CTTCACGGCC 
CGCCTCGCCG GCGTGCGCAA GCGCGAGGGG CCGTGA

Protein sequence

MSPACPALVG LVLAALAAAA GVAGRARAAE VPDDVLVVGQ SAEPASLDPG VTTATNDARI 
LVNLYDGLVR TKPGSLEIEP ALAESWSLSE DGRRYTFRLR AGVRFHDGSP LDARAVTFTF 
GRLLEPAHPA AATGPFPLAF LFRAVERVEA LDPRTVRFTL RQPFAPFLAN LATPTGLIVP 
PGAVMARGKD FGRNPVGTGP FRFEAWQSSR KVTLARNPGY WGGPAASRLV IFRPLADPNT 
RATEMLAGDV DVVAEMPPDA LALFRHRAGF SVAEAVGPHL WYLILNMRAG PLRDRRVREA 
VNWAIDRRAL AEHVLQGTAV PARGIIAPAF AGTYDPDLAG YGHDPARARA LLREAGAEGA 
RLTLLVAEGG SGMLDPVAMG TAIQADLARV GLDVRLVTYE WNAYLARVNR GLGEDADMAD 
MAEMAWMTND PDQLPSLALA SDALPGKGGF NAGGYANPDL DRLLDEARRS TDPARRRDLD 
RAAERLVVAD APFAVVVHGK QAAVVREAVR GFALDPTFTA RLAGVRKREG P