Gene Mpe_A3401 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3401
Symbol
ID	4786331
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	+
Start bp	3615574
End bp	3617127
Gene Length	1554 bp
Protein Length	517 aa
Translation table	11
GC content	69%
IMG OID	640091977
Product	AMP nucleosidase
Protein accession	YP_001022589
Protein GI	124268585
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0775] Nucleoside phosphorylase
TIGRFAM ID	[TIGR01717] AMP nucleosidase

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.0546432
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGACGC CCTCTCTTCC AGACGATGGC CCCCGGCGCT ACACCGACGC GCAGGCCGCC 
CTCGACGCCG CGCGCAGCCT GTACGACGCC AGTCTGGTGC GACTGCGCGA CCACCTGCAG 
CGCTTCCTGG CCGGCGAGGA CTTCCCTCAG CGCGTGCGCG CCTGCTACCC CCGCGTGGCC 
GTCCACATCG ACACCGTGGC GCGGGCCGAC ACGCCGCTGG CCTACGGCTT CGTCGCCGGC 
CCGGGCCGCT ACGAGACCAC GCTGACGCGG CCCGATCTGT TCGGGGACTA CTACCTCGAG 
CAGTTCCGCC TGCTGCTGCG CAACCACGGT GTCGCGCTGG AGATCGGCAG CAGCACGCAG 
CCGATCCCGG TGCACTTCTC GTTCGCCGAG CACGACCACG TGGAAGGCAC GCTGACGCCC 
GAGCGGCGCA CGCTGATGCG CGACCTGTTC GATCTGCCCG ATCTCGGCGC CATGGACGAC 
GGCATCGCCA ACGGCACGCA CGAACCGACG CCAGACGCCT CCGGCGCGGC GACCCACCCA 
CTGGCGCTGT TCACCGCAGC GCGCGTCGAC TACTCGCTGC ATCGGCTGCG CCACTACACC 
GGCACCACGC CAGAGCACTT CCAGAACTTC GTGCTGTTCA CGAACTACCA GTTCTACATC 
GACGAGTTCA TCAAGCTCGG TCACGAGCTG ATGCACCTGC CGCGCGGCCA GGCCTCACTG 
TTCGAGGGCG GCAGCGGCGG TGGCCAGGAC GACGGCTATG TGGCCTTCGT CGAGCCCGGC 
AACGTGGTGA TGCGGCGCAC CGGCTGCACG CTGGAGCCGG GCGACTTCCT CGGCGCGCCG 
CCGCCGCGGC TGCCGCAGAT GCCTGCCTAC CACCTGGTGC GCCACGATCG TGCCGGCATC 
ACCATGGTGA ACATCGGCGT CGGCCCCAGC AACGCCAAGA CCATCACCGA CCACATCGCC 
GTGCTGCGCC CGCATGCCTG GATCATGCTG GGCCATTGCG CCGGCCTGCG CACCACGCAG 
CAGCTCGGCG ACTACGTGCT CGCGCACGGC TACGTGCGCG AGGACCATGT GCTCGACGAG 
GAGCTGCCGC TGTGGGTGCC GATCCCGCCG CTGGCGGAGA TCCAGGTGGC GCTGGAAGCC 
GCGGTCGCCG ATGTGACCCA GCTCGAGCGC AGCGAACTCA AGCGCGTGAT GCGGACCGGC 
ACCGTCGCCA GCACCGACAA CCGCAACTGG GAGCTGCTGC CCTTCCACCA CAGCCACAGC 
ACGCCGGAAC GCCGCTTCAG CCAGAGCCGC GCGATCGCGC TCGACATGGA GAGCGCCACC 
ATCGCCGCCA ACGGCTTTCG TTTCCGCGTG CCCTACGGCA CGCTGCTGTG CGTGAGCGAC 
AAGCCGCTGC ACGGCGAGAT CAAGCTGCCC GGCATGGCCA ATCACTTCTA CCGCGAGCGC 
GTGAACCAGC ACCTGCGCAT CGGGCTGCGG GCGATCGAAC TGCTGCGGCG CAACGGCATC 
GACCAGCTGC ACAGCCGCAA GCTGAGGAGC TTTGCGGAGG TGGCGTTCCA GTAG

Protein sequence

MTTPSLPDDG PRRYTDAQAA LDAARSLYDA SLVRLRDHLQ RFLAGEDFPQ RVRACYPRVA 
VHIDTVARAD TPLAYGFVAG PGRYETTLTR PDLFGDYYLE QFRLLLRNHG VALEIGSSTQ 
PIPVHFSFAE HDHVEGTLTP ERRTLMRDLF DLPDLGAMDD GIANGTHEPT PDASGAATHP 
LALFTAARVD YSLHRLRHYT GTTPEHFQNF VLFTNYQFYI DEFIKLGHEL MHLPRGQASL 
FEGGSGGGQD DGYVAFVEPG NVVMRRTGCT LEPGDFLGAP PPRLPQMPAY HLVRHDRAGI 
TMVNIGVGPS NAKTITDHIA VLRPHAWIML GHCAGLRTTQ QLGDYVLAHG YVREDHVLDE 
ELPLWVPIPP LAEIQVALEA AVADVTQLER SELKRVMRTG TVASTDNRNW ELLPFHHSHS 
TPERRFSQSR AIALDMESAT IAANGFRFRV PYGTLLCVSD KPLHGEIKLP GMANHFYRER 
VNQHLRIGLR AIELLRRNGI DQLHSRKLRS FAEVAFQ