Gene Mext_3657 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_3657
Symbol
ID	5832299
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	4039840
End bp	4041180
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	69%
IMG OID	641369450
Product	phosphate-selective porin O and P
Protein accession	YP_001641106
Protein GI	163853063
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3746] Phosphate-selective porin
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.203076
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTGCC CCGCCTTGGA TGTTCCGATG CCGCCCCGCC GCGCCCTCCG CTGCCTTGCT 
TCCGCCGCCG CGCCAAGCCT CGCCCTGGCC GCGGTCCCGA TCCTCGCCTC GATCCTGACC 
TGCTCCGCCG GCCCCGCCGC AGCCGGCGAG ACGTCCCGCA AGAAGGCCGA GGCCAAGCCG 
CCCGTGACCC TCGACGAGAA GGGCATCACG GTCCGGCTCG ACGACGGCAG CACATTCCGC 
ATCGGCGGCC GGCTCCAGGG GGATTTCGGC ACGGGCCATG TGCAGCAGCG CGGCTTCGGC 
ACGGTGTTCG AGGAGCCGGC GGCGATCCGC CGGGCCTGGA TCGAGACCTA TTACAGCCTC 
AAGGACTTCG AATTCGCCTT CCAGTACGAC TTCAACGAGC GGCGCGTGCC GGTGAGCGAC 
GCCATCGTCG CCTACAAGGG TTTTCAGGAC GTCATCATCA CCCAGGGCAA CTTCAAGGAG 
CCGTTCAGCC TCGATCAGCT CATCAGCGAC AATGTCAGCC AGTTCACCGA GCGCTCCCAG 
GCCGACGCCT TCGCCCCAGC GCGTAACTTC GGCTCCGCCA TCGGTACCCA CGGCGCCAAC 
TGGACCGCGG TGACGGGCGT GTTCGGCGGC AACATCAACA CCGGCCTGCA GAACAACGGG 
ATCGCCTCGA CCACCCGCGT GACCTACACG CCGTGGCTCT CCGAGAACAA GAACGACGTG 
CTGCATCTCG GCCTCGCCGG CAGCTACCGG ACGCTCGGCG GCGACGACAG CAGCCTCAGC 
CTGTCGAGCC GCTCGGAGGC GTTCCTGTTC GCCCGCCCGC TCGTCAACAC CCGGACAATC 
CGCGACGCCA CGGCGATCGG CCGGCTCGGC GTCGAGGCGG CGTGGCAGCA GGGCCCGTTC 
CGGCTCCAGG GCGAGTACAT CCTCACCGAT ATCGAGCGCC GCGACGGACG CCCGCCGCTG 
CTGTTCCAGG GCGGCTACAT CCAGGCCTCG GTGGTGCTCA ACGACAAGGG CCGGCCCTAC 
CGGGTCGTGC CGACCTATGG CAGCGAGTAC GGCGTCTTCA CCGGCGTCAC CGTCGAGGAA 
CGCCAGCGGG TCAGCCGCGG CGGCACGGGC CTGTTCGAAC TCGGGGTCCG TTACAGCGCC 
ATCGACCTCG AATCCCGTGA GGTGCGCGGC GGCGTCGAGC ACGACTTTAC CGCGGGCGCG 
AATTGGTATC CCGAGCCCAA CATCCGCTTC GTCTTCGACT ACATCCGCTC GCATGCCGAG 
CCGTCAGCGG AATCGCTGAA CTTCGGCCGC CACACCGTCG ACGCCGACCT CTTCATCGGC 
CGGGCGCAGC TCACCTGGTA G

Protein sequence

MTCPALDVPM PPRRALRCLA SAAAPSLALA AVPILASILT CSAGPAAAGE TSRKKAEAKP 
PVTLDEKGIT VRLDDGSTFR IGGRLQGDFG TGHVQQRGFG TVFEEPAAIR RAWIETYYSL 
KDFEFAFQYD FNERRVPVSD AIVAYKGFQD VIITQGNFKE PFSLDQLISD NVSQFTERSQ 
ADAFAPARNF GSAIGTHGAN WTAVTGVFGG NINTGLQNNG IASTTRVTYT PWLSENKNDV 
LHLGLAGSYR TLGGDDSSLS LSSRSEAFLF ARPLVNTRTI RDATAIGRLG VEAAWQQGPF 
RLQGEYILTD IERRDGRPPL LFQGGYIQAS VVLNDKGRPY RVVPTYGSEY GVFTGVTVEE 
RQRVSRGGTG LFELGVRYSA IDLESREVRG GVEHDFTAGA NWYPEPNIRF VFDYIRSHAE 
PSAESLNFGR HTVDADLFIG RAQLTW