Gene Mext_4558 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mext_4558
Symbol
ID	5835233
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium extorquens PA1
Kingdom	Bacteria
Replicon accession	NC_010172
Strand	+
Start bp	5088504
End bp	5090849
Gene Length	2346 bp
Protein Length	781 aa
Translation table	11
GC content	66%
IMG OID	641370352
Product	hemolysin-type calcium-binding region
Protein accession	YP_001641997
Protein GI	163853954
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG2931] RTX toxins and related Ca2+-binding proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.0372374
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGAAAA TCTCGGTCAC CTGGGCCAAT GAATACTCGA TGGGGTTGGC CGGGTGGCAG 
GCTGGTCTAA TCCTCGCGAC GGCACAGGCG GCTGCCGACG CGTGGGGCAA GTACATCCAA 
GTCGAGAGCA CGTTCGATAT CGCGATCGGG ATCGGCAATG TCGGCGGCGC CCTCGCCAAC 
GGCGGCCCGC AATGGACCTG GAACGGGAGA TGGTGGGAAA ACACCCCCAT CCTGAAGGCC 
CGCGAGGGGT ATGACCCGAA CGGCGGCGCG CAGGACGCCA ACCTCACGCT CGGTGAGCAT 
ACGTTCCGCG ATTGGTTCTA CGATCCGACA GGTGTTGCGG CCGCGCCCGG CAACAGGTTC 
GACGCCTTCA CCATTTTCCA GCACGAGATC GGCCACGGGC TGGGCTTCCT CGAATTCCCG 
GCCACGGTCG GAGCCAACGG GCTGCTCCTC TTCAATGGTG AGAACACGCG GACGGTTCTC 
GGCGGCCCGG TCGTGCTCGA TGGGGCCCGG GCGCATGTGT GGGGATCCGA GGATCTCATG 
GATCCCTATC TCGGCTGGGG CCAGCGGTCC TACATCTCGG ACCTCGACCT GGCGATGCTT 
CAGGACAAGG GGATGCCGAT CTCGACCGAG CGGGCCGACA AGATGTGGCT CGGCAACCGG 
GCCGACACCT TCTTCGCCTA TGGCGGTGAC GACTGGATTG ACGGCGGCTG GGGCGACGAC 
AAACTCTTCG GCGGCGTGGG CAACGACACG CTCATCGGCG GGGACGGGAA CGACGCGCTG 
GACGGGGGCG CGGGCGACGA CACGCTCATC GGCGGGAACG GGGGCGACAC GCTGGAAGGG 
GGCGAGGGCA TCGACAGGGC CGTGTTGACG GGCCGGAGCC AGGACTACGT CGCGCTCTAC 
GGCGCCGCCG GTTCACTCGC CATCAAGCAC CTCGGCTCCG GCAACATCGA CACGCTGACC 
TCGATCGAGA CGCTGAACTT CGACGACACC GTGCTCGGCA TGTCGGGCCT CCTCGCCCAT 
CTGCAGCAGC GCTTCGGGCC CGTACAGGCC GGCAAGGCGC CCTACGAGAT GGCCCTGAAC 
GCCGCCGCGG ACGAGGCTTA TCGCCCCGAC ATCCCCGAGA TCGACGGCGC GTTCAGCGTC 
ACCGCGCGGG TGCGGTTCGA CGACCTCGCC GGCGGCCATT TCCAGCGCGT TTTCGATACC 
GGCAACGGTC CGGACAGCGA CAACATCTGG CTCGGTCAGG TCGGCAACGG ACGGGACATG 
GCCTTCGAGA TCCTCGACGG CGCGGTCAAG CATAGCATCA CCGCCAGGGA CGGCATCACC 
CAGGGCGTCG AGGCGCGCTG GACCGCCGGT GTCGACGAGC GCGGATGGAT GTCGCTGTAC 
AAGGACGGTG TGCTCGTCGC CGAGGGTCAG GGGGTGGTGC CGCGCGACCT GACGCGCGCG 
AAGGATTTCG TGGGCCAATC CAACTGGGCG CAGGACGCTG CGCTGAAGGG CGGCATCTAC 
GACCTGACCT TCAAGGACAA CCTGCCCGAC ATCCACGGCG CCTTCACGGC CAGTGCGACG 
GTCCGGTTCG ATGATCTCGA TGCCGGCGCG TGGCAGCGGG TCTACGACAT CGGCAACGGT 
GCCGGCGCCG AGAACGTCTT CCTCGGCCAG ATCGGCACCT CCAACGACAT GCAGTTCATG 
ATCCTGAACG GCACCAGCTC CGCCAACATC GTGGCCAAGG GCGCGATCGT CGAAGGCCAG 
GAAGCGACCT GGACGACCAG CGTCAACGAG ACCGGTTGGA TGCGCCTGTT CAAGGACGGC 
GTGCTCCTGG CCGAGGGACA GGGCATCGTC CCGAAGGACG TCGTGCGGAC CAACGAGTTC 
GTCGGCAAGT CCAACTGGAC GTGGGACAAA CCGCTCGTCG GCGAGGTGAG CGACCTGACC 
ATCACGCCGT TCAAGGGCAT CCCGGAGATC GACGGCGCCT TCAAGATGTT CGCCGAAGTC 
CGCTTCGACG ATCTCGCCCA CGGAAACTAT CAGCGCGTGT TCGATACCGG TAACGGGCGG 
GACAGCAACA ACATCTGGCT CGGTCAGGTC GGCAACGGTG ACGACATGGC CTTCGAGATC 
CTCACGGGCG CCACGAAACA CCGGATCACG GCGGCGGACA CCATCGTCGA GGGTGAGATG 
GCGAAGTGGC AGGCCAGCGT GGACGAGGCC GGCTACATGC GCCTGATCAA GAACGACAAG 
CTCGTGGCCG AGGGCCAGGG CGCGGTTCCG CTGGATGTGC TGCGCACCAG CGATCTGGTC 
GGCCAGTCCA ACTGGTCGTG GGATACCGCG CTGGCCGGAC AGGTGAAGGA TCTGATCTTC 
GCCTGA

Protein sequence

MAKISVTWAN EYSMGLAGWQ AGLILATAQA AADAWGKYIQ VESTFDIAIG IGNVGGALAN 
GGPQWTWNGR WWENTPILKA REGYDPNGGA QDANLTLGEH TFRDWFYDPT GVAAAPGNRF 
DAFTIFQHEI GHGLGFLEFP ATVGANGLLL FNGENTRTVL GGPVVLDGAR AHVWGSEDLM 
DPYLGWGQRS YISDLDLAML QDKGMPISTE RADKMWLGNR ADTFFAYGGD DWIDGGWGDD 
KLFGGVGNDT LIGGDGNDAL DGGAGDDTLI GGNGGDTLEG GEGIDRAVLT GRSQDYVALY 
GAAGSLAIKH LGSGNIDTLT SIETLNFDDT VLGMSGLLAH LQQRFGPVQA GKAPYEMALN 
AAADEAYRPD IPEIDGAFSV TARVRFDDLA GGHFQRVFDT GNGPDSDNIW LGQVGNGRDM 
AFEILDGAVK HSITARDGIT QGVEARWTAG VDERGWMSLY KDGVLVAEGQ GVVPRDLTRA 
KDFVGQSNWA QDAALKGGIY DLTFKDNLPD IHGAFTASAT VRFDDLDAGA WQRVYDIGNG 
AGAENVFLGQ IGTSNDMQFM ILNGTSSANI VAKGAIVEGQ EATWTTSVNE TGWMRLFKDG 
VLLAEGQGIV PKDVVRTNEF VGKSNWTWDK PLVGEVSDLT ITPFKGIPEI DGAFKMFAEV 
RFDDLAHGNY QRVFDTGNGR DSNNIWLGQV GNGDDMAFEI LTGATKHRIT AADTIVEGEM 
AKWQASVDEA GYMRLIKNDK LVAEGQGAVP LDVLRTSDLV GQSNWSWDTA LAGQVKDLIF 
A