Gene Mpe_A3809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3809
Symbol
ID	4785920
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	4027008
End bp	4028030
Gene Length	1023 bp
Protein Length	340 aa
Translation table	11
GC content	71%
IMG OID	640092392
Product	arabinose-5-phosphate isomerase
Protein accession	YP_001022997
Protein GI	124268993
COG category	[M] Cell wall/membrane/envelope biogenesis [T] Signal transduction mechanisms
COG ID	[COG0794] Predicted sugar phosphate isomerase involved in capsule formation [COG2905] Predicted signal-transduction protein containing cAMP-binding and CBS domains
TIGRFAM ID	[TIGR00393] KpsF/GutQ family protein

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.127508
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGCCAC CCTCCGCTTC TTCTTCCTCT TCCTCCTCGT ATTCCCCGCA GCGCAGCGTC 
GAGATGGGCG CGCAGGCGCT GGCGGTCGAG GCGCAGGCGC TGGGCGCACT GCAGCAGCGC 
ATCGTCGGGC CGATGGCCGA CGCGTTCGCA CGGGCGGTCG CGGCCATGCT GGTATGCCGC 
GGCCGCGTGG TCGTGATGGG CATGGGCAAG AGCGGCCACG TGGGCCGCAA GATCGCCGCG 
ACACTGGCCT CGACCGGCAC GCCGGCGATG TTCGTGCACC CTGCCGAGGC GAGTCACGGC 
GACCTGGGCA TGGTGACCCC GTCCGACATC GTGCTGGCGA TCTCGAACTC CGGCGAGAGC 
GACGAGCTGG CGGCCATCCT GCCGGTGCTC AAGCGGCTGG GCGTCATGCT GATCGCGATC 
ACCGGCCGGG CCGACTCCAA CCTCGCGCGC CATGCCGAGC TGGTGCTCGA CAGCGCGGTC 
GCACAGGAGG CCTGTCCGCT GAACCTGGCA CCGACGGCCA GCACCACCGC GCAGATGGCG 
CTGGGTGACG CCCTCGCCGT CGCGCTGCTC GATGCCCGCG GCTTCAAGGA GGAAGACTTC 
GCGCGCTCGC ATCCTGGCGG TTCGCTGGGG CGCAAGCTGC TGACGCACGT GCGCGACGTG 
ATGCGCGGCG GCGACGCGGT GCCGAGCGTG GGGCCGGCAA CGGCGTTCAC CGACCTGATG 
CGCGAGATGA GCGCGAAGGG CCTGGGCGCC ACAGCGATCG TCGATGACGC CGGCCGCGTG 
CAGGGCATCT TCACCGACGG CGACCTGCGC CGCCTGATCG AGAAGGGCGG CGACCTGCGC 
GCGCTGACGG CCGCGGAGGT GATGCATCCG GCGCCGCGCA CGGTGCGCGA CGACGCACTG 
GCCGTCGATG CCGCCGACCT GATGGAGACG CACCGCATCA CCAGTGTGCT CGTGGTCGAT 
GCCCAGGGCG TGCTGGTCGG TGCGCTGAAC ATCAACGATC TGCTGCGCGC GAAGGTCATC 
TGA

Protein sequence

MTPPSASSSS SSSYSPQRSV EMGAQALAVE AQALGALQQR IVGPMADAFA RAVAAMLVCR 
GRVVVMGMGK SGHVGRKIAA TLASTGTPAM FVHPAEASHG DLGMVTPSDI VLAISNSGES 
DELAAILPVL KRLGVMLIAI TGRADSNLAR HAELVLDSAV AQEACPLNLA PTASTTAQMA 
LGDALAVALL DARGFKEEDF ARSHPGGSLG RKLLTHVRDV MRGGDAVPSV GPATAFTDLM 
REMSAKGLGA TAIVDDAGRV QGIFTDGDLR RLIEKGGDLR ALTAAEVMHP APRTVRDDAL 
AVDAADLMET HRITSVLVVD AQGVLVGALN INDLLRAKVI