Gene Mpe_A3463 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mpe_A3463
Symbol
ID	4786281
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylibium petroleiphilum PM1
Kingdom	Bacteria
Replicon accession	NC_008825
Strand	-
Start bp	3672235
End bp	3673710
Gene Length	1476 bp
Protein Length	491 aa
Translation table	11
GC content	69%
IMG OID	640092043
Product	anthranilate synthase component I
Protein accession	YP_001022651
Protein GI	124268647
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.0715652
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATCACCG AACTCGAATT CAAGAGCCTG GCCGAGCAGG GCTACAACCG CATTCCGTTG 
ATCGGCGAGG CGCTCGCCGA CCTGGAAACC CCGCTGTCGC TGTACCTGAA GCTGGCCGGA 
GGCCGGCCGC TGAGCTTCCT GCTCGAGTCG GTGGTCGGGG GCGAGCGCTT CGGGCGCTAC 
TCCTTCATCG GCCTGCCGGC GCGCACGTTG CTGCGCGCCA CCGGCGAGCA CTGCGAGGTG 
GTGACCGACG GCCAGGTGAC CGAGACGCAC CACGGCAACC CGCTGGACTT CATCGAGGCC 
TACCAGAGCC GCTTCAAGGT GGCGCTGCGG CCCGGCCTGC CGCGCTTCTG CGGCGGCCTC 
GCCGGCTACT TCGGCTACGA GGCGGTGCGC TTCATGGAGC CCAAGCTGGC CAGCGCGCGG 
CGCGAGGGCG GCATCGGCAC ACCCGACATC CAGCTGCTGC AGACCGAGGA GCTGGCGGTC 
ATCGACAACC TGTCGGGGCG GCTCTACCTG ATCGTCTACG CCGATCCGTC GCAGCCCGAG 
GCCTACTTCC GCGGCAAGAA GCGGCTGGCC GAGCTGAATG ACCGACTGCG CTACAGCGTG 
ACCGCGCCGG CCGTGAAGCG CGGCCCCTCG CACGCGGTGG AGCGCGAGTT CGCGCGCGCC 
GACTACGAGG CCGCGGTGCT GCGCTGCAAG GAGTACATCG CAGCCGGCGA CTGCATGCAG 
ATCGTGTTCG GCCAGCGCCT GCGCAAGCGC TACACCGAGA GTCCGCTGTC GCTGTACCGT 
GCGCTGCGCT CGATGAACCC GTCGCCGTAC ATGTACTTCT ATGACATGGG CGACTTCCAG 
ATCGTCGGCG CCTCGCCCGA GATCCTGGTG CGCCACGAGC AGGTGCCCGA GGGCCAGAAG 
GTCACGATCC GCCCGCTAGC TGGCACCCGA CCGCGTGGCG CGACGCCCGA GCGCGACCTC 
GCGGTCGAGG CCGAGCTGCT GGCTGACCCG AAGGAGCGCG CCGAGCACCT GATGCTGATC 
GACCTGGCGC GCAACGACAT CGGCCGCATC GCGCAGACCG GCTCGGTCAA GGTGACCGAA 
GCCTTCGCGG TCGAGCGCTA CTCGCACGTG ATGCACATCG TCAGCAACGT CGAGGGCCTG 
CTGAAGCCGG GCACGACCAA CATGGACGTG CTGCGCGCGA CCTTCCCGGC CGGCACGTTG 
AGCGGCGCGC CGAAGATCCG CGCGATGGAG ATCATCGACG AGCTCGAACC GGTGCAGCGC 
GGCATCTACG GCGGCGCCTG CGGCTACCTG AGCTTCGCTG GCGACATGGA CGTCGCGATC 
GCGATCCGCA CCGGCATCGT CAAGGACAAC GTGCTCTACG TGCAGGCGGC GGCCGGCATC 
GTGGCCGACT CGGTGCCCGA GCTGGAGTGG AAGGAAACCG AGCACAAGGC GCGCGCCGTA 
CTGCGCGCGG CGGAGCTGGT CGAGGAGGGC TTCTGA

Protein sequence

MITELEFKSL AEQGYNRIPL IGEALADLET PLSLYLKLAG GRPLSFLLES VVGGERFGRY 
SFIGLPARTL LRATGEHCEV VTDGQVTETH HGNPLDFIEA YQSRFKVALR PGLPRFCGGL 
AGYFGYEAVR FMEPKLASAR REGGIGTPDI QLLQTEELAV IDNLSGRLYL IVYADPSQPE 
AYFRGKKRLA ELNDRLRYSV TAPAVKRGPS HAVEREFARA DYEAAVLRCK EYIAAGDCMQ 
IVFGQRLRKR YTESPLSLYR ALRSMNPSPY MYFYDMGDFQ IVGASPEILV RHEQVPEGQK 
VTIRPLAGTR PRGATPERDL AVEAELLADP KERAEHLMLI DLARNDIGRI AQTGSVKVTE 
AFAVERYSHV MHIVSNVEGL LKPGTTNMDV LRATFPAGTL SGAPKIRAME IIDELEPVQR 
GIYGGACGYL SFAGDMDVAI AIRTGIVKDN VLYVQAAAGI VADSVPELEW KETEHKARAV 
LRAAELVEEG F