Gene Msil_2398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_2398
Symbol
ID	7093950
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	2612146
End bp	2613519
Gene Length	1374 bp
Protein Length	457 aa
Translation table	11
GC content	66%
IMG OID	643465720
Product	para-aminobenzoate synthase, subunit I
Protein accession	YP_002362690
Protein GI	217978543
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00553] aminodeoxychorismate synthase, component I, bacterial clade

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGGCGCGA TCATGCATGT TATCGAAATT GATTTCACGG ACCCGGTCGA AACAGCCGCC 
GCGCTGAGCC GGCTGCCGTT CCTGACCTTT CTCGACAGCG CGATGCCCGA GGATGCGCTC 
GGCCGTTACA GTTTTGTCGC CGCCGATCCC TTCGACCGCA TCGAGGGCAA GGCGGGCGAC 
GCCAGCTGGG CGGCGCGCTT GAAGACGGCG CTCGCAAAGT TTCACACGCC GCTTGCGCCA 
GGCTTGCCGC CGTTTCAGGG CGGAGCCGCG GGGCTTTTTT CCTACGATCT CGGCCGCAGC 
CTCGAGCGGC TGCCGGAGCC CGCCGCCGAC GATCTCGCTT TTCCCGATCT GTCGCTCGGC 
CTTTACGACG TCGTCGTCGC GTTCGACCTG ATCCAGCGGC GCGCCTGGAT CATCTCGACC 
GGCCTGCCCG AAACAGAGCC CGCGGCGCGG CGCGAACGCG CGATCGCGCG GGCGCAAGAA 
TTCGAGGCGC ACATCGCCAA AGGCGCGCCG CTCTCCAGCG GAAAAATCTC GCTCGCCGGC 
TGGACGAGCA ATTTTACGCG CGCCTCCTAT GAACGAGCGG TCGCCGAGGT GATCGAACGC 
ATCCTCGCAG GCGATATTTT TCAGGCCAAT CTGTCGCAGC GCTTCGAGGC GCCGACGCCG 
CCGGATTTCG ATCATTTCGG CTTCTACCGG CGCCTCCGCC GGGTCAATCC CGCGCCTTTC 
GCAGCCTATC TCGATCATCC CGGCTTCAAG ATCGCCTCCG CTTCGCCCGA GCGATTCCTG 
CGCGTCGACG GCGAGTTCGT CGAGACCCGC CCGATCAAGG GCACGCGGCC GCGTTTCGCC 
GATCCGCTGG TCGATATGCT GCAGGGAAAG GCCTTGAGCG AAAGCCGCAA GGATCGCGCC 
GAGAACGTCA TGATCGTCGA TCTCCTGCGC AATGATCTGT CGAAGGTCTG CGCGCCGGGG 
TCGGTCAAGG CGCCGCAGCT CTGCGCGCTC GAATCCTATG CAACCGTGCA TCATCTCGTC 
TCGACCGTGA TCGGGCGGCT GGCCGAAGGG TTCGGGCCAG TCGATCTCCT CGCCGCCTCC 
TTTCCCGGCG GCTCGATCAC GGGGGCGCCG AAGCTGCGCG CGATGGAGAT CATCACCGAG 
CTCGAAGGCC ATGCGCGCGG CCCCTATTGC GGCGCCATCG GCTATATCGG CTTCAATGGC 
ATGATGGACC TGAATATCGT CATCCGGACC GCGAGCTTTC GCGCCGGCGT CTGCGTCGTC 
CAGGCGGGCG GGGGCATCGT CACGGCGTCG GACCCGGCCT CCGAATATGT CGAGACGCTG 
GACAAGGCGC GGCGCATCTT CGAGGCCTTC GGCGCGAGCG AATTCGCGCA ATGA

Protein sequence

MGAIMHVIEI DFTDPVETAA ALSRLPFLTF LDSAMPEDAL GRYSFVAADP FDRIEGKAGD 
ASWAARLKTA LAKFHTPLAP GLPPFQGGAA GLFSYDLGRS LERLPEPAAD DLAFPDLSLG 
LYDVVVAFDL IQRRAWIIST GLPETEPAAR RERAIARAQE FEAHIAKGAP LSSGKISLAG 
WTSNFTRASY ERAVAEVIER ILAGDIFQAN LSQRFEAPTP PDFDHFGFYR RLRRVNPAPF 
AAYLDHPGFK IASASPERFL RVDGEFVETR PIKGTRPRFA DPLVDMLQGK ALSESRKDRA 
ENVMIVDLLR NDLSKVCAPG SVKAPQLCAL ESYATVHHLV STVIGRLAEG FGPVDLLAAS 
FPGGSITGAP KLRAMEIITE LEGHARGPYC GAIGYIGFNG MMDLNIVIRT ASFRAGVCVV 
QAGGGIVTAS DPASEYVETL DKARRIFEAF GASEFAQ