Gene Msil_0506 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Msil_0506
Symbol
ID	7091239
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylocella silvestris BL2
Kingdom	Bacteria
Replicon accession	NC_011666
Strand	-
Start bp	562053
End bp	563570
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	65%
IMG OID	643463836
Product	anthranilate synthase component I
Protein accession	YP_002360840
Protein GI	217976693
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	40
Fosmid unclonability p-value	0.640019
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATTCTC CAGCTCATGC GGATTACGCC GCAGCCTATG CGGCCGGCCG CCCGTGCCTG 
GTTTCGGCGC GCCTGATCGC CGATCTCGAA ACGCCGGTTT CCGCCTTTCT GAAGCTGTCG 
GCGGGGCGCG TCGGACGCAT CTTCCTTCTG GAATCCGTCG AGGGCGGAGC CGCGCGGGGC 
CGATACTCCA TGATCGGCCT CGACCCCGAT ATCGTCTGGC GCGCTTTCGG CGACAGAGCC 
GAAATCAACC GGTCCGCCTT GAGCGATCCC GACAGCTTTT CGCCTTGCGC GGAGCCCCCG 
CTCGACTCGC TGCGCGCGCT GATCGCGGAA TCCCGCATCG ACGCCAGCGA GGAGCTGCCG 
CCGATGGCGG CCGGCGTCTT TGGCTATCTC GGCTATGATA TGGCGCGGCA GATGGAGCAG 
CTTGGCGCGC CAAAGCCAGA TCCCCTCGGC GCGCCAGACG CGATGATGAT GCGCCCGACC 
GTGATGGTCG TGTTCGACTC CGTCCGCGAG GAGATTTTCG TGGTGACGCC GCTGCGCCCT 
GCCCCCGGCG TTTCCTTCCT TGCCGCCTAT GACCATGCCC GCGAACGCAT CGACGCGGTG 
AGCGTGACGC TGGAGGGGCC GCTTCAACAT GACTGGGTCG CGGCCGATCC CGCGCTTTCG 
ACTGTCGCGC CGACCTCAAA TACCAGCGAG GCGCGGTTTC ACGAGATGGT CGCGCGCGCC 
AAGGATTACG TCCGCGCCGG CGATATTTTT CAGGTCGTGC TGTCGCAACG CTTTTCGGCG 
CCTTTTGGGC TGCATCCTTT CGCGCTCTAC CGCGCCCTGC GCCGGGTCAA TCCCTCGCCC 
TTCCTCTGCT ACCTTGATTT CGGACCGTTC CAGATCGTCT GCTCGAGCCC TGAAATTCTG 
GTCCGGCTGC GCGACGGCAA GGTCACGATC CGGCCCATCG CCGGCACCCG CTGGCGCGGC 
AAGACCAAGG CCGAGGACGA TGCGTTGGCG CAGGACCTTC TTGGCGACGA GAAAGAATGC 
GCCGAGCATC TGATGCTGCT CGATCTTGGC CGCAACGACG TCGGCCGCGT CGCCGAGATC 
GGCTCCGTCA AGGTGACGGA GCAATTCGCC ATCGAACGCT ACAGCCATGT CATGCATATC 
GTCTCGAACG TGGAGGGCCG TCTCTCGAAG ACGCATGACG CAATCGACGC CCTCAGCGCA 
GGCTTTCCCG CGGGCACCGT TTCGGGGGCG CCGAAACTGC GCGCGATGGA GATCATCGAC 
GAGCTCGAGA CGGACAAGCG TGGCGTTTAC GGCGGCTGCA TCGGCTATTT CGGCGCTTCG 
GGCGAGATGG ACACCTGCAT CATCTTGCGC ACCGCCATGG TCAAGGATGG CGTCATGCAT 
GTCCAGTCGG GCGCTGGCAT CGTCTATGAC AGCGATCCCG CCTATGAGCA GCGCGAATGC 
GTCAACAAGG CGCAAGCTCT GTTCCGCGCC GCCGAGGAGG CCGTGCGTTT CGCGTCGCGG 
GCCAAGCGCG GGCAATAG

Protein sequence

MDSPAHADYA AAYAAGRPCL VSARLIADLE TPVSAFLKLS AGRVGRIFLL ESVEGGAARG 
RYSMIGLDPD IVWRAFGDRA EINRSALSDP DSFSPCAEPP LDSLRALIAE SRIDASEELP 
PMAAGVFGYL GYDMARQMEQ LGAPKPDPLG APDAMMMRPT VMVVFDSVRE EIFVVTPLRP 
APGVSFLAAY DHARERIDAV SVTLEGPLQH DWVAADPALS TVAPTSNTSE ARFHEMVARA 
KDYVRAGDIF QVVLSQRFSA PFGLHPFALY RALRRVNPSP FLCYLDFGPF QIVCSSPEIL 
VRLRDGKVTI RPIAGTRWRG KTKAEDDALA QDLLGDEKEC AEHLMLLDLG RNDVGRVAEI 
GSVKVTEQFA IERYSHVMHI VSNVEGRLSK THDAIDALSA GFPAGTVSGA PKLRAMEIID 
ELETDKRGVY GGCIGYFGAS GEMDTCIILR TAMVKDGVMH VQSGAGIVYD SDPAYEQREC 
VNKAQALFRA AEEAVRFASR AKRGQ