Gene Mfla_2471 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_2471
Symbol
ID	4001567
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	-
Start bp	2650052
End bp	2651536
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	58%
IMG OID	637939397
Product	anthranilate synthase, component I
Protein accession	YP_546577
Protein GI	91776821
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCAAA CCATCAGTCA ACACGAATTT GATGCCCTGG CCAGCCAGGG CTATAACCGC 
ATTCCTCTGG TCGTCGAGAC ATTTGCCGAT CTCGATACCC CGCTCTCGCT CTACCTGAAG 
CTGGCTAACC AGCCTTATTC CTACCTGCTC GAATCGGTGC AGGGCGGGGA GCGCTTTGGT 
CGTTATTCCA TCATAGGTCT GCCTGCCCGC GTCCGTATAG AGGTGCAAGG CCAGACGGTC 
AGGGTGCTCG ACGGCGATCA GGTGCTGGAA CAGACGAATC ATGTAAATCC GCTGGACTTC 
ATCCAGGCCT ACCAGGCCAG GTTTCGCATT CCACCGTATC AGGGCTTGCC ACGCTTCACC 
GGAGGCTTGG CCGGTTATTT CGGCTATGAC ACCATTCGCT ATATCGAGCG CCGGTTGGCG 
GGTAATGCCA AACAGGATGC GCTCGGCGTG CCTGATGTTC TGCTCATGGT GTCGGAAGAA 
ATTGCCGTGG TGGACAATCT CTCAGGCAAG CTGTATTTCA TCGTGTATGC CGATCCGGCA 
AGTGGAAATG CCTATACCCA GGGCATCCAG CGCCTGAACG CATTGGTACA ACGCCTGCGC 
CAGCCGGTGG ATATTCCGTA TGCCGTCGCC ATGCCGGTCA CCGAGGCGCA GTCGGAGTTT 
GGTGAGGAGA GCTTCAAGGA AGCAGTGGCC AAGTCCAAGC AGTACATCTT CGATGGTGAC 
ATCATGCAGG TGGTGCTGTC GCAACGCATG GCCAAGCCTT TCACAGCGCC GCCGTTGTCG 
CTCTACCGTG CCTTGCGCAG CCTCAACCCC TCGCCCTACA TGTTTTATTA CGACATGGGG 
GACCATCATG TCGTTGGTGC TTCCCCGGAA ATTCTCGTGC GCCTGGAGGA TGAGACGGTA 
ACCTCACGGC CGATTGCTGG CACGCGGCCC CGCGGCAAGA CCCGAGAGGA AGATATCGCC 
TTGGCGGAAG AGCTGCTGGC CGACCCCAAG GAAATTGCCG AGCACGTGCA GTTGATGGAC 
CTGGGGCGCA ACGATGTCGG CCGTGTTGCG CAGGTAGGCA GTGTGGCGGT GACGGAGAAG 
ATGGTGATCG AGCGTTATTC GCACGTCATG CATATCGTCT CTAATGTCGA AGGCAGGCTC 
AAGTCCGGTT TGCACGCGAT CGATGTGCTC AAGGCGACTT TCCCTGCCGG CACCCTGAGC 
GGTGCACCCA AGGTGCGCGC GATGGAAATC ATTGATGAGC TGGAGCCAAG CAAGCGAGGC 
ATCTACGGCG GCGCTGTCGG TTATCTCGGC TTCAATGGCG ACATGGATCT CGCAATTGCC 
ATCCGCACTG GCGTGATCAA GGATGGTATG TTGTATTCCC AGGCCGGGGC CGGCATCGTC 
GCCGACTCAA TACCGGAAAA CGAGTGGATA GAAACCCAGA ACAAGGCGCG CGCGGTATTG 
CGCGCCGCGG AGATCGTACA GGCAGGACTC GATAACAAGG AGTAG

Protein sequence

MLQTISQHEF DALASQGYNR IPLVVETFAD LDTPLSLYLK LANQPYSYLL ESVQGGERFG 
RYSIIGLPAR VRIEVQGQTV RVLDGDQVLE QTNHVNPLDF IQAYQARFRI PPYQGLPRFT 
GGLAGYFGYD TIRYIERRLA GNAKQDALGV PDVLLMVSEE IAVVDNLSGK LYFIVYADPA 
SGNAYTQGIQ RLNALVQRLR QPVDIPYAVA MPVTEAQSEF GEESFKEAVA KSKQYIFDGD 
IMQVVLSQRM AKPFTAPPLS LYRALRSLNP SPYMFYYDMG DHHVVGASPE ILVRLEDETV 
TSRPIAGTRP RGKTREEDIA LAEELLADPK EIAEHVQLMD LGRNDVGRVA QVGSVAVTEK 
MVIERYSHVM HIVSNVEGRL KSGLHAIDVL KATFPAGTLS GAPKVRAMEI IDELEPSKRG 
IYGGAVGYLG FNGDMDLAIA IRTGVIKDGM LYSQAGAGIV ADSIPENEWI ETQNKARAVL 
RAAEIVQAGL DNKE