Gene M446_5398 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5398
Symbol
ID	6132448
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	5930807
End bp	5932321
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	74%
IMG OID	641645532
Product	anthranilate synthase component I
Protein accession	YP_001772148
Protein GI	170743493
COG category	[E] Amino acid transport and metabolism [H] Coenzyme transport and metabolism
COG ID	[COG0147] Anthranilate/para-aminobenzoate synthases component I
TIGRFAM ID	[TIGR00564] anthranilate synthase component I, non-proteobacterial lineages

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.124058
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGTCA CGCCCCCGCT CGACGCCGCG CAAGCCGCCC TCGCGGCCGG CACGCCCGTG 
CTCCTGCGCG CCACGCTCGT CGGCGACCTG GAGACCCCGG TCGCGGCCTT CCTCAAGCTG 
AGGGCGGGGC GCGAGGGCGC GGCCTTCCTG CTCGAATCCG TCGAGGGCGG CGCCGTGCGC 
GGGCGCTACT CGATGATCGG CCTCGACCCC GACCTCGTCT GGCGCTGCGG CGGCGGCCGG 
GCCGAGCGGG CCGACGCGCC CGCCCTCGAC CGCTTCGTCC CCGACGACCG CCCGCCGCTC 
GAGAGCCTGC GCGCCCTCAT CGCCGAGTCC GCCCTGCCGC GGGACCCCGC CCTGCCGCCG 
ATGGCCGCGG GCCTGTTCGG CTATCTCGGC TACGACATGG TGCGGGAGAT GGAGCGGCTC 
GCCCCGCCGA AGCCCGACCC GATCGGCGTG CCGGACGCCA TCCTGGTCCG CCCGACCGTG 
ATGGTGGTGT TCGACGCCGT GCGCGACGAG ATCGCGGTGG TCACCCCGGT CCGCCCCGCG 
GCGGGCGTCG CGCCCCGCGC CGCCTGCGAG GCCGCCCTCG CCCGGCTGGA GGCGGTCGCC 
GAGGCGCTCG AAGGGCCGCT CCCCGTCGAG GCCCGCGCCA ACCCGGCCGA GATCCCGGCC 
CCCTCCCCGG TCTCGAACAC CGCGCCGGAG GCGTTCCACG CCATGGTGGC GCGGGCCAAG 
GAGTACATCG CGGCCGGGGA CATCTTCCAG GTCGTGCTCT CGCAGCGCTT CGAGGCGCCC 
TTCGCGCTGC CGGCCTTCGC GCTCTACCGC GCGCTGCGCC GGGTGAACCC GGCCCCCTTC 
CTGTGCTACC TCGATTTCGG CGCCTTCCAG ATCGTCTGCT CCTCGCCCGA GATCCTGGTG 
CGGGTGCGCG ACGGCAAGGT CACGATCCGC CCGATCGCCG GCACCCGCCG CCGCGGCGCC 
ACGCCCGAGG AGGATCGGGC GCTCGCCGAG GACCTCCTGG CCGACCCCAA GGAGCGGGCC 
GAGCACCTGA TGCTCCTCGA TCTCGGCCGC AACGACGTCG GGCGGGTGGC CGAGATCGGC 
AGCGTGTCGG TCACCGAGTC GTTCTTCCTG GAATATTACA GCCAGGTGAT GCACATCGTC 
TCGAACGTGG AGGGCCGGCT CGACCCGCGC CACGACGCGC TCGGCGCCCT GGTGGCGGGT 
TTCCCGGCCG GCACCGTCTC GGGCGCCCCG AAGGTGCGGG CGATGCAGAT CATCGACGAG 
CTGGAGCGCG AGAAGCGCGG TCCCTACGCG GGCTGCATCG GCTATTTCGG CGCGGACGGG 
CAGATGGACA CCTGCATCGT CCTGCGCACG GCCGTGGTGA AGGACGGCCG CATGCACGTC 
CAGGCGGGCG CCGGGATCGT GCACGATTCC GATCCGGCCT CCGAGCAGCA GGAATGCGTC 
AACAAGGCGA AGGCCCAGTT CCGGGCCGCC GAGGAGGCCG TGCGCTTCGC CGCCCAGGCG 
CGGCGGGGGC AGTGA

Protein sequence

MLVTPPLDAA QAALAAGTPV LLRATLVGDL ETPVAAFLKL RAGREGAAFL LESVEGGAVR 
GRYSMIGLDP DLVWRCGGGR AERADAPALD RFVPDDRPPL ESLRALIAES ALPRDPALPP 
MAAGLFGYLG YDMVREMERL APPKPDPIGV PDAILVRPTV MVVFDAVRDE IAVVTPVRPA 
AGVAPRAACE AALARLEAVA EALEGPLPVE ARANPAEIPA PSPVSNTAPE AFHAMVARAK 
EYIAAGDIFQ VVLSQRFEAP FALPAFALYR ALRRVNPAPF LCYLDFGAFQ IVCSSPEILV 
RVRDGKVTIR PIAGTRRRGA TPEEDRALAE DLLADPKERA EHLMLLDLGR NDVGRVAEIG 
SVSVTESFFL EYYSQVMHIV SNVEGRLDPR HDALGALVAG FPAGTVSGAP KVRAMQIIDE 
LEREKRGPYA GCIGYFGADG QMDTCIVLRT AVVKDGRMHV QAGAGIVHDS DPASEQQECV 
NKAKAQFRAA EEAVRFAAQA RRGQ