Gene M446_5097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	M446_5097
Symbol
ID	6131656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacterium sp. 4-46
Kingdom	Bacteria
Replicon accession	NC_010511
Strand	-
Start bp	5595132
End bp	5596634
Gene Length	1503 bp
Protein Length	500 aa
Translation table	11
GC content	72%
IMG OID	641645232
Product	leucyl aminopeptidase
Protein accession	YP_001771857
Protein GI	170743202
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0260] Leucyl aminopeptidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.803796
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.160134
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGGACG GCATCAGCAT CGCGTTCGAG TCCTTCGGAT CGGCCAGGGC CGAGCAGGGC 
AGCGACCTCG TCGTGTTCGT CGGCGAGGAT CTCGCCCTCT CCGCCCGCGC CGCGGAGGTG 
GCGGGCGCCG GGGCCGGCGA CATCCTGGCG CGGGCGGCGG CCGTCGAGCG CTTCAAGGGC 
AAGGCGAACA GCGCCATCGC GGTGACCGCG CCGGCAGGGC TGCGGGCGGA CCGGCTGGTC 
GTGGTCGGGC TCGGGCCCGA GGCGGAGCGG GCCAAGCTCG ACTGGGCCGC GCTGGGCGGC 
GTCGTGGCCG GCAAGGTCGG CGGGCGGCAG GCCGTCGTGG TCCTCGACTG GGCCGGCGGG 
GCCCCGACCC CCGAGGCGGC GGCGGACTTC TCCCTCGGCC TGCGCCTGCG GGCCTACAAG 
TTCGACCGCT ACAAGAGCAA GAAGGGCGAG GGCGAGGAGG CCGGCGGGGC CAAGGTCACG 
GTGCTGACGG CCGAGCCCGG CGCGCTCAAG AAGCTCCTGC GCGCCGCCGA GGCGGTGGCG 
GACGGGGTGA TCCTCGCCCG CGAACTCGTC AACGAGCCGC CGAACGTCCT CGACCCGGAG 
GAGTTCGCCC GGCGCACCGA GCCGCTGGCG AAGCTCGGAA TCGCCGTCGA GGTCCTCGAC 
GAGAAGGCGA TGCGCCGGAT CGGCATGCGC GCGCTCCTCG CGGTGGCGCA GGGCTCGGGC 
AAGGAGGCGC GCACCGTCAT CATGCGCTGG AACGGCGCCG AGGATCCCTC GGAGCCGCCG 
GTCGCCTTCA TCGGCAAGGG CGTGTGCTTC GATTCCGGCG GCATCTCCAT CAAGGGGAGC 
GGCGGCATGG AGGACATGAA GGGCGACATG GCCGGCGCCG CCTGCGTGGT CGGGCTGATG 
CAGGCCCTCG CCGCCCGCAA GGCCAAGGTC AACGCGCTCG GCGCCATCGG CATCGTCGAG 
AACATGCCCG ACGGCAAGGC CCAGCGCCCG GGCGACATCG TCACCTCGCT CTCCGGCCAG 
ACGATCGAGA TCATCAACAC CGACGCGGAG GGCCGCCTCG TCCTGGCGGA CGTGATCACC 
TACGTCCAGC AGGAGGCCAA GCCGAAGTTC ATGATCGACC TCGCGACGCT GACCGGCGCC 
ATCCTGGTCG CGCTCGGCCA GGAATACGCC GGGATGTTCA GCACCAGCGA CGAACTCGCG 
GCGCGGCTGT CGGCGGCCGG CGAGGCGACG GGCGAGAAGG TCTGGCGCAT GCCGCTCGCT 
CCGGGCTTCG ACAAGCTGAT CGACTCGAAA TTCGCCGACA TGAAGAATAC CGGCGGGCGC 
CACGGCGGCT CGGCGACGGC GGCGCAGTTC ATCAAGCGCT TCGTGAACGA CGTGCCCTGG 
GTGCATCTCG ACATCGCCGG GGTCGGCATG AACGCGCCGT CGAGCGAGAT CAGCCGCTCC 
TGGGGGTCGG GCTGGGGCGT GCGCCTCCTC GACCGCCTGG TGCGCGACCA CTACGAGGAT 
TGA

Protein sequence

MADGISIAFE SFGSARAEQG SDLVVFVGED LALSARAAEV AGAGAGDILA RAAAVERFKG 
KANSAIAVTA PAGLRADRLV VVGLGPEAER AKLDWAALGG VVAGKVGGRQ AVVVLDWAGG 
APTPEAAADF SLGLRLRAYK FDRYKSKKGE GEEAGGAKVT VLTAEPGALK KLLRAAEAVA 
DGVILARELV NEPPNVLDPE EFARRTEPLA KLGIAVEVLD EKAMRRIGMR ALLAVAQGSG 
KEARTVIMRW NGAEDPSEPP VAFIGKGVCF DSGGISIKGS GGMEDMKGDM AGAACVVGLM 
QALAARKAKV NALGAIGIVE NMPDGKAQRP GDIVTSLSGQ TIEIINTDAE GRLVLADVIT 
YVQQEAKPKF MIDLATLTGA ILVALGQEYA GMFSTSDELA ARLSAAGEAT GEKVWRMPLA 
PGFDKLIDSK FADMKNTGGR HGGSATAAQF IKRFVNDVPW VHLDIAGVGM NAPSSEISRS 
WGSGWGVRLL DRLVRDHYED