Gene Mfla_2315 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Mfla_2315
Symbol
ID	4001410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Methylobacillus flagellatus KT
Kingdom	Bacteria
Replicon accession	NC_007947
Strand	+
Start bp	2470751
End bp	2471710
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	56%
IMG OID	637939241
Product	prolyl aminopeptidase
Protein accession	YP_546423
Protein GI	91776667
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID	[TIGR01249] proline iminopeptidase, Neisseria-type subfamily [TIGR01250] proline-specific peptidases, Bacillus coagulans-type subfamily

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.0000000889953
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.0000338054
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGAATCACG TATTATTTCC CGACATTCAA CCCTATCAGC AAGAGATGCT GCCCGTCTCA 
GACCTGCATG CTCTTTATTA TGAACAATCG GGCAATCCTG CCGGTCAACC GGTCATTTTC 
CTGCACGGCG GCCCAGGAAG CGGTTGCAAT CCAGGGCAAC GCCGCTATTT CGACCCGGGC 
CACTACCGCA TTATCCTAGT GGATCAGCGA GGTTGCGGAC GCAGCACGCC GCAAGGAGAA 
ATCAGGGAAA ACACGACCAG CCATTTAGTG AATGATCTGG ACACGCTGCG CAAGCACCTG 
GGCATTGATC GCTGGCTGGT GTTTGGCGGC TCATGGGGTA GTACGCTGGC GCTGAACTAC 
GCTTTGGCAT ATCCGCAACA TGTCACAGGT CTCATTCTCC GCGGCATTTT CCTGAGTCGC 
CCGAGCGAGC TGGAGTGGTT TTTGCATGAC GTGCAACACT TTTTTCCTGA GTCCTGGCAT 
CGGCTGCTTT CCTACTTGCC TGTTGCTGAA CGGCATGACC CCTTGACTGC ATTCGCGGCA 
CGCGTGTTTT CAGATGATCC TGCCGTCAAC GCACCGGCCG CCATCCACTG GAACGCATTC 
GAGTCCAGCA TCATGACCTT GCTGCCAGTA ACCGCCACCA GCGAACAGGG CCTCAACCCC 
GACATCGAGC TGGCACGAGC CCGCGTGCAA ATCCATTACA TCAAACACCA GTGCTTCCTC 
GAGGGACGCA ACCTGATCGC GGAAGCCTCC GCCCAGCTGC GACATATACC TACCGTCATC 
GTACAAGGCC GCTACGATAT GGTGTGTCCT CCATTGACAG CATATGAGCT TCACCAGGCC 
ATGCCTCATG CAGAATTCCA CATAATTCCG GATGCCGGCC ACTCAGGCAT GGAAGCCGGC 
ACCAGGAGCG CCCTGATTGC GGCTACGGAA AAATTCAAGC AAGCTCTGCA ATCAAGATAA

Protein sequence

MNHVLFPDIQ PYQQEMLPVS DLHALYYEQS GNPAGQPVIF LHGGPGSGCN PGQRRYFDPG 
HYRIILVDQR GCGRSTPQGE IRENTTSHLV NDLDTLRKHL GIDRWLVFGG SWGSTLALNY 
ALAYPQHVTG LILRGIFLSR PSELEWFLHD VQHFFPESWH RLLSYLPVAE RHDPLTAFAA 
RVFSDDPAVN APAAIHWNAF ESSIMTLLPV TATSEQGLNP DIELARARVQ IHYIKHQCFL 
EGRNLIAEAS AQLRHIPTVI VQGRYDMVCP PLTAYELHQA MPHAEFHIIP DAGHSGMEAG 
TRSALIAATE KFKQALQSR