Gene Franean1_5400 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5400
Symbol
ID	5673731
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6515199
End bp	6516977
Gene Length	1779 bp
Protein Length	592 aa
Translation table	11
GC content	69%
IMG OID	641244255
Product	methionyl aminopeptidase
Protein accession	YP_001509661
Protein GI	158317153
COG category	[J] Translation, ribosomal structure and biogenesis [V] Defense mechanisms
COG ID	[COG0024] Methionine aminopeptidase [COG3570] Streptomycin 6-kinase
TIGRFAM ID	[TIGR00500] methionine aminopeptidase, type I

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGGAT TCGAGCTGCC GCGCAACCTC TCATGTGCCG GGGCGGGGCG CCGCCGATCG 
CCCGGTCGTG CTGAAGGTCG GCTGGCGCCG CAGGGAAGCG AACACGAGAC CGATGGTCTG 
CGGACCTGGG CCGGGCGGGG AGCGGTGTTC CTCCTCGACG CCCTAGCTAG CCGACGGGGC 
GACCAGCGCG CTGCCGCTCG AACGCTGGGA GCCGGGCACG ACTCTCGCCG GGGCACGAGC 
GGAACACGAG CAGGACGCGG TCGTCGCCGG ACTGCTGCGC CGACTGTGGA TCACCCCGTC 
AGACGGGCTC CGTTCCGCCC GCTGCAAGAC ATGTGCGACG CCTGGGCAGC CGAGTTCGCC 
GAACGACTCG ACGCCGCGCC CGGCGCGATC GACCCAGGGC TGGCCCGCGC CGCCATCGAG 
TTGTTCCACA CGCTGCCGGG CAGCGTCGAG CGGGAAGTGC TGCTGTGCAC TGACCCGCAC 
GCCGGGAACA TCCTGGCGGC CCGGCGCGAG CCGTGGCTGG TCATCGACCC GAAACCCTAC 
GTCGGCGATC CCGCCTACGA CCCGGTCCAG CACATGCTCA ACCGAGACGA GGGCCTCGAC 
CTCGACCCCG ACCGGGTCAA CCGGTGGCTG TTCGCCCGCT GCGCCCAGCA ATCGATCGAC 
GTTGCAGGTC GCCTCGGCCC GGGAGCACGG CTGGACATGG GAACGGATCG CCGCCGCGAT 
GGGGAGCACC CGGGCGGTAC ACAAGAAGTA CGTAGCGAGC AGGCGGATCG GACGGAGGCA 
GCCATGAGCC GGCGTAAGGC CCACGGCTGC GACGGGCCCA CGGCCCACCT GTCTCGGCCG 
ATCAGCCCGG TGCTGACGGC GGCCCGGGAG GAGGCCGAGC AGGCCCGCCA CGGCTATGTC 
GGGCCCGAGA CTCACGAGGC CAACCGCTCG CGTGCGTTGC GACCTGATCT TGTGGGTTCG 
ACCTCGCCGT CAGGCTGGTT GATCTCGGCC CACACTTCAT CGAGGGAGAG CCCGAGGACA 
TCGGCGATCG CCGCGATGGT CGGGAAGGCA GGGGTGGCTA CGCGACCAGA CTCGATCTTC 
CGAAGGGTTT CTGGTGAGAC ACCTGCATCT AGCGCGGTTC GGTGGACCAA GACCATGATC 
GTCGAGGCTG GGGCGCAGTC CTGCTACGTC GACTATGAGC CGTCCTTCGG ACGCGGGCCG 
TTCGGCCACT ACATCTGCAC GGCCGTCAAC GACGCCGTGC TCCACGGACT GCCCTACGAC 
TACACGCTTG CCGACGGCGA CCTGCTGACG CTCGACCTCG CCGTCTCCAG AGACGGAGTC 
GCTGCAGACT CCGCCATCAG CTTCATCGTG GGCGACTCAA AGCCCCCGGA GAGCGTCGCG 
ATGATCAGCG CAACCGAACG CGCATTGAGC GCAGGGATAG CCGCTGCCGG CCCCGGAGCT 
CGCATCGGCG ACATCTCCCA TGCCATCGGC TCCGTCCTCA GCGAGGCAGG GTACCCGATC 
AACACCGAGT TCGGAGGTCA TGGCATCGGA TCAACGATGC ACCAGGACCC GCACGTTTCA 
AACACCGGAC GGCCCGGCCG TGGATACAGA CTGCGCCCTG GGCTGCTGCT CGCGCTGGAG 
CCGTGGGTCA TGGCGGACAC CGCCGAGCTC GTCACCGATG CCGACGGCTG GACCCTCCGA 
AGCGCGACAG GCTGCCGGAC AGCGCACAGT GAGCACACGA TCGCCATCAT CAACAACGGA 
GCCGAAATCC TCACCTTGCC GACGCAGGCG CACTCGTGA

Protein sequence

MSGFELPRNL SCAGAGRRRS PGRAEGRLAP QGSEHETDGL RTWAGRGAVF LLDALASRRG 
DQRAAARTLG AGHDSRRGTS GTRAGRGRRR TAAPTVDHPV RRAPFRPLQD MCDAWAAEFA 
ERLDAAPGAI DPGLARAAIE LFHTLPGSVE REVLLCTDPH AGNILAARRE PWLVIDPKPY 
VGDPAYDPVQ HMLNRDEGLD LDPDRVNRWL FARCAQQSID VAGRLGPGAR LDMGTDRRRD 
GEHPGGTQEV RSEQADRTEA AMSRRKAHGC DGPTAHLSRP ISPVLTAARE EAEQARHGYV 
GPETHEANRS RALRPDLVGS TSPSGWLISA HTSSRESPRT SAIAAMVGKA GVATRPDSIF 
RRVSGETPAS SAVRWTKTMI VEAGAQSCYV DYEPSFGRGP FGHYICTAVN DAVLHGLPYD 
YTLADGDLLT LDLAVSRDGV AADSAISFIV GDSKPPESVA MISATERALS AGIAAAGPGA 
RIGDISHAIG SVLSEAGYPI NTEFGGHGIG STMHQDPHVS NTGRPGRGYR LRPGLLLALE 
PWVMADTAEL VTDADGWTLR SATGCRTAHS EHTIAIINNG AEILTLPTQA HS