Gene Franean1_1011 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1011
Symbol
ID	5669425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1193479
End bp	1194483
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	76%
IMG OID	641239940
Product	HemK family modification methylase
Protein accession	YP_001505373
Protein GI	158312865
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG2890] Methylase of polypeptide chain release factors
TIGRFAM ID	[TIGR00536] HemK family putative methylases [TIGR03534] protein-(glutamine-N5) methyltransferase, release factor-specific

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACAGGCC CGGCCGCGTC CACGACGCGG GCCGACCACG CGGACGCCAC GCTCGCCGTC 
GAGCTCGCCG CCGCGACGGC CCGGCTGGCC GCGGCCGGTG TCGCCAGCCC CCGCGGCGAC 
GCCGAGCAGC TGGCGGCGCA CGTGCTCGGG GTGTCGCGCG GCCGGCTCGC GCTGGTCACC 
CGGGTCGAAC CGGCCGCGGC CGGCGAGCTG CGCGCGCTGG TGGAACGGCG GGCGAGCCGG 
GTCCCACTGC AGCACCTGAC CGGCCTCGCC GGCTTCCGCC ACCTGGACAT CGCCGTCGGG 
CCCGGAGTGT TCATCCCCCG CCCGGAGACC GAGTGGGTGG CCGAGTGGGC GATCGCGGCC 
CTGCGATCGC CCGACGCGGT CGTGGCTGGA CGTCCAATCT GTGTTGATCT TTGTGCGGGT 
TCGGGGGCGA TCGCCCTGTC GGTGGCCGAC GAGGTGCCGA ACGCCGAGGT GCACGCGGTG 
GAGCTGGAGC CGGCGGCGCT CGGCTGGCTG CGCCGCAACG TCGAGCGCAC GGGCCTGCCG 
GTGCGGGTGC ACCAGGCCGA CGTCGGCATC CCGCGGTCGC CAACAGACGC GGGCAGGCCG 
GTCGCGCCGG TCGGCACGGT CCTGACTGAC CTCGCGGGAC GGGCCGACGT CGTCATCAGC 
AACCCGCCGT ATCTGCCCGA TCATGAACGG CCGAGGGTCG AGCCCGAGGT CGGCCGGCAC 
GACCCGCCAG CGGCCCTGTG GGGCGGGCCC GACGGCCTGG ACGGGCCGCG CGCGGTCGTG 
GCCGCCGCCG GGGGACTCTT GCGGCCAGGC GGTTTACTGG TCATGGAACA CGCGGACGGA 
CATGGCCAGA CGGTGCCCGC GCTGCTCGCC GGTGAGGGCT GGTGGGCTGG TTCGTGGTCC 
GAAATCGTGG ATCATCCCGA TCTCGCCGGG CGGGACCGGT TCGTCACCGC CCGCTGGAAC 
CCGCCGGGGC CGCGCCCGCC GCGCGGCGCC GGAGAGGACG TGTGA

Protein sequence

MTGPAASTTR ADHADATLAV ELAAATARLA AAGVASPRGD AEQLAAHVLG VSRGRLALVT 
RVEPAAAGEL RALVERRASR VPLQHLTGLA GFRHLDIAVG PGVFIPRPET EWVAEWAIAA 
LRSPDAVVAG RPICVDLCAG SGAIALSVAD EVPNAEVHAV ELEPAALGWL RRNVERTGLP 
VRVHQADVGI PRSPTDAGRP VAPVGTVLTD LAGRADVVIS NPPYLPDHER PRVEPEVGRH 
DPPAALWGGP DGLDGPRAVV AAAGGLLRPG GLLVMEHADG HGQTVPALLA GEGWWAGSWS 
EIVDHPDLAG RDRFVTARWN PPGPRPPRGA GEDV