Gene Franean1_3515 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3515
Symbol
ID	5671885
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4176055
End bp	4177173
Gene Length	1119 bp
Protein Length	372 aa
Translation table	11
GC content	73%
IMG OID	641242402
Product	methyltransferase type 11
Protein accession	YP_001507822
Protein GI	158315314
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2518] Protein-L-isoaspartate carboxylmethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCAACT GGCGGGCCCA CGCCCGCACC CTGGCGGACC AGGTCACCCA TCCCGGCTCC 
CGCTGGCACC GGGCGCTCGT CGACACACCG CGACACCGGT TCGTGCCCGC CTGGTGGGAC 
GACAGCGACG GGTCGTGGGC GCTGCGCCGT GGTCCGCTCG CCGGCGCCTA CGCGGACCGG 
TCGCTGGTCA CCCGGGTCGG CCCGCTGCAC GCCGACCTCG CCGAGGACGA CGACCACCCG 
CAGGGCCGAC CGACCTCGTC GTCGACCGCG CCGAGCCTGG CCCTGACCAT GTACCGGTAC 
GGGCATCTGT CCAGGGGCCT GGACATCGCC GACGTCGGCA CCGGGTCGGG GTACGGAGCG 
GCCCTGCTCG CCCGCCGCTA CGGGTCCCAG CACGTCACCA CTCTGGACGT CGATCCGTAT 
CTGGTGTCCG CCGCCGCCGG CCGGCTGGCC GCCCTCGACC TGCACCCGAC GGCGCTAACC 
GTGGACGCCA CCGGCCCGCT GCCCGGCACC TACGACCGGA TCGTCTCCAT GGTTTCGGTT 
CCCAGCATCC CGCCGAGCTG GCTGGCCGCG CTGCGTCCCG GCGGCCGGCT GGTCACCACC 
ATCCGCGGCA CGTGGATCAT CCTCACCGCG ACGAGAACCC GCGACGGGGT GTTCGGGCAG 
GTGGAGCGGG ACTGGGCCGG GTTCATGGAT GTTCGCAGCG GCCCCGACTA CCCTCCGGTC 
GCGGCCGTCG ACTTCGACCG GATCGCCGAA CAGGTGGGCG TCGGCCGGTA CCCGGTGCTG 
CACGTCGCCG ACGCCTGGGA GTTGTCCACC ATGCTCCACC TGGCCGTCCC GGGTATCGAG 
CACCGCTATC GCCGCGAGGC CGACGGCCGG CACACCGCGC TCATGGCTCA CCCTGACGGG 
TCATGGGCGC GGGGAACCGC GATCGGTACC GATCCGCCGA CGGTGCACCA GGGCGGGCCC 
CGCCGGCTGT GGGAGGCGCT CGACACCGTC CGGGACGACT GGCTCCGTCT CGGATGGGCC 
CCGTTCCTCG GCGCGCAGGC GATGATCCGC GACGACGGCA CTATCAAGCT CATCCGCGGC 
GACTGGCGGG CAACCATACA CGCCGTCTCA ACACCCTAG

Protein sequence

MTNWRAHART LADQVTHPGS RWHRALVDTP RHRFVPAWWD DSDGSWALRR GPLAGAYADR 
SLVTRVGPLH ADLAEDDDHP QGRPTSSSTA PSLALTMYRY GHLSRGLDIA DVGTGSGYGA 
ALLARRYGSQ HVTTLDVDPY LVSAAAGRLA ALDLHPTALT VDATGPLPGT YDRIVSMVSV 
PSIPPSWLAA LRPGGRLVTT IRGTWIILTA TRTRDGVFGQ VERDWAGFMD VRSGPDYPPV 
AAVDFDRIAE QVGVGRYPVL HVADAWELST MLHLAVPGIE HRYRREADGR HTALMAHPDG 
SWARGTAIGT DPPTVHQGGP RRLWEALDTV RDDWLRLGWA PFLGAQAMIR DDGTIKLIRG 
DWRATIHAVS TP