Gene Franean1_2627 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2627
Symbol
ID	5671021
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3108574
End bp	3109875
Gene Length	1302 bp
Protein Length	433 aa
Translation table	11
GC content	69%
IMG OID	641241543
Product	protein-L-isoaspartate(D-aspartate) O-methyltransferase
Protein accession	YP_001506963
Protein GI	158314455
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2518] Protein-L-isoaspartate carboxylmethyltransferase
TIGRFAM ID	[TIGR00080] protein-L-isoaspartate(D-aspartate) O-methyltransferase

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCACCT CCACGAGCGA GACCACCCAT GAACAGGTAG CCCCCCAGCC AGATGACGCC 
GCTCGCCTGC GCGAGGAGCT CATCCGGGAA CTGCATGAGC TGGAGGCGAT CGCGACGCCG 
GAGGTGGAGC GGGCGGTACG GACGGTGCCA CGGCATCTGT TCATCCCCGA GATGTCGTTG 
GAGGAGGCAT ACGCCGCCGA GTGCCACTAC GTGACGAAGA CGGACAAACT GGGGATCAGC 
ATCAGTTCGG TGTCCGCCGC ACGGATCCAG GCCATGATGT TGGAGCAGGC CCAGGTCCGC 
CCCGGGATGC GCGTCCTGGA GATCGGCGCG GGCGGCCTCA ATGCCGCGAT GCTCGCCGAG 
CTGGTGGGCG AGACCGGCCA GGTCACCTCG ATCGACATCG ATCAGGACGT CATCGACCGG 
GCAGCCCGGC TCCTGCCAGC GGCGGGCTAC GACAGCATCA ACCTGCTGCG CGCCGACGGG 
GAGTTCGGCG CACCGGAGCA CGCTCCCTTC GATAGGATCA TCGTCACCGT CTGCGCGTGG 
GACCTGCCCC CGGCCTGGAG TGACCAGCTC GCTGAGGGCG GCCGGCTCGT CGTCCCGCTG 
CGGATGCGCG GCCTGACCCG CTCGGTGGCG TTCGAGCGGG AGAACAACCG TCTGGCTGCT 
CGCGGCTACG AGCTGTGCGG CTTCGTGCCC ATGCAGGGCG CCGGAGAACA GCGTGAACGC 
CTGGTCCCGC TCCACGGCGA CGATGTGCGC CTGCGCCTGG ACGACGACCA GCACGCCGAC 
GGCGACGCCC TGGCCGCCGC GCTGGCAATG CCGCGGAGAG AGGCGTGGTC GGGGATCACG 
GTCGGGAAAG GCGTCAGGTT CGACGGCCTG TACCTGTGGA TGGCCATGAA GCTGCCCGAC 
TTCGGGTTGC TCGCCGCGAC GAAAGCCGCC GTGGATCACG GACTGGTCGC TCACTCCTGG 
GGGCTGGGCG TTCCGACTCT TCTCGACGGG GACAGCTTCG CCTACCTGAC CTACCGCCCC 
ACCAGCGAGA CGCGCGAGCA GTTCGAGTTC GGCGCCTACG GGCACGGACC CCACGCCGAG 
ATGACTGTCG AAAGGCTGGC CAGCCTCATC AGGTCCTGGG ACGGCACCAG CCTGAACGCT 
CGCATCAGCG CCCACCCCGC AGGCGCTCCT GACGAGTTGC TGCCCCCCGA CGCCCTCGTG 
CTCGCCCGAC GCCACAGCCG TATCGCGATC ACCTGGCCGT CTCCGCCGCC GACTGACGAC 
CCGGGCAGCG CACAGGTCCG GGAGGGGGCG AAGCATGAGT AG

Protein sequence

MSTSTSETTH EQVAPQPDDA ARLREELIRE LHELEAIATP EVERAVRTVP RHLFIPEMSL 
EEAYAAECHY VTKTDKLGIS ISSVSAARIQ AMMLEQAQVR PGMRVLEIGA GGLNAAMLAE 
LVGETGQVTS IDIDQDVIDR AARLLPAAGY DSINLLRADG EFGAPEHAPF DRIIVTVCAW 
DLPPAWSDQL AEGGRLVVPL RMRGLTRSVA FERENNRLAA RGYELCGFVP MQGAGEQRER 
LVPLHGDDVR LRLDDDQHAD GDALAAALAM PRREAWSGIT VGKGVRFDGL YLWMAMKLPD 
FGLLAATKAA VDHGLVAHSW GLGVPTLLDG DSFAYLTYRP TSETREQFEF GAYGHGPHAE 
MTVERLASLI RSWDGTSLNA RISAHPAGAP DELLPPDALV LARRHSRIAI TWPSPPPTDD 
PGSAQVREGA KHE