Gene Franean1_2801 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2801
Symbol
ID	5671190
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3315505
End bp	3316701
Gene Length	1197 bp
Protein Length	398 aa
Translation table	11
GC content	69%
IMG OID	641241710
Product	protein-L-isoaspartate(D-aspartate) O-methyltransferase
Protein accession	YP_001507130
Protein GI	158314622
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2518] Protein-L-isoaspartate carboxylmethyltransferase
TIGRFAM ID	[TIGR00080] protein-L-isoaspartate(D-aspartate) O-methyltransferase

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.78104
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACACCA CCGCAGCCAC ATCACCAGGC ACGCTGCGCG ACCGCATGGT CGACCGCATC 
CTCACCAGCC AGAATCTGCC CCCGTGGGTC GAAACGGCGC TGCGTTCCGT CAAACGCCAC 
CGCTACGTCC CCGAAGCGCC GCTGGCCGAC GCCTACGACG AGAAGGCGGT CATCACCCAC 
ACCTTCCCCG ACGGCACCCA CCTCAGCTGC GCCTCCGGCC CCACCATCGT GGCCGCCATG 
CTCACCGCCC TCGATGTCCG GCCCGATCAG CACATCCTGG AGATCGGCGC CGGCACCGGC 
TACAACGCGG CCCTCCTCGC CACCCTCGTG GGCACCGGCG GCCAGGTCAC CACTATCGAC 
ATCAACGCCG ACGTCACCGC CGCAGCACGG CGCAACCTTG ACGACACCGG CTTTCCCTAC 
GTTCGCGTTC TCACCCGCGA CGGCGCTGAC GGCGCTGCCG AGGACGGCCC CTTCGATCGG 
ATCATCGTCA CGGTCGGCGC CTGGGACATC CCACAGGCCT GGTGGGACCA GCTCGTCCCC 
GATGGCCGCC TCGTCCTCCC GCTGCGCTGG CGCGGCACTA CCCGCGCTGT CGCACTCACC 
AGGCAGGAAG ACCACTGGAA GTCCGACTGG GTCTTCCTGT GCGGCTTTGT GCCGATGCTC 
GGCCAGCCCG GCGAGCGGAG GAGCGTCATC CACCCCGACG GCCTCGCCGC CCTGCACCAC 
GATCTCGACC AACCCATCGA CACCGACGCC CTGCGCGGTG TCCTCGACCG GGAGAAGTCC 
GTCGTCTGGT CTGACGTGAC CGTGCACGGT CAGGAACCCT TCGACCGCGT CTGGCTGCAC 
CTCAGCGCCG TGGAAGACGG CACGGTCCGC ATCGAGGCCG ACCAGCAGGC CGTCGCCGAG 
GGCCTGTGCA CACCCGCGAT CGCCTCACGC AGCCCAGCCC TGGTCAAAGA CGGTTCACTG 
GCCTACTTCA CCATCCGGCG CGCCGACACC CCAGGGCGCT GGCAGCTCGG CGCCATCGGC 
CACGGGCCCC TCGGTCGCCG TCTTGCCTCA CGGATCGTCG ACCAGATCGA CGCCTGGGAC 
CACGACCGCA CTGCCGACCC CGAAATCCTC GCCTTCCCGG CCGGCACGCC GATCCCGAAC 
CAGACGCAAG GCAAGATCAT AACCAAGCCG GAGAACCGCC TGGTACTGCG CTACTAG

Protein sequence

MDTTAATSPG TLRDRMVDRI LTSQNLPPWV ETALRSVKRH RYVPEAPLAD AYDEKAVITH 
TFPDGTHLSC ASGPTIVAAM LTALDVRPDQ HILEIGAGTG YNAALLATLV GTGGQVTTID 
INADVTAAAR RNLDDTGFPY VRVLTRDGAD GAAEDGPFDR IIVTVGAWDI PQAWWDQLVP 
DGRLVLPLRW RGTTRAVALT RQEDHWKSDW VFLCGFVPML GQPGERRSVI HPDGLAALHH 
DLDQPIDTDA LRGVLDREKS VVWSDVTVHG QEPFDRVWLH LSAVEDGTVR IEADQQAVAE 
GLCTPAIASR SPALVKDGSL AYFTIRRADT PGRWQLGAIG HGPLGRRLAS RIVDQIDAWD 
HDRTADPEIL AFPAGTPIPN QTQGKIITKP ENRLVLRY