Gene Franean1_6752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6752
Symbol
ID	5675065
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	8212786
End bp	8213994
Gene Length	1209 bp
Protein Length	402 aa
Translation table	11
GC content	70%
IMG OID	641245601
Product	protein-L-isoaspartate(D-aspartate) O-methyltransferase
Protein accession	YP_001510992
Protein GI	158318484
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2518] Protein-L-isoaspartate carboxylmethyltransferase
TIGRFAM ID	[TIGR00080] protein-L-isoaspartate(D-aspartate) O-methyltransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.20607
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGTACCG TGACCTCCAC GCACGACGCC ACCCCCGATG ACCTGCGCGC GGCCATGGTC 
GACCGCCTCG CCACCTCGGG AGCCATCCTC ACCGCCGCGG TCGAGGACAC GATGCGCACC 
GTGCCCCGCC ACCTGTTCGT GCCCGACGCC GCCCCCGGCG AGGCCTACGC CGAGCAGGCC 
GTCATCACCA AACGCGCCCC TGACGGCACA TCCCTCAGTT ACGCCTCCGG GCCGGGAATC 
GTGGCGATGA TGCTGGAGCA GCTCATCGTC CTACCCGGCC AGCGGATCCT CGAGATCGGG 
ACCGGCACCG GCTACAACGC CGCCCTCCTC GCGCACCTGG CCGGGCCCGG CGGGCACGTC 
ACCACCATCG ACATCGACCC CGACATCACC AGTGCTGCGA CCAGCGCCCT CGCCGCAGCC 
GGCTTCGAAA AGGTCACGGT CCTCACCGGG GACGGCACCT TCGGCGACCC GGACAGCCAC 
GTGCACGATC GGCTGATCGC CACGGTGGGA GTCTGGGACA TCTCCAGCGC CTGGTGGGAC 
CAGCTCGCCC CGGGCGGCCG GCTCGTCCTG CCCCTGCATT GGCGGGGCCA GACCCGCGCG 
GTGACCTTCC GCCACGACGG CAACCGGATG ATCAGCGAGT CGGTAGAGCT CTGCGGCTCC 
GTCCCGATGA TCGGGCAAGC GGGCGAACGG ACCGCCGCGA TCCACCATGA TGGCCTCGTC 
GCCCTGCACT GGGACCAGGA CCAAGCCATC GACCCGGGCA CTCTCACCGG CGTACTCGAC 
AGGAGGCGGA CAATCGCCCT CTCCGGGGTC GAGGTCGGCC CCTACGACCC GTTCGACGGA 
ATCTGGCTGC GCCTGACCGC CACCGAGCCC GGATGCTGCC GCATCGAAGC CACCCCCGAA 
GCGGTGAAGT CCGCCCTGTG CGCACCCGCG ATACCCCAGC GCAGCCCCGC TCTCGTCGAC 
CGCGACTCGC TGGCCTACCT CAGCCTCGCC CGCAACCACA CCGGGCCCGG CCGTCACACC 
CTCAGCGTCA TCAGCCACGG CCCGAACCGT CATAACCTGG CCGACCGGCT GATCGAAGGC 
ATCCACACCT GGAACAGCGA CCGCACCGCC ACCCCCACCG TCACCGCCCA CCACGGGCCC 
GCCGGTCTCG CGCACCAGCC GCCCGGACTT ATCCGGAAAC CGGACAGCCC TCTGACGATT 
ACCTTCTGA

Protein sequence

MSTVTSTHDA TPDDLRAAMV DRLATSGAIL TAAVEDTMRT VPRHLFVPDA APGEAYAEQA 
VITKRAPDGT SLSYASGPGI VAMMLEQLIV LPGQRILEIG TGTGYNAALL AHLAGPGGHV 
TTIDIDPDIT SAATSALAAA GFEKVTVLTG DGTFGDPDSH VHDRLIATVG VWDISSAWWD 
QLAPGGRLVL PLHWRGQTRA VTFRHDGNRM ISESVELCGS VPMIGQAGER TAAIHHDGLV 
ALHWDQDQAI DPGTLTGVLD RRRTIALSGV EVGPYDPFDG IWLRLTATEP GCCRIEATPE 
AVKSALCAPA IPQRSPALVD RDSLAYLSLA RNHTGPGRHT LSVISHGPNR HNLADRLIEG 
IHTWNSDRTA TPTVTAHHGP AGLAHQPPGL IRKPDSPLTI TF