Gene Francci3_4467 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4467
Symbol
ID	3907443
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	5339193
End bp	5340395
Gene Length	1203 bp
Protein Length	400 aa
Translation table	11
GC content	72%
IMG OID	637881799
Product	protein-L-isoaspartate(D-aspartate) O-methyltransferase
Protein accession	YP_483542
Protein GI	86743142
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2518] Protein-L-isoaspartate carboxylmethyltransferase
TIGRFAM ID	[TIGR00080] protein-L-isoaspartate(D-aspartate) O-methyltransferase

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCACCC GCACCCCCGA ACAGCTCCGC GACAACCTGG TCGCCGACAT CCACCGCTGG 
GGCACATTCC GAACCGCCCA GGTCGAAGCC GCGTTCCGCA CGGTCCCGCG ACACCTGTTC 
CTGCCCGACG TCGACCTGGA AACCGCCTAC GCCCCCCAGG TCGTCGTCAC CCGCCGCGCC 
CCCGACGGCA CCGCGCTGTC CTCAGCATCC CAACCCAGCC TCGTCGCCGC CATGCTCGAA 
CAGGCCGGCG TCCACCCCGG CCACCGCGTC CTGGAGATCG GCACCGCCAC CGGCATCAAC 
GCAGCACTCC TCGCCGAACT CACCGGCCCG ACCGGCCAGG TCACCACCAT CGAGATCGAC 
GAGGAGCTCG CCGCAGGCGC GCGCACCGCA CTGGTCAAGG CCGGTTACGA ACGCGTGGAC 
GTTGTCCACG CCGATGGTGC GGCGGGCCAC CCGGGCGGAG CGCCCTACGA TCGGATCGTC 
ATCACGGCCG GGGCCTGGGA CCTGGCCAAG GGCTGGTGGA ACCAGCTCGC CCCCGCCGGT 
CGTATCGTCG TGCCTCTCCG TCTCCACGGA AGCGGCCTGA CCCGCTCCCT CCCGCTCGAC 
GCCGTTGAGC CGGGCCGGCT CGTCAGCCGC TCGGCGCTCG TCTGCGGATT CGTCCCCCTA 
CGTGGCGCCG ACGCCCACAC CGGCCGTACC CTCGCCCTCG CAGACGGTGT CGCCCTGCAC 
GTCGACGACC ACGACCCCGC CGACGAGCCG GCGCTGCGCG CCGCGGCGGC CAGCCCACCC 
CACAACCTAT GGACGGGGCT GACGATCCAC GACGACGAAC CGACCGCGCA CCTCGACCTG 
TGGCTCGTCA CCATGGGCGC CCGCTTCGGC CGCCTCGCCG TCGACACCAC CGTCCGCCCT 
GACAGCCAGC TCACTCCGAC ACGGCGCTGG GCCGGGGCCA CCATCCACGA CGGCACCACC 
ATCGCCTACG TCACCCTGCG TCCCCTCGCA TCCGACACCG ACGAACTCGG CGTCACCGCC 
CACGGACCCC ACGCGGCCAC CCTCACCGCG CACCTCACCG ATCTGCTGCA CCAGTGGCGC 
AAAGAAGGCC CCGCCGAACC TGTCGTAACG GCCCATGCCG CGGACACCCT GGAGGACCAG 
ACCGTCGCCG GACACCGCGT CGATCGGCCG AACAGCCGAC TCACCGTCCG CTGGCAGCCC 
TGA

Protein sequence

MTTRTPEQLR DNLVADIHRW GTFRTAQVEA AFRTVPRHLF LPDVDLETAY APQVVVTRRA 
PDGTALSSAS QPSLVAAMLE QAGVHPGHRV LEIGTATGIN AALLAELTGP TGQVTTIEID 
EELAAGARTA LVKAGYERVD VVHADGAAGH PGGAPYDRIV ITAGAWDLAK GWWNQLAPAG 
RIVVPLRLHG SGLTRSLPLD AVEPGRLVSR SALVCGFVPL RGADAHTGRT LALADGVALH 
VDDHDPADEP ALRAAAASPP HNLWTGLTIH DDEPTAHLDL WLVTMGARFG RLAVDTTVRP 
DSQLTPTRRW AGATIHDGTT IAYVTLRPLA SDTDELGVTA HGPHAATLTA HLTDLLHQWR 
KEGPAEPVVT AHAADTLEDQ TVAGHRVDRP NSRLTVRWQP