Gene Francci3_2436 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2436
Symbol
ID	3905048
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2830347
End bp	2831405
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	67%
IMG OID	637879766
Product	protein-L-isoaspartate(D-aspartate) O-methyltransferase
Protein accession	YP_481532
Protein GI	86741132
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG2518] Protein-L-isoaspartate carboxylmethyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.326287
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.177296
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGGGC GGGTGGTGAA CCGGGAGGAC TTCATCCCGG ATGAGGTCTG GGTGACCGGT 
GATGACGGAT TCTTCCTGGT TCCGCTCCGT CGAAGCGAAG ATCCGGAAGG GTGGTTGGCG 
CTGGTCCGTA GCGATCAGGC GATCACCACC CAGGTAGACG ATGGTAGGGA CAAGTACGAC 
GGTAAGGGGA TCATCCCGAC CAGTTCGTGT AGTGCGCGGT GGGTGGTCGA CCGGATGCTT 
GATCTCCTCG GCGTGCGCCC GGGAATGCGC GTGCTGGAGA TCGGGACAGG TACCGGCTAC 
AACGCTGCGC TTCTCGCGGT GCAGGCCGGT TCCGGTCAGG TGACCAGCAT GGAAGTCGAC 
CCGATGATAG CCGGACAGGC ACGGGCGGCG TTGGACCGGA CCGGCCATCC CGTGCGGGTG 
ATCGCAGGGG ATGGGACCGC GGGCTATCCG GCGGGCGCAC CGTACGACCG TGTGATCGCA 
ACAGCGTCAG TGTCGGTGGT CCCCTGTTCG TGGGTGGAGC AGACCCGGCC CGGGGGGCGG 
ATCGTGTTCC CGTTCGCCGG TACCTTCGAC GGGGCGTTGG CGGTTCTGGT CGTCGATGAC 
GATGGTGTGG CCCGCGGCCG GTTCCACGAT GAGGCCGGGT TCATGCGGCT ACGGAACCAG 
CGGCGCGACC CGCATGTGTG GTGGCTGGGT GAGGACGACG CGGACGTCAG GCCCACCCGC 
CGGTATCTCC GCGAGCCTTT CGATGATGCG GCGACCGGGT TCGCGGTCGG CTTGTGGCTG 
CCGGGCTGCA CGACCGGGGA CATCGACGAA GGCGGCCCCG CGAACACCCT GTTGCTGTCT 
CACAGCCCGT CGCAGTCCTG GGCATCGCTG ACCGCAGGCC TGGACGAGCA CGAGATCACC 
CAGTACGGGC CGCGTCGACT CTGGGACGAG CTGGAGACGG CCTACGACTG GTGGATGAAC 
TCCGGCCGGC CCTCCCGCGA TCGGTTCGGG CTCACTGTGA CTCCCGACGG GCAAACCTTC 
TGGCTCGACA ACCCGGACCA CGCCATCCTT CTCCGCTGA

Protein sequence

MSGRVVNRED FIPDEVWVTG DDGFFLVPLR RSEDPEGWLA LVRSDQAITT QVDDGRDKYD 
GKGIIPTSSC SARWVVDRML DLLGVRPGMR VLEIGTGTGY NAALLAVQAG SGQVTSMEVD 
PMIAGQARAA LDRTGHPVRV IAGDGTAGYP AGAPYDRVIA TASVSVVPCS WVEQTRPGGR 
IVFPFAGTFD GALAVLVVDD DGVARGRFHD EAGFMRLRNQ RRDPHVWWLG EDDADVRPTR 
RYLREPFDDA ATGFAVGLWL PGCTTGDIDE GGPANTLLLS HSPSQSWASL TAGLDEHEIT 
QYGPRRLWDE LETAYDWWMN SGRPSRDRFG LTVTPDGQTF WLDNPDHAIL LR