Gene Francci3_1987 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1987
Symbol
ID	3903695
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2333656
End bp	2334747
Gene Length	1092 bp
Protein Length	363 aa
Translation table	11
GC content	71%
IMG OID	637879323
Product	mandelate racemase/muconate lactonizing enzyme
Protein accession	YP_481090
Protein GI	86740690
COG category	[M] Cell wall/membrane/envelope biogenesis [R] General function prediction only
COG ID	[COG4948] L-alanine-DL-glutamate epimerase and related enzymes of enolase superfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.392929
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGCGG TTGAGAGCGT GGAGGTCGCC GCCTACCTGG TGCCGACCGA GCAGCCCGAG 
TCGGACGGGA CGCTGGAGTG GGGTTCCGTC ACCCTGGTGG TGGTGACGGT CCGGACCGGC 
GGCCAGGCCG GTCTGGGCTA CACCTACTGC CATCTCGCTG CCGCGGATGT CGTCGCGGGA 
AAGTTGGCGG CGGTGGTGAC TGGCCGGGAC GCGTTGCGGG TCGGTGCCTG CTGGTCGGCG 
ATGCAGGCGG CGGTGCGGAA CATCGGCCGT CCCGGCATGG CCGCAGAGGC GATCTCGGCG 
GTGGACATAG CGCTGTGGGA TCTCAAGGCG CGGCTGCTCG GTGTCCCGCT GGTGGTGGCG 
CTGGACGCGG TGCACGACCG GGTCCCGATC TACGGCAGTG GCGGCTTCAC GTCCTATCCG 
GACAGCCAGC TCTGCGATCA GTTGTCGGGT TGGGCGGCGG CGGGTATCCC GCGGGTGAAG 
ATGAAGGTCG GCCGGGACCC GGCGGAGGAC CGGAAGCGGG TGGCTGTGGC CCGGCGGGCA 
GTCGGATCCG ACGTCGAGCT CTATGTGGAC GCGAACGGGG CGTACAGCCG CAAGCAGGCG 
TTGATGCTGG CGGAGATCTT CGCGGAGCAG GATGTGCGCT GGTTCGAGGA GCCGGTCAGC 
TCCGACGACC TGGAGGGGTT GCGGCTGCTG CGGGACCGCG GCCCGGCGGG GATGGACATC 
GCGGCCGGCG AGTACGGCTA CACGTTGTCC GGTCTGGAAC GGATGCTGGC CGCGGGTGCT 
GTCGACTGCC TGCAGGTGGA CGTCACCCGC TGCGGCGGCA TCAGCGGGTT CCTGCGGGCG 
GCGGCGCTGT GCGACGCGCG GGGGATCGAC CTGTCCGCCC ACTGTGCGCC GCAGGTCAGC 
GTGCACGCCT GCACCGCGGT GTGGCATCTG CGGCACCTCG AGTACTTCCA CGACCACGTC 
CGGGTCGAAC ATCTGCTGTT CGACGGGGTC CTCGATGCGC GGCCGGACGG GACGCTGGTC 
CCGGATCGGT CGCGGTGCGG CCTGGGCCTG TCGGTGCGGC AGCGGGACGC CGAACGGTTC 
CGGGTCCGAT GA

Protein sequence

MPAVESVEVA AYLVPTEQPE SDGTLEWGSV TLVVVTVRTG GQAGLGYTYC HLAAADVVAG 
KLAAVVTGRD ALRVGACWSA MQAAVRNIGR PGMAAEAISA VDIALWDLKA RLLGVPLVVA 
LDAVHDRVPI YGSGGFTSYP DSQLCDQLSG WAAAGIPRVK MKVGRDPAED RKRVAVARRA 
VGSDVELYVD ANGAYSRKQA LMLAEIFAEQ DVRWFEEPVS SDDLEGLRLL RDRGPAGMDI 
AAGEYGYTLS GLERMLAAGA VDCLQVDVTR CGGISGFLRA AALCDARGID LSAHCAPQVS 
VHACTAVWHL RHLEYFHDHV RVEHLLFDGV LDARPDGTLV PDRSRCGLGL SVRQRDAERF 
RVR