Gene Francci3_3212 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3212
Symbol
ID	3906178
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3804632
End bp	3805873
Gene Length	1242 bp
Protein Length	413 aa
Translation table	11
GC content	69%
IMG OID	637880536
Product	aminodeoxychorismate lyase
Protein accession	YP_482298
Protein GI	86741898
COG category	[R] General function prediction only
COG ID	[COG1559] Predicted periplasmic solute-binding protein
TIGRFAM ID	[TIGR00247] conserved hypothetical protein, YceG family

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0548102
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCGACG AGGACCCCTA CTCGCGTCGC CGTCGGGCCC GCCAGCGCGG TGATCGTTAC 
TCGGATGAAC ACTACGCCGA TGATCAGTAC CCGGACGACC GTGCCGGGGT CGACTGGGAC 
CACCGCGCCT GGGACGACGG CGGCGGCTGG GACGAGCCCG GTCCCGACGG CGGCCGGCGC 
GGTCGCGCGC TGCCGAAGCT CATCGCGGTG CTTGTCGTGG TCGCCGCCCT GCTGGGACTG 
GGGATCTACG GGGTGGGGAA GGTCGTCGGG CACATCTCGG CTGGCGAGCC CGCCGACTAC 
TCCGGCTCCG GCGAGGGCAT CGCGATGGTC CAGATCCCGG CCGGGGCGAG TACCCGGGAG 
ATCGCCGGGG AGCTGCACGA CGCGAACGTG ACCGCGAGTG TCGCCGCGTT CGTCAAGGCC 
GCCACCGCGA ATCCGAAGTC GCTGGGCATC CAGCCGGGCA CCTACCGTCT GCACACCAGG 
ATGAGCGCCG CCGCGGCGCT CGAGGCCCTG CTCGACCCTG CCTCGTCCGC GCCGTTCAAG 
TTCGTCATCA AAGAGGGCAT GACCGTCCGT GAGGTCCTCA CAGCACTGCA TGAACGCCTC 
CCGGGCACGT CGATGGCGGA CCTGGAGGCG ATCGCGAAGA ACCCCGCCCA GCTGGGCCTG 
CCGTCCTACG CGCCGCCGAA CCTGCTGGAA GGCTATCTCT TCCCGTCTAC CTACGACCTC 
GTGCCCGGGG CCACGCCCGA GCAGTTGCTG CGTTCCTTCG TCGACCGCTT CAAGCGGGAG 
ACCGCGGCGA TCGATCTGGA GGGCAGGGCC GCCGCGCTCG GGGTCCCGCC GAAGGACATC 
GTCACCATCG CCTCGATCAT CGAGAAGGAG GTGGCCAACC GCGACGAGGG TCCGAAGGTG 
GCCCGGGTGA TCTACAATCG GCTCAGGGAC ACATCGGGAA GATTTGGCCG GCTCGACATG 
GACTCGACCA CCCGCTACGC CACGGACGGG TACGAGGGGC CGTTGACCAA GGAACAACTC 
GCCCAGAACA ACCCGTACAA CACGCGGGCC GTGAAAGGGT TGCCGCCGGG CGCAATCTCC 
AACCCCGGCG TCTGGGCGCT GCGGTCGGCA CTGGAACCGG CCGACGGATC GTGGTTCTAT 
TTCGTCTCCA TGCCGCAGAG CAAGGTGACG GTCTTCGCCA CCACGGAGCG GGAGTGGGAG 
CAGGCAGAGG CCCAGTACCG GCGTGAAGGA GGTCGTGAGT AG

Protein sequence

MLDEDPYSRR RRARQRGDRY SDEHYADDQY PDDRAGVDWD HRAWDDGGGW DEPGPDGGRR 
GRALPKLIAV LVVVAALLGL GIYGVGKVVG HISAGEPADY SGSGEGIAMV QIPAGASTRE 
IAGELHDANV TASVAAFVKA ATANPKSLGI QPGTYRLHTR MSAAAALEAL LDPASSAPFK 
FVIKEGMTVR EVLTALHERL PGTSMADLEA IAKNPAQLGL PSYAPPNLLE GYLFPSTYDL 
VPGATPEQLL RSFVDRFKRE TAAIDLEGRA AALGVPPKDI VTIASIIEKE VANRDEGPKV 
ARVIYNRLRD TSGRFGRLDM DSTTRYATDG YEGPLTKEQL AQNNPYNTRA VKGLPPGAIS 
NPGVWALRSA LEPADGSWFY FVSMPQSKVT VFATTEREWE QAEAQYRREG GRE