Gene Francci3_2066 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2066
Symbol
ID	3904639
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2429980
End bp	2431317
Gene Length	1338 bp
Protein Length	445 aa
Translation table	11
GC content	66%
IMG OID	637879402
Product	hypothetical protein
Protein accession	YP_481168
Protein GI	86740768
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	25
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.212487
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCACGC TGCTGATCGG AAACTCGTAC AACGACAGTC TCGTCGCGGA TCTCGCATCT 
TTTCGCGAGG CTGACCGCCA GGTGGCCGGC AACATCTCGC TCCGGATGAT CTGGCTTGCC 
GAGCCCGGTG ACATCCTCGT GCTTCCGCAG CCCCCGCGAC CCGAGTTTGT GCGTTACGCG 
CTGACTCTGC GCGGCCTGGA TGTCGACTCG GTCCTGATCA TGGTTCCGCC CGCGGGCCGT 
CTCGGGTCGG ATGTTCTCAC CGGCGACCGG CTCCTCGACG GGGGCTTTCT CGCCGAACTG 
CGCGCCCTGG TCACGAAGCG GAACGTCGAC CATGCCTGCC CCTACGTGTT CGACGCGACG 
ACCGCCCATC TCATCAGGGA GCTGGGCCTG CACAGATCGA TGCCGGGGTT CGGATTCTAC 
GAGGCCGGCG GCGCGGACCT CGTGAATAGC AAGAGCGTGT TCCGCGCGAT GGCTGGCGGT 
CTGGGCCTCC CGGTCACCAC AGGCATCGTG GCGACCTCCA GAGCCAAGGC GCAGGAGTTC 
GCGGCCGATC TCGTCGCGGC GAACAGGTGC GTGATCGTCA AGCAGGACTT TCACGCCGGC 
GGCTACGGCA ACGAGATCAT CTCGCCGCGC CCCGACGTGC AGCCGCTGGG CGCGCCCAGC 
CTGCGGGTGC TCGATTCCCA GGACGCCGTC CGACGGCATT TCGACAGCGC CTGGTCACGT 
TACTCGGTCG ACGGCCGCCA CAAGGTGATC GTCGAGGACT ATGTGCCCGA CTCCATGCCG 
CTGGGCGCGG AGGTGAGAAT CACGGCCGAG GGAAGCAGGC TGCACCATAT CGGCGAGATG 
CGAATGGCAC CGGTATTCGA CGGGGTAGTG ATCCCGGGGG CCGTGCTGAG CGAGAAGAAC 
CGGGCGGAGT TCAACGACAT CGTGCTGCGG GTCTGCGATT CCATCCGTGC GCTCGGATAC 
GTCGGCCTGG CGAATATCGA TGGAATCCTG ACGCCCGACG GAGACCTCCT ACTGACCGAG 
ATGAACGGAC GCCTCGGCGG CACCACACAC CTGCACTGGA TCGCCGACGC CCTGGTCGGC 
CACGACTATC AGACCGAATG CGTGTTGATG ACGCGAAACC ACTGGCATGT CTCCTCGTTC 
GACGACGCGG TGGCCCGGCT CAGGACGAGC GGACTGCTCT TCGAGCCGGA CGCGCGTGCG 
GGAGTGCTGA TCGGCTGCGA GCATATCCAG CAGTCGGGAG TAGTCGAGTA CTGCATCGTC 
GCGAAGGACG TCGACGCGGC GGAGGAGATC GAGACGAGTC TTCTACGGCT CCCCGGCGGC 
TCGCTGGACA CACCTTGA

Protein sequence

MSTLLIGNSY NDSLVADLAS FREADRQVAG NISLRMIWLA EPGDILVLPQ PPRPEFVRYA 
LTLRGLDVDS VLIMVPPAGR LGSDVLTGDR LLDGGFLAEL RALVTKRNVD HACPYVFDAT 
TAHLIRELGL HRSMPGFGFY EAGGADLVNS KSVFRAMAGG LGLPVTTGIV ATSRAKAQEF 
AADLVAANRC VIVKQDFHAG GYGNEIISPR PDVQPLGAPS LRVLDSQDAV RRHFDSAWSR 
YSVDGRHKVI VEDYVPDSMP LGAEVRITAE GSRLHHIGEM RMAPVFDGVV IPGAVLSEKN 
RAEFNDIVLR VCDSIRALGY VGLANIDGIL TPDGDLLLTE MNGRLGGTTH LHWIADALVG 
HDYQTECVLM TRNHWHVSSF DDAVARLRTS GLLFEPDARA GVLIGCEHIQ QSGVVEYCIV 
AKDVDAAEEI ETSLLRLPGG SLDTP