Gene Francci3_0819 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0819
Symbol
ID	3906446
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	954966
End bp	956039
Gene Length	1074 bp
Protein Length	357 aa
Translation table	11
GC content	73%
IMG OID	637878152
Product	squalene/phytoene synthase
Protein accession	YP_479932
Protein GI	86739532
COG category	[I] Lipid transport and metabolism
COG ID	[COG1562] Phytoene/squalene synthetase
TIGRFAM ID	[TIGR03464] squalene synthase HpnC

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.224139
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAGCCA TCGACGCCCG AACCAGCCCA TCACGCACGC CTGCCCAGCC GGCCGCGACG 
GGCCTGGCAA CTCCCGCCGA GCAGCTGCTG CGCGCCGCCC CGGCGGAGAA CTTCCCGGTC 
TCGCCGTTCG TTCTGCCCGC GGCGGTTCGT TTCCACTTCA ACGCGTTGTA CGCCTTCAGC 
CGGCTCGTCG ACAACCTCGG CGACGAGGCG GCCGGCGACC GGCTCGCCCT GCTCGACCGG 
TTGTCGGCGG ACCTCGAGGT GATCTGGACA GGTGGGCAGC CGGAGCTGCC GGTCCTGCGC 
CTGCTCGCGC GGACCGTGCG GGACTGTGAC CTGCCCGCCG AACCGTTCCA GCGCCTCGTC 
GAGGCCAACC GGCAGGACCA GCGGGTCACC CGTTACGAGA CCTTCGACGA CCTGGTCCGC 
TACTGCACGC TCTCGGCCGA TCCGATCGGA CGGATGGTGC TGGGCGTCTT CGGGCTGGCG 
ACCCCCGACC GGGTCGTGCT GTCGGACCGG GTGTGCACCG CCTTGCAGCT CGCCGAGCAC 
TGGCAGGACG TGGCCGAGGA CCTCGCCGCC GGCCGGATCT ACCTGCCGCT GGAGGATCTG 
GACACCTTCG GGGTGACCGA GGCCGATCTG CGGGCTTCCG TCGCGAGTCC GGCCGTGCGC 
CATCTGATGG CCTTCGAGGT CGCTCGGGCC CGTACGGTGA TCGACCAGGG CGCTCCCCTG 
GTGTCGATGG TGCCCGGGCG GCTGCGGCTG GCCCTGGCCG GTTTCGTGGG CGGGGGCCGG 
GCGGCGTTGG ACGCGATCCG GCGCGCCGAC TACGACGTGC TCGGTGGGCC ACCGAAGGCG 
ACGAAGCCAC GGGTCGCCGA GTTCGCGCTG GCGGCGCTGG CCCGGTCGCT GGCTCCCGGA 
GCGTCGGCGG TGGCGCACAC GGCGGCCGCC GTCGCCACCG CGACCAGCGC GGCCGGGGCC 
TGGCCGGGTT CCGGTTCCGG TTCCACAGCC CACGGCGGCA CCGCCGCGAC GAGTACCCAG 
GCCGGCGTCC CCGCAGCACA GTCCGTTCTT CCGGAGATGG GTGAGGTTCG ATGA

Protein sequence

MTAIDARTSP SRTPAQPAAT GLATPAEQLL RAAPAENFPV SPFVLPAAVR FHFNALYAFS 
RLVDNLGDEA AGDRLALLDR LSADLEVIWT GGQPELPVLR LLARTVRDCD LPAEPFQRLV 
EANRQDQRVT RYETFDDLVR YCTLSADPIG RMVLGVFGLA TPDRVVLSDR VCTALQLAEH 
WQDVAEDLAA GRIYLPLEDL DTFGVTEADL RASVASPAVR HLMAFEVARA RTVIDQGAPL 
VSMVPGRLRL ALAGFVGGGR AALDAIRRAD YDVLGGPPKA TKPRVAEFAL AALARSLAPG 
ASAVAHTAAA VATATSAAGA WPGSGSGSTA HGGTAATSTQ AGVPAAQSVL PEMGEVR