Gene Francci3_0081 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0081
Symbol
ID	3905125
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	98966
End bp	100075
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	71%
IMG OID	637877411
Product	citrate synthase 2
Protein accession	YP_479204
Protein GI	86738804
COG category	[C] Energy production and conversion
COG ID	[COG0372] Citrate synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCGAGA AAACAAGCGA TTTCAAGCCC GGTCTGGAAG GTGTGATCGC CTTCGAGACG 
GAGATCGCCG AGCCGGACAG GGAAGGTAGC GCGCTGCGTT ACCGCGGCGT CGACATCGAA 
GACCTTGTTG GCAAGGTCGA CTACGGCCAC GTCTGGGGGC TGCTGGTCGA CGGGGCGTTC 
GAGCCCGGAC TGCCGCCGGC CGAGCCCTTT CCGGTCCCGG TGCACTCCGG TGACATCCGG 
GTGGACGTGC AGAGCGCGCT CGCGATGCTC GCGCCCTACT GGGGCCTGGG CCAGCTGATC 
GACATCACCC CGGAGCAGGC ACGGGACGAT CTTGCCCGGG CATCGGTCGT GGCGTTGTCG 
TTCGTCGCCC AGTCCGCGCG GGGCCTTGGT CAGCCGGCGG TGCCGCAGAA GGAGGTTGAC 
CGGGCCCGGA CGATAACCGA GCGGTTCATG ATCCGTTGGC GTGGTGAACC GGATCCCAGG 
CACGTCCAGG CCGTGGACGC CTACTGGGTC TCGGCCGCCG AGCACGGCAT GAACGCCTCG 
ACGTTCACCG CCCGGGTGGT CGCCTCGACC GGCGCGGACG CCTCGGCGGC GCTGTCGGCT 
GCCGTCGGTG CGCTGTCCGG TCCGCTGCAC GGCGGTGCTC CGTCCCGGGT GCTCGCGATG 
CTCGACGAGG TCGAGCGCAC CGGCGACCCC CTCGGCTACG TCCGCCGCGC CCTGGACCGC 
AAGGAGCGCC TGATGGGCTT CGGGCACCGG GTGTACCGCG CCGAGGACCC GCGGGCCCGG 
GTGCTGCGCC GGACCGCTCG TGACCTGGGC TCGACCCGCT ACGAGGTGGC GGAGGCGCTG 
GAGGCCGCCG CGATCGAGGA GCTGACCAAT CGGTTCCCGG ATCGCCCGCT GCGGACCAAC 
GTCGAGTTCT GGTCGGCGGT GGTGCTGGAC TTCGCCGAGG TGCCGGCCCA TATGTTCACG 
TCCATGTTCA CCTGTGCCCG CACCGCCGGC TGGAGTGCCC ACATCCTGGA ACAACAACGC 
ACCGGGCGGC TGATCCGCCC GTCCGCGCGG TACGTGGGCC CCGCTCCGCG CCCGCTCGGT 
GACGTTCTGC CGGGGGTCAG CCGTGGCTGA

Protein sequence

MAEKTSDFKP GLEGVIAFET EIAEPDREGS ALRYRGVDIE DLVGKVDYGH VWGLLVDGAF 
EPGLPPAEPF PVPVHSGDIR VDVQSALAML APYWGLGQLI DITPEQARDD LARASVVALS 
FVAQSARGLG QPAVPQKEVD RARTITERFM IRWRGEPDPR HVQAVDAYWV SAAEHGMNAS 
TFTARVVAST GADASAALSA AVGALSGPLH GGAPSRVLAM LDEVERTGDP LGYVRRALDR 
KERLMGFGHR VYRAEDPRAR VLRRTARDLG STRYEVAEAL EAAAIEELTN RFPDRPLRTN 
VEFWSAVVLD FAEVPAHMFT SMFTCARTAG WSAHILEQQR TGRLIRPSAR YVGPAPRPLG 
DVLPGVSRG