Gene Francci3_2603 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2603
Symbol
ID	3906509
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3071746
End bp	3073308
Gene Length	1563 bp
Protein Length	520 aa
Translation table	11
GC content	74%
IMG OID	637879928
Product	cobyric acid synthase
Protein accession	YP_481694
Protein GI	86741294
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1492] Cobyric acid synthase
TIGRFAM ID	[TIGR00313] cobyric acid synthase CobQ

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.478422
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.158438
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGGGG GACTGCTGGT CGCCGGGACC GCGTCGGATG CCGGCAAGAG CGTGCTGACC 
GCGGGGATCT GCCGGTGGCT GGCGCGGGAG GGGGTGCGGG TCGCCCCGTT CAAGGCGCAG 
AACATGGCGT TGAACTCGGC GGTCACCGCC GATGGTGCGG AGATCGGCCG GGCCCAGGCG 
ATGCAGGCGG CGGCGGCCGG TGTCGAACCG GAGGCGGCGA TGAACCCGGT GCTGCTCAAA 
CCGGGGGGCC AGCGGCACAG CCAGCTCGTT GTGCTGGGCC GCCCGGTCGC CGAGGTCGAC 
GCGCTCGGCT ACCGCCCGTA CAAGGAACGG CTGGCCGCGA TTGTCCTGGA GTGCCTGGAC 
GACCTGCGCG GCCGGTTCGA CGCGGTGATC TGCGAGGGGG CCGGTTCTCC GGCGGAGATC 
AACCTGCGTT CGACCGACAT CGCCAACATG GGCCTGGCGC GCGCCGCGAA CCTGCCGGTG 
ATCGTGGTCG GCGACATCGA CAAGGGCGGG GTCTTCGCCG CCCTGTTCGG CACGCTGGCC 
CTGCTCGATG CGGCCGACCA GGCGTTGGTT GCCGGCTGGG TGATCAATCG GTTCCGTGGC 
GACGCCCGAC TGCTCGAACC CGGACTGCGC CAGATCGAAC GGCTCACCGG CCGGCCGGTG 
CACGGCGTCG TCCCCTGGAA GGCGGGGTTG TGGCTGGACG TCGAGGACTC CCTCGACCTC 
GCTGCCTTCC CCGACGCCGA GCCCTGTCCC GACGCCGAGC CCTGTCCCGA CGCCGAGCCC 
TGTCCCGAGG CGCGGCCTGC CTCGCACGGC GGTCGGCGGG AGGTGCTGCG GGTCGCCGTC 
ATCCGGCTGC CCCGGCTGTC GAACGTGACC GACATCGACG CGTTGCGCGT CGAGCCCGGG 
GTCGCGGTGC GCCTGGCCAC CCGACCGGAC GAGCTCGCCG ACGCCGACCT CGTGATCCTG 
CCGGGCACCC GTTCCACCGT CGAGGACCTG CGCTGGCTGC GTCGCCGTGG TCTCGCCGCG 
GCCCTCGCCG AACGCGCCGC CGCGGCCCGT CCGGTGCTGG GTATCTGTGG CGGCTACCAG 
ATCCTCGGCC GTCGCATCCG TGACGACGTC GAATCGGGTG CGGGCGAGGT CGATGGTCTC 
GGCCTGCTCC CGGTCATCAC CACGTTCGAC CCGGTGAAGC TGCTCGGTCG GCGCGCGGCC 
ACCGATGCCG CCGGCCGACC GCTGACCGGC TACGAGATCC GGCACGGGCG GCTGACCGTC 
GAGGAGCATC CGGACAGCGC GCCGTTCGCC GCGGACGGGG TGCGCGTCGG CGCGGTCGCC 
GGCACGAGCT GGCACGGGGT GCTGGAGAAC GACGCGTTCC GCCGCGCCTA TCTCGCCGAC 
GTGGCCACGG CCGCGGGGCG TTCGTTCGTC CCGGCGTTCA CGTGCTTCGC CGATGCTCGG 
CAGCGCCGCC TCGACGCCCT CGGTGACCTC GTCGCCGACC ATCTCGACAC AGGCGCCCTG 
CGCCGCCTGC TCGCCGAGGG CACACCCGCC GGCCTGCCGT TCGTCCCCCC CGGCGCATCC 
TGA

Protein sequence

MSGGLLVAGT ASDAGKSVLT AGICRWLARE GVRVAPFKAQ NMALNSAVTA DGAEIGRAQA 
MQAAAAGVEP EAAMNPVLLK PGGQRHSQLV VLGRPVAEVD ALGYRPYKER LAAIVLECLD 
DLRGRFDAVI CEGAGSPAEI NLRSTDIANM GLARAANLPV IVVGDIDKGG VFAALFGTLA 
LLDAADQALV AGWVINRFRG DARLLEPGLR QIERLTGRPV HGVVPWKAGL WLDVEDSLDL 
AAFPDAEPCP DAEPCPDAEP CPEARPASHG GRREVLRVAV IRLPRLSNVT DIDALRVEPG 
VAVRLATRPD ELADADLVIL PGTRSTVEDL RWLRRRGLAA ALAERAAAAR PVLGICGGYQ 
ILGRRIRDDV ESGAGEVDGL GLLPVITTFD PVKLLGRRAA TDAAGRPLTG YEIRHGRLTV 
EEHPDSAPFA ADGVRVGAVA GTSWHGVLEN DAFRRAYLAD VATAAGRSFV PAFTCFADAR 
QRRLDALGDL VADHLDTGAL RRLLAEGTPA GLPFVPPGAS