Gene Francci3_4034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4034
Symbol
ID	3906995
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4819024
End bp	4820157
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	70%
IMG OID	637881363
Product	putative cyclase
Protein accession	YP_483113
Protein GI	86742713
COG category	[R] General function prediction only
COG ID	[COG1878] Predicted metal-dependent hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.368561
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGTCCT CGGGGAGTGT TGCCTCCTGG GATCCTGGGC ATGCCTGGCC CCCTCGGCCC 
GCCTTCGGCC GCCCCGGGCT CCGGGGGCGG ACACCGGATG GAGATCATCG TCTCGTGAGC 
ACCGAGCTGA TCGATCTGTC GGTACCCATC GTGACCGGCA TGCCCGTCTA CCCGGGGGAT 
CCCGAGGTCG ACGTGTCACC GGCACTGACC ACGGCCGAGT CCGGCGTCAA CGTGCAGCGC 
CTGCACCTGG GATCACAGAC GGGCACGCAT GTCGACGCCC CCTTCCACAT CGACGACTCG 
CTGCCCAGGC TTGACGAGGT TCCGCTTCAA CGTTTCACCG GACCCGCGGT TCTGCTGGAC 
GCGCGGGGCT ACGGTCCACA GGCGGCGATC GGCCCGGAGG TGCTATCAGG CCCCTTTACC 
CGCCCGTTTC CTCACGATGT CGTCGTCCTC ATCGTCACAG GATGGTCCGT CCACTGGGGC 
CACGACGGGT ACCTACGACA TCCCTATCTC GCGCCGGACA CCGCGCGGGC CCTCGTCAAC 
GCGGGTGTCC GGACGGTCGG TATCGATGCG CTCAGCGTTG ATCGAACACC CGGACCGGGC 
CAGGATGTCA GTCTCGCGGC CCACCGGATT CTGGGTGGGG CCGGTGCCGT CATCGTAGAG 
AACCTGACCA GTCTCGATCG ACTTCTCACC GCCCGGGCGA ACGGACGGCC CATCCACATC 
GTCCTGTTCC CGATTCCGCT CGCCGGAGCC GACGGTGCCC CGGTCCGGGC AGTCGCAAGC 
GTCGGCCCCG CGGATCAGCT CCCCACCGCG TGCCGTCGCA GCAGCGGGTC GAGTTCGCCG 
GACGTGTCCC CCACGACGTT CCCGCCCGCC GGTGACGCAT CGGCCGTCGG CCCGGCCGGC 
GTCGCCGTAC CCGAGGGCAT GATCCCGGTG GGAGCCACCA GCCCACCGTG CGTCCCCGGG 
GGGTTCACCT GTACCCGGCC GGGACGTGAG GTGGTCGAGC GCGTGCCCAC GCGGGGCGCG 
GACCGGATGG CCGGCCGGGC CGAGGCCACG TCCACACCGA CGACACCGTC CACACCGACA 
ACACCGTCCA CACCGACAAC ACCGTCCACA CCGTCCACAC CGGTCTCGCC GTAG

Protein sequence

MTSSGSVASW DPGHAWPPRP AFGRPGLRGR TPDGDHRLVS TELIDLSVPI VTGMPVYPGD 
PEVDVSPALT TAESGVNVQR LHLGSQTGTH VDAPFHIDDS LPRLDEVPLQ RFTGPAVLLD 
ARGYGPQAAI GPEVLSGPFT RPFPHDVVVL IVTGWSVHWG HDGYLRHPYL APDTARALVN 
AGVRTVGIDA LSVDRTPGPG QDVSLAAHRI LGGAGAVIVE NLTSLDRLLT ARANGRPIHI 
VLFPIPLAGA DGAPVRAVAS VGPADQLPTA CRRSSGSSSP DVSPTTFPPA GDASAVGPAG 
VAVPEGMIPV GATSPPCVPG GFTCTRPGRE VVERVPTRGA DRMAGRAEAT STPTTPSTPT 
TPSTPTTPST PSTPVSP