Gene Francci3_3390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3390
Symbol
ID	3905972
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4018557
End bp	4019699
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	68%
IMG OID	637880712
Product	phage integrase
Protein accession	YP_482473
Protein GI	86742073
COG category	[L] Replication, recombination and repair
COG ID	[COG4973] Site-specific recombinase XerC
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.457937
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCGTC CCAGTCTAGA TCTCGGTGTC GGCGGAAAGA TCTTCTACAG CGCCACGGCG 
AAGGGCTCCC GGGCACGCTG CTTCTACCGC GACCATGACG GGGTACGCCG CGAAGTCGAA 
CGCGGCGGCA CCTCCAAGGC GGCGGCCACA CGGGCACTGA AACTCGCGCT GCGTGACCGG 
CTGCGGGTCG CGGTCGGCGA CGGCGACATC ACACCGGAGA CGACTATGAA GGTCCTCGGT 
GAGGCGTGGT TTGCCGAACA GCAGAAGAAA GACCGCTCTC CCAACACCCT CGCGGCCTAC 
CGCACCACCC TCGACCGGCA CGTCTACCCC GCACTCGGCG GAGTGAAGGC CCGACAGGTC 
ACGGTCGGAA CCGCGGACCG GTTTTTCAGC GCGGTCACGA CCAAAAGCGG CCCCGGTGCG 
GCGCGGATCG CGCGAACAGT GCTGTCCGGC ATGTGCGCGA TGGCCGCCCG GCTCGACGCA 
ATGGACCGCA ACGTGGTCCG CGACGCCGGG CAGATCACCC GACCGGAACC GAAGCCGGTA 
TCCAAGGCGC TCGGCGCAGC CCAACTGCGG CAGTTGCGGG CGCTGCTCAC CTACGACGAA 
CGGGCGCGGC GCCGCGACAT CCCCGATCTT GTGGACATGC TCATCGCCAC CGGCGCGCGC 
ATCGGGGAGG TATGCGGGAT CGTCTGGGAC GCGGTCGACC TGGACGCGGG CACCGTGGAA 
ATCCGGTCCA CCGTGGTGCG GATTACCGGC CAGGGTCTGA TCAACAAGCC TCGTCCGAAG 
TCGAAGGCGG GCCACCGGCT GTTGCTACTC CCGGCCTGGG CCGTGGCCAT GCTGCGCACC 
CGCCACCACG GACAGAACAG TGACGAGGTG GTGTTCCCCG CGCAGATGGG CGGCCTACGC 
GACCCGAGTA ACACTCAGGC CGACATCCGC GACGCCGTGA ACGATGCCGG CTTCCCCGGC 
CTGACGTCCC ACCTGTTCGG CCGCAGGTCC GTTGCCACCC TCCTCGATGG GGATGGGCAT 
ACCCCCCGCC AGATCGCCGA TGTCCTCGGC CACGCCAACC CGTCCATCAC CCTGTCCACC 
TACATGGGCC GGAAGGTCTC GAACCCCGGC GCGGCGGAAA CCCTCGCGGT CCTGGCCATA 
TGA

Protein sequence

MARPSLDLGV GGKIFYSATA KGSRARCFYR DHDGVRREVE RGGTSKAAAT RALKLALRDR 
LRVAVGDGDI TPETTMKVLG EAWFAEQQKK DRSPNTLAAY RTTLDRHVYP ALGGVKARQV 
TVGTADRFFS AVTTKSGPGA ARIARTVLSG MCAMAARLDA MDRNVVRDAG QITRPEPKPV 
SKALGAAQLR QLRALLTYDE RARRRDIPDL VDMLIATGAR IGEVCGIVWD AVDLDAGTVE 
IRSTVVRITG QGLINKPRPK SKAGHRLLLL PAWAVAMLRT RHHGQNSDEV VFPAQMGGLR 
DPSNTQADIR DAVNDAGFPG LTSHLFGRRS VATLLDGDGH TPRQIADVLG HANPSITLST 
YMGRKVSNPG AAETLAVLAI