Gene Francci3_0001 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0001
Symbol
ID	3902947
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	35
End bp	1723
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	68%
IMG OID	637877331
Product	chromosomal replication initiator protein DnaA
Protein accession	YP_479125
Protein GI	86738725
COG category	[L] Replication, recombination and repair
COG ID	[COG0593] ATPase involved in DNA replication initiation
TIGRFAM ID	[TIGR00362] chromosomal replication initiator protein DnaA

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.0000000690317
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCAACC TCCGCGCCGA CTCCGTCGCC GGTCTGCCGT TCGGGGACGA GCCTTCGGGT 
GACCCGGACC TGGCCGCGGT GTGGAGCCAG GCCGTCGCCG GGGTCGCCGA CGGCACGCTG 
TCCGCCCAGC AGCGTGCCTG GCTGCGGCTG ACCCGCCCCC TCGGGCTCGT CCAGGACACG 
GCTCTGCTGG CCGCGCCGAA CGAGTTCACC AAGGATCTCC TCGACTCGCG CCTGCGCCCC 
TTCTTGTCCA CAGCGTTGTC CACAGCCTAT GGGCGGGAGA TCAGGGTCGC GGTCACCGTC 
GAACACCTGC CCGATCCGGA ACCAATGAGC GGACCGATCC GGATCGTACG GCCGGTGGAT 
GCCAGGGGCG ACACCACACC CGGCCAGGGC TCGGGCCCCG CCTCCGGTTC GGCGTTGAAC 
GCGGGTACCG GATCAGGATC GACCGGCGCC GCCGCAGCCC CGGTGCCGCC GACGAGCCCG 
GGCTCGTCGG CGGTGCCGGT GCCGGCGCCG GCACCGGCAC CAGTGCCGCC GGCGCCGGCG 
GCACTGGTGA ACGGCGAACT GCCCTTCCCC GACGCCACCG AGGGAACACC ACCGGTACGG 
GTCAGCGCGG GTCTCGGACG CGATGCGGCG CCGCACGAGA CCGAACCGGC CCAGGCCCGG 
CTGAACCCCC GCTACATTTT CGAGACGTTC GTCATCGGCG ACAGCAACCG GTTCCCCCAC 
GCGGCAGCGG TGGCCGTCGC CGAGGCACCC GCGAAGGCCT ACAACCCGCT TTTCATCTAC 
GGGGACTCCG GGCTCGGCAA GACTCACCTT CTGCACGCGA TCGGTCACTA CGCACTCAAG 
CTCTACCCGA ACATGCGGGT GAAGTACGTG AGCTCCGAGG AGTTCACCAA CGACTTCATC 
AACTCGATCC GGGACGACCG CCAGCAGGCG TTCCAGCGGC GCTACCGTGA CATCGATGTC 
CTGCTCGTTG ACGACATCCA GTTCCTGGAG AACAAGGAAC GGACGCAGGA GGAGTTCTTC 
CACACCTTCA ACGTCCTGCA CGACGGCGAG AAGCAGATCG TGATCAGCTC CGACCGCTCG 
CCCAAGCAAC TCTCGGCCCT GGAGGACCGG CTGCGCAGCC GCTTCGAGTG GGGGCTGATG 
ACCGACATCA CCCCGCCCGA CCTCGAGACG CGCATCGCCA TCCTGTCGAA GAAGGCGGCT 
ACGGAGCGCC TGCCGGTACC CCCGGATGTC CTCGAGTACA TCGCCACGCA CATCGAGCGC 
AACATCCGTG AGCTGGAGGG GGCGCTGATC CGGGTCGCGG CCTTCGCGAG CTTGAACAAG 
TCCCACGTCG ACCGCACGCT CGCCGAGATC GTGCTGCGTG ATCTCATCCC CGATGCCGGC 
AATCCCGACA TCACGGCCGC CGCCATCATG AACGCGACGG CGGCGTACTT CGGCGTCTCG 
ATGGAGGACC TGTGCGGCAC CTCACGTAGC CGCGTGCTGG TCACCGCCCG TCAGATCGCG 
ATGTACCTGT GCCGGGAGCT GACCGACCTG TCGCTACCGA AGATCGGCCA GCACTTCGGG 
GGTCGGGATC ATACGACGGT CATGCATGCC GATCGCAAGA TCCGCGGTCT GATGGCGGAA 
CGGCGCGCGA TCTACAACCA GGTCACCGAA CTGACAAACC GCATCCGTCT GCAGGCCCGG 
CAGGCCTAG

Protein sequence

MSNLRADSVA GLPFGDEPSG DPDLAAVWSQ AVAGVADGTL SAQQRAWLRL TRPLGLVQDT 
ALLAAPNEFT KDLLDSRLRP FLSTALSTAY GREIRVAVTV EHLPDPEPMS GPIRIVRPVD 
ARGDTTPGQG SGPASGSALN AGTGSGSTGA AAAPVPPTSP GSSAVPVPAP APAPVPPAPA 
ALVNGELPFP DATEGTPPVR VSAGLGRDAA PHETEPAQAR LNPRYIFETF VIGDSNRFPH 
AAAVAVAEAP AKAYNPLFIY GDSGLGKTHL LHAIGHYALK LYPNMRVKYV SSEEFTNDFI 
NSIRDDRQQA FQRRYRDIDV LLVDDIQFLE NKERTQEEFF HTFNVLHDGE KQIVISSDRS 
PKQLSALEDR LRSRFEWGLM TDITPPDLET RIAILSKKAA TERLPVPPDV LEYIATHIER 
NIRELEGALI RVAAFASLNK SHVDRTLAEI VLRDLIPDAG NPDITAAAIM NATAAYFGVS 
MEDLCGTSRS RVLVTARQIA MYLCRELTDL SLPKIGQHFG GRDHTTVMHA DRKIRGLMAE 
RRAIYNQVTE LTNRIRLQAR QA