Gene Francci3_3584 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3584
Symbol
ID	3904138
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4283869
End bp	4285209
Gene Length	1341 bp
Protein Length	446 aa
Translation table	11
GC content	72%
IMG OID	637880905
Product	DNA processing protein DprA, putative
Protein accession	YP_482665
Protein GI	86742265
COG category	[L] Replication, recombination and repair [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0758] Predicted Rossmann fold nucleotide-binding protein involved in DNA uptake
TIGRFAM ID	[TIGR00732] DNA protecting protein DprA

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCTCGA CGACTCCGCC GGATGCCCGG GGGGCGGATC CCGCTTCCGC GCCCGGGAGG 
GTGGCACCGG GTGACAGCGA CTGGTCGGAT CCCGAGCGGT TGGCCCGTGT CGCCCTGGCT 
CGCGTCTTCG GCCCGGAACA TCGTCGCGTG GCCGTCGAGG TCAGGCGTCG GGGTGCGTTC 
GAGGTGTGGA ATGCGCTCCG GGCGGCGCAT CCGAGTGTCG ATCCGGTTCG GGACCTGGAC 
GCGGCATGGC GCGCCGGCGC CCGGCTGGTC TGTCCCCAGG ACGCCGAGTG GCCCCTCGAA 
CTGGATGCCC TGGACCGCCT TCGGGACGCG GGGGATGGTT CGATGATCGG CACTCCACTG 
GCTCTGTGGG TTCGCGGTCC GCTCAACCTG AGCGAGCTCC CACCCCGGGC GGTCACAGTC 
GTGGGCTGCC GGACCGCGAC CAGCTACGGG CTGCATCTCG CCGGAGAGAT CGCGTTTGCG 
ATGGCGGAAC AGGGATGGGC CGTGGTGTCG GGAGCCGCGT TCGGCATTGA CGCAGCGGCA 
CATCGGGGGG CGTTGGCCGC AGCCGGACCG ACGGTGGCGG TGCTCGCCGG GGGTGTTGAC 
GTTCCCTACC CGACCGCCCA TGTGGAACTG CTGGAGGAGA TCGCCCGTAC CGGGGCGGTA 
GTCAGCGAGG TGTCGCCGGG CACGCCGCCG TACCGACGCC GATTCCTCAC CCGTAATCGC 
ATCATCGCGG CTCTGTCCCG GGGGACGGTC CTGGTCGAGG CGGGCCACCG TAGCGGCGCG 
CTGAACACGG TCGCCCACAC CCGTCGGCTC GGTCGTCCCG TCATGGTCGT TCCGGGACCG 
GTGACCAGCG CCATGAGCGC AGGCTGTCAC CGGCTGCTCC GGGACTTCCG TGAACAGACG 
GTTCTGGTCA CCGGGGCCGA GGACATCAGG GAGGAAATCG CGAGTATCGG ATCGCTCGTA 
CAGCGGCCGG CGAGCGGGAA TGGCCCGCGG GACGGATTGT CCGAGGCGGT GCGCGAGCTT 
CTCGACGCGA TGCCGGCCCG CGCTGCCGTC GGGGTGTCCG TGCTGGCGCG CCGCACCGGC 
CTGCGCCCCG AGGCGGTGCT GGCGATGCTG GGCCCACTCG CGGTGGAGGG GCTGGTCGAG 
AACGTGGCGG GCGGTTACCG CCTCACGGAT CTGGGCCGAG CGCCGTCGAA CCCGTCCCAT 
CCCGCAACGT CCGGCAGGAG GTCCGGTACC CAACCGGGTG CCGCCCACGG CGGGGCGGAT 
CGTTCCCCGA CGCGCAGTAC CGCGGATCCG GGACTCGACG GGGAAAACCC CGACGGCGAA 
AACCCCGACG GGGAGACCTG A

Protein sequence

MSSTTPPDAR GADPASAPGR VAPGDSDWSD PERLARVALA RVFGPEHRRV AVEVRRRGAF 
EVWNALRAAH PSVDPVRDLD AAWRAGARLV CPQDAEWPLE LDALDRLRDA GDGSMIGTPL 
ALWVRGPLNL SELPPRAVTV VGCRTATSYG LHLAGEIAFA MAEQGWAVVS GAAFGIDAAA 
HRGALAAAGP TVAVLAGGVD VPYPTAHVEL LEEIARTGAV VSEVSPGTPP YRRRFLTRNR 
IIAALSRGTV LVEAGHRSGA LNTVAHTRRL GRPVMVVPGP VTSAMSAGCH RLLRDFREQT 
VLVTGAEDIR EEIASIGSLV QRPASGNGPR DGLSEAVREL LDAMPARAAV GVSVLARRTG 
LRPEAVLAML GPLAVEGLVE NVAGGYRLTD LGRAPSNPSH PATSGRRSGT QPGAAHGGAD 
RSPTRSTADP GLDGENPDGE NPDGET