Gene Francci3_3809 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3809
Symbol
ID	3905557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4566464
End bp	4568413
Gene Length	1950 bp
Protein Length	649 aa
Translation table	11
GC content	74%
IMG OID	637881135
Product	DEAD/DEAH box helicase-like
Protein accession	YP_482888
Protein GI	86742488
COG category	[J] Translation, ribosomal structure and biogenesis [K] Transcription [L] Replication, recombination and repair
COG ID	[COG0513] Superfamily II DNA and RNA helicases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.130283
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.862178
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCACCTC GGCCGCCGTG TAGCAGGCGT CGCCTCGTCA CCTGTGCACC CAGAGTTGCC 
ATCGAGGGCA CCGGGGCACA TGGATTTTCG GGTCGCGGGC GCCGCGCGGC TCACCGCGAG 
CGGGTTCAGC GTAGACACCG CTCAGAGAAG ACCAGGAGCG TCCCGCTGTC CGTCACAGCT 
GAAGTACCCA CAGATGATCT GACTCCCTAC GAGCCACAAA CCACCCCCTC CACCCCCGGG 
TCCCCGGCGG CACCGACCTT CGCGGAGCTC GGCGTGCGCG CCGAGACCGT CTCGGCCCTG 
ACCGAAGCGG GCATCGTGCA CGCTTTCCCC ATCCAGGAGT TGACGCTTCC ACTCGCCCTG 
GCCCGCAACG ACATCATCGG GCAGGCCCGC ACCGGCACCG GCAAGACCCT CGCGTTCGGC 
GTCCCGGTGG TGCAGACGGT GCTGGCGGCC AAGGAGGGTG CCGACGGCCG TCCGCAGGCC 
CTCGTCGTGG TGCCCACCCG TGAGCTGTGC GTCCAGGTGA CCGCGGACGT CACCCGCGCC 
GGCGCCCGCC GTGGCCTGCG GGTGCTGTCC GTCTACGGCG GGCGTGCCTA CGAGCCGCAG 
CTGTCCGCGC TGCGCGCCGG GGTCGACATC GTCGTCGGCA CGCCCGGCCG CCTGCTGGAT 
CTCGCCCGCC AGCACGTGCT CGACCTGGCC GGCGTCGGCA CCCTGGTGCT CGACGAGGCC 
GACGAGATGC TCGACCTCGG CTTCCTGCCG GACGTCGAGC GCATCATGTC GCAGCTGCCG 
ACCGAGCGGC AGACGATGCT GTTCTCCGCG ACCATGCCCG GCCCGGTCAT CTCCCTGGCC 
CGGCGGTTCA TGAAACGGCC CGTGCACGTC CGCGCGGAAC AGCCGGATGA GGGGCGCACG 
GTCCCGACCA CCCGTCAGCA CGTCTTCCGC GCCCACGCGC TGGACAAGAT GGAGGTGCTG 
GCCCGGGTCC TGCAGGCCGG CGGCCGGGGG CTCGCCATGG TGTTCGTGCG GACCAGGCGC 
ACCGCGGACA AGGTCGCCGA GGACCTCGCC AAGCGCGGCT TCGCGGCCGC GGCGGTGCAC 
GGCGACCTGG GCCAGGGCCA GCGCGAGCAG GCGCTGCGCG CCTTCCGCTC CGGCAAGGTC 
GACGTCCTGG TCGCCACCGA CGTGGCCGCC CGGGGCATCG ACATCAACGG TGTCACCCAC 
GTGGTCAACT ACCAGTGCCC CGAAGACGAG AACGTCTATC TGCACCGCAT CGGCCGCACC 
GGTCGGGCGG GCGAGAGCGG GGTGGCCATC ACCTTCGTCG ACTGGGACGA CCTGCCGCGG 
TGGACGCTCG TCAACAAGGC GCTCGCCCTG CCGTTCGATG GCCCGGTGGA AACCTATTCC 
ACCTCCCCCC ACCTGTACGA GGCGCTCGGC ATCCCGGCGG GCGCGAAGGG CACCCTGCCG 
CACGCGGCGC GGACCCGCGC CGGGCTCGCG GCCGAGGACA TCGAGGATCT CGGGCAGTCC 
GGTCGCGGCG GGCGCCGCGG CTCGCGGACC GGGCGTGACC AGGACCGTTC CGAGCCGGCG 
GCGGTGCCGA CCCGGACTCG CGCCCGTCGG CGCACCCGCG GCGGTGGTGC GGCGGCCGCG 
GGTGCGGGGC TGGCCATCGC CGCGGACCCG GCGGACCCGG CGGACCCGGT CGACGAGGAC 
GGCCGGAAGG CCGGCGCACC CGTGGTGGAC GGTGCCGGGC AGACCGGGCT GGTCGAGTTC 
ACCGGGACCG CCCCGCTCAC CGACACGGAC ACCGACACCG CCCGCGTCGT CTCCGCCCTG 
GCCTCGGAGA CGGGCGTCGA GGCCGAGGAG TCGCCGCGCC GCCGGCGCCG GCGGCGCGGC 
AACCGTGGCC GCGGCACGGG CACGATGCGG GAGGCCGGCG ACGGCACCGA GGCCGACGCC 
GACGCGCCAC CCCGAGCCGA GTCGGCCTGA

Protein sequence

MSPRPPCSRR RLVTCAPRVA IEGTGAHGFS GRGRRAAHRE RVQRRHRSEK TRSVPLSVTA 
EVPTDDLTPY EPQTTPSTPG SPAAPTFAEL GVRAETVSAL TEAGIVHAFP IQELTLPLAL 
ARNDIIGQAR TGTGKTLAFG VPVVQTVLAA KEGADGRPQA LVVVPTRELC VQVTADVTRA 
GARRGLRVLS VYGGRAYEPQ LSALRAGVDI VVGTPGRLLD LARQHVLDLA GVGTLVLDEA 
DEMLDLGFLP DVERIMSQLP TERQTMLFSA TMPGPVISLA RRFMKRPVHV RAEQPDEGRT 
VPTTRQHVFR AHALDKMEVL ARVLQAGGRG LAMVFVRTRR TADKVAEDLA KRGFAAAAVH 
GDLGQGQREQ ALRAFRSGKV DVLVATDVAA RGIDINGVTH VVNYQCPEDE NVYLHRIGRT 
GRAGESGVAI TFVDWDDLPR WTLVNKALAL PFDGPVETYS TSPHLYEALG IPAGAKGTLP 
HAARTRAGLA AEDIEDLGQS GRGGRRGSRT GRDQDRSEPA AVPTRTRARR RTRGGGAAAA 
GAGLAIAADP ADPADPVDED GRKAGAPVVD GAGQTGLVEF TGTAPLTDTD TDTARVVSAL 
ASETGVEAEE SPRRRRRRRG NRGRGTGTMR EAGDGTEADA DAPPRAESA