Gene Francci3_3503 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3503
Symbol
ID	3905237
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4181496
End bp	4182776
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	73%
IMG OID	637880825
Product	histone deacetylase superfamily protein
Protein accession	YP_482585
Protein GI	86742185
COG category	[B] Chromatin structure and dynamics [Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG0123] Deacetylases, including yeast histone deacetylase and acetoin utilization protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.678052
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.280253
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGTGTCC CGGGCGATTC CGAGCGGCGG ACCGACGGCC GTCCGCAGGT CGAGCCGCAG 
GTCGAGCCGA CGGTCGTGGC CTGGGATCCG GTCATGGCCG GCTACGACTT CGGGCCGACG 
CATCCGCTGC ATCCCGTGCG GCTCGAGCTC ACCATGGACC TCGCCATGAG TCTCGGTGTT 
CTCGACGCGC CGGGCATCCG GATCTCCAGG CCGACCCTCG CCTCCGACGA CCTCATCGGC 
CTGATCCACG ATCCGGTCTA CCTGAGCGCG GTCCGCGCCG CGCCCGACCC GGCGCAGGCC 
AGGTTCGCGG CCCTGTTCGG CCTGGGCACG GCCGACAACC CCATCTTCGA ACGGATGCAC 
GAGGCCGCCG CACTCATCAC CGGTGGCACG ATCGAGGCGG CACGGGCGGT GTGGAGCGGG 
CCGCCGCGGC ACGCCGTGTC GATCGCCGGC GGGCTGCATC ACGCGATGCC GGGAATGGCG 
AGCGGATTCT GCATCTACAA CGACCCGGCG ATCGCGATCG CCTGGTTGCT CTCCGCCGGA 
GCCGCCAGAG TGGCGTACGT CGACGTGGAC GTGCATCACG GCGACGGCGT GCAGACGGCG 
TTCTACGACG ATCCGCGGGT GCTCACCATC TCCCTACACC AGACGGGGAG TACCCTCTTC 
CCGGGCACCG GATTCCCGAC CGAGGTGGGT GCTCCCGCCG CGGAGGGCAC CGCGGTGAAC 
GTGGCGTTGC CCCCCGCCAC CGGCGATGCC GGCTGGCTGC GCGCCTTCTC CGGGGTGGTG 
CCGGTGCTCC TGCGGTCCTT CCGGCCGCAG GTGCTGGTGA CCCAGCACGG CTGCGACACG 
CACGCCTTCG ACCCGCTGGC CGATCTGGCG CTGTCGGTGG ACGGCCAACG GGCCTCCTAC 
GACCTGCTGC ACGCGCTGGC CCACGAGGTC TGCGACGGAC GCTGGCTGGC CTGCGGCGGT 
GGCGGGTACG CGCTGGACAC GGTCGTGCCG CGGGCCTGGA CGCAGCTGCT GGCGATCGCC 
GGCCACGTGC CCCTGGATGC CGGCCGCGCC CTGCCGGAGG ACTGGCGCTC CGCGGCGCCG 
GGACGGGTGC GGGCGGCGAC CGGGCAGAAG TCCGTCGGAG CCGCCGCCAT GCCCCGGACG 
CTCGGGGACG GGGTGAGTGT CCGGTATCGT CCCTGGGACG CGGGAGAGGG AGACCCCGAC 
GATCCGTTGG ACCGGACGGT GGCGGCGACC CGGCGTCAGG TGCTGCCGTT GCACGGCCTC 
GACCCCACCG TCGACCGCTG A

Protein sequence

MGVPGDSERR TDGRPQVEPQ VEPTVVAWDP VMAGYDFGPT HPLHPVRLEL TMDLAMSLGV 
LDAPGIRISR PTLASDDLIG LIHDPVYLSA VRAAPDPAQA RFAALFGLGT ADNPIFERMH 
EAAALITGGT IEAARAVWSG PPRHAVSIAG GLHHAMPGMA SGFCIYNDPA IAIAWLLSAG 
AARVAYVDVD VHHGDGVQTA FYDDPRVLTI SLHQTGSTLF PGTGFPTEVG APAAEGTAVN 
VALPPATGDA GWLRAFSGVV PVLLRSFRPQ VLVTQHGCDT HAFDPLADLA LSVDGQRASY 
DLLHALAHEV CDGRWLACGG GGYALDTVVP RAWTQLLAIA GHVPLDAGRA LPEDWRSAAP 
GRVRAATGQK SVGAAAMPRT LGDGVSVRYR PWDAGEGDPD DPLDRTVAAT RRQVLPLHGL 
DPTVDR