Gene Franean1_0231 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0231
Symbol
ID	5668656
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	283089
End bp	284270
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	73%
IMG OID	641239160
Product	chaperone DnaJ domain-containing protein
Protein accession	YP_001504604
Protein GI	158312096
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0484] DnaJ-class molecular chaperone with C-terminal Zn finger domain
TIGRFAM ID	[TIGR02349] chaperone protein DnaJ

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.208592
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.303974
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGTGTTC GCGACATGGT TGAAAAGGAC TACTACGCCG CTCTCGGTGT CCCCAAGGAC 
GCGTCCGCGG CCGACATCAA GAAGGCGTAC CGCAAGCTCG CCCGGGAGCT GCACCCGGAC 
AAGAACCCCG GGGATGTGAA GGCGGAGGCA CGCTTCAAGG AGGTGTCCGA GGCCTACGAC 
GTCCTCTCCG ACGAGAACCG CCGGCGGGAG TACGACGAGG CCCGGGCGCT GTTCGCCTCC 
GGCTCCTACC CGGGTGCGGG TGGGCGCGGC GGCGGCATGG GCGGGTTCGG GACGCCGGGC 
GGCTACGGCC CAGGTGCCGG GAACCTGAAC CTCGACGACC TGCTCAACGG CAACGGCGGC 
GGCGGGCTCG GCGGGATCTT CGACAACCTC TTCCAGCGGA CACCGACCGG GCGCGCCCCG 
CGCCGCGGCA CGGACATCGC GGCGGAGGTG ACCATCTCGT TCGAGAAGTC GCTGACCGGC 
CTCGAGGCGA CGGTGCGGCT GCCCGGGGCC GCCACCTGCG CCACCTGCGC CGGCATCGGG 
GCCCGCCCCG GGACGTCCCC CCGGACGTGC CCGGTCTGCC GGGGCCTCGG CGTGATCTCC 
CGGTCGCAGG GCGGGTTCGC GCTGTCCGAG CCGTGCCGCG ACTGCCTGGG CAAGGGCAGC 
CTGATCGACC ACCCCTGCCC CGACTGCCAC GGCACCGGCC GCCGCGAGCG CGAGCAGCGC 
ATCCGCATCC CGGCCGGGGT CAGCGACGGT CAGCGCCTGC GGGTACGCGG GCGCGGCTCG 
CCCGGCGAGC GCGGCGGCGC GGCCGGTGAC CTCGAGGTCA CCGTGCACGT GCAGAGCCAT 
CCCGTGTTCG GGCGGGAGGG CCACAACCTG ACGATCAACC TGCCGGTGAC GATCACCGAG 
GCGGCCCTGG GCGCCTCGGT GAAGGTACCG ACGATCGACG GCACCCCGCT GACGGTCAAG 
GTTCCGGCCG GCACCTCGAG CGGACGGCGG CTGCGTGCCC GCAACCGGGG CGTCCCGCGC 
CCCGGCGGGG AGAACGGTGA CCTCATCGTG ACGCTCGAGG TGACCGTTCC CAAGCCGTCC 
GAGCTCTCGC CGAAGGCGCG CACCGCGCTC CAGGAGTTCG CGCGGGCGCA TCCCGAGGAC 
CCTCGTGAAT CCCTGATAGC CCAGATGGAG GGACGGGCAT GA

Protein sequence

MSVRDMVEKD YYAALGVPKD ASAADIKKAY RKLARELHPD KNPGDVKAEA RFKEVSEAYD 
VLSDENRRRE YDEARALFAS GSYPGAGGRG GGMGGFGTPG GYGPGAGNLN LDDLLNGNGG 
GGLGGIFDNL FQRTPTGRAP RRGTDIAAEV TISFEKSLTG LEATVRLPGA ATCATCAGIG 
ARPGTSPRTC PVCRGLGVIS RSQGGFALSE PCRDCLGKGS LIDHPCPDCH GTGRREREQR 
IRIPAGVSDG QRLRVRGRGS PGERGGAAGD LEVTVHVQSH PVFGREGHNL TINLPVTITE 
AALGASVKVP TIDGTPLTVK VPAGTSSGRR LRARNRGVPR PGGENGDLIV TLEVTVPKPS 
ELSPKARTAL QEFARAHPED PRESLIAQME GRA