Gene Francci3_3673 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3673
Symbol
ID	3905357
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4404196
End bp	4405866
Gene Length	1671 bp
Protein Length	556 aa
Translation table	11
GC content	69%
IMG OID	637880999
Product	heat shock protein 70
Protein accession	YP_482754
Protein GI	86742354
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0443] Molecular chaperone
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.192305
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.510271
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCAGGCA CCAAGGTGTT CGGGATCGAC CTGGGCACGA CCTACTCCTG CATTGCCCAG 
GTCGACGAGT ACGGCCGACC GGAAGTGATC CGCAACATCG AGTCCCAGCC GACGACGCCT 
TCGGTCGTCC TGTTCGACAC TGGGGCGGAG GGCCCAACCT CTTTCGTGGT GGGAACCCAG 
GCCAAGCGCC AGGCTCGCAT CCGTCCCGAC GATGTCGCCC GGCTGGTCAA GCGGCACATG 
GGCGCGTCGG ACTGGCGGTT CGTGGCGCAT GACGAGGAGT ACAGCGCCGC CGCGGTGTCG 
AGCCTGGTGC TCAAGGCGCT CGCTGCGGAC GCCGAACGCG CGACCAGTGT CCCGGTCACC 
GATGTAGTGA TCACCGTGCC CGCGTACTTC GGTGACGAGG AGCGCAAGGC GACGAAGCTG 
GCCGGCGAGC TCGCCGGCCT CAACGTGGTC GACATCATCA ACGAGCCGAC CGCCGCCGCC 
TTCGCCTACG GATTCGGCCA GGACGGGGCC GAGGAGTCGA CCGTGCTGGT CTACGACCTC 
GGCGGTGGCA CATTCGACAC CACGGTCATC AGGCTGAGCG AGGGCGCGAT CACCGTGGTC 
GCCACGGATG GCGACCACGA GCTGGGCGGT GCGGACTGGG ACAACGAACT CGTCCGCTAC 
CTGGCGCAGA AGTTCACCGA GGCGCAGCCC GACGCGGGCG ACCCGCTCGA CGACGTCTAC 
GACGAGCAGG AGCTGCTGGC CGCGGCCGAG GACGCGAAGC TGGCGTTGTC CGGCCGGGAC 
AGCGTCGACG TGCTGGTCGT GCACAACGGC AGGCGCACAA GCGTGCCGGT GACCCGGACC 
GTCTTCGAGG AGATCACCGG CCCGCTGCTG CGGCGCACCA TCGACCTGAC CGGCTCGGTG 
CTGGCGCGAG CCCGGGAGAA GGGTGTCGAG AAGATCGACT TGTGCCTGCT GGTGGGGGGC 
ATGAGCAAGA CACCGGCGGT GGCCCGCCGG CTGCAGGAGT CCTTCGGGCT CACCTCTCGG 
CTTGCCGATC CCGATCTCGC CGTCGCCAAG GGCGCCGCGG TGTACGGGCA GAAGAAGGCA 
CTGGAGCGCG AGGTCCACGC GGACCTGGTC GCCAGCGGGC ATCTACGTCC CGACCAGGAA 
CTCGCCGCAG CCGACGCCGT GGACGTGGAG AAGGCGGCCG CAGCCAGCGC CGAGGAGGCG 
GGACTCTCGA CCGCCTCCGT GGTCGATCTC GTCCGCACGA AAGTGACGAA CGTCACGTCA 
CGTGGCTTCG GGATCTTCGC CGAGGACCGG GGCACACCGG TCGCGGCCTT CCTCGCCCAC 
CAGAACGACC CGCTGCCTAT CGCCGTCACC CGGACCTTCT ACACCGTCGT CGACGATCAG 
GCCGAGGTGG ACATCCGGGT CTTCGAGCAG GGCACCACCG CCGAGTCCAC GGCGATCGAC 
GACAACAAGG TGATCGTCGC CGGCTCCATC AGCGGGATTC CGCCTGGCCA CCCGTTGGGC 
ACCCCCGTTG AGGTGACCTT CACGATGGGC GGGGACCAGA CGATCCAGGT CACCGCCTCG 
CACGAGGGCG CGGCCACCCC CTTGGTGCTC GAGGTGCGCG CCGGGGTCGG CTCGGAGGAG 
ATGCGGGCCG TCGAGTCGGC GAAGGTCAGC CTGCTCAAGC AGCGGGACTG A

Protein sequence

MAGTKVFGID LGTTYSCIAQ VDEYGRPEVI RNIESQPTTP SVVLFDTGAE GPTSFVVGTQ 
AKRQARIRPD DVARLVKRHM GASDWRFVAH DEEYSAAAVS SLVLKALAAD AERATSVPVT 
DVVITVPAYF GDEERKATKL AGELAGLNVV DIINEPTAAA FAYGFGQDGA EESTVLVYDL 
GGGTFDTTVI RLSEGAITVV ATDGDHELGG ADWDNELVRY LAQKFTEAQP DAGDPLDDVY 
DEQELLAAAE DAKLALSGRD SVDVLVVHNG RRTSVPVTRT VFEEITGPLL RRTIDLTGSV 
LARAREKGVE KIDLCLLVGG MSKTPAVARR LQESFGLTSR LADPDLAVAK GAAVYGQKKA 
LEREVHADLV ASGHLRPDQE LAAADAVDVE KAAAASAEEA GLSTASVVDL VRTKVTNVTS 
RGFGIFAEDR GTPVAAFLAH QNDPLPIAVT RTFYTVVDDQ AEVDIRVFEQ GTTAESTAID 
DNKVIVAGSI SGIPPGHPLG TPVEVTFTMG GDQTIQVTAS HEGAATPLVL EVRAGVGSEE 
MRAVESAKVS LLKQRD