Gene Francci3_3788 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3788
Symbol
ID	3906073
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4539356
End bp	4541080
Gene Length	1725 bp
Protein Length	574 aa
Translation table	11
GC content	73%
IMG OID	637881115
Product	hypothetical protein
Protein accession	YP_482868
Protein GI	86742468
COG category	[R] General function prediction only
COG ID	[COG0661] Predicted unusual protein kinase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.75918
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.724918
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGAGA TCCCACGGCG GGCCGTCGTC CGCACCGCCA AGCTGGCCAC GCTTCCCATC 
GGAATAGCCG GCCGAGCCAC CCTCGGCGTC GGCAAACGCA TCGGTGGTCG CCCCGCCGAG 
GCCGTCGCCT CCGAGCTCCA GCAGCGCACC GCCGCGCAGA TCTTCCGGGT GCTCGGGGAG 
CTCAAGGGTG GCGCCATGAA ACTGGGCCAG GCGCTGTCCG TCTTCGAGGC GGTGCTTCCC 
GACGACGTCG CCGGGCCATA CCGGGCGGCG CTGACCAGGC TGCAGGAGGC GGCGCCCCCG 
CTGCCGGCGG CAGTGGTGCA CCGCGTGCTC GCCGAGGAGC TCGGAGCGGA CTGGCGCTCG 
CTGTTCACGA GCTTCGACGA CGTTCCGGCG GCGGCGGCCA GCATCGGCCA GGTGCATCGG 
GCGGTCTGGG CTGACGGCCG AGCCGTCGCG GTGAAGGTGC AGTATCCGGG AGCGGGTCCC 
GCTCTGCTCG CCGATCTCAC CCAGCTCGGC CGGGCCGCTC GGCTGTTCGG CGCGGTCACT 
CCCGGATTGG ACATCAAGCC GCTGGTCGAG GAGCTCAAGG CCCGAATCGC CGAGGAGCTC 
GACTATCGGT TGGAGGCCGC CTGGCAGGGG GCCTTCGCCG AGGCGTACGC GGACGAGCCG 
GACGTCGTCA TCCCCCGGCC GCTGGCCGGT TCTGGCCGGG TGCTCGTGAG CGAGTGGATC 
GAGGGAATAC CCCTGTCCGT CATCATCGCG GACGGTACCC CGCAGCAGCG CGACACCGCC 
GGCCTGCTGC TCGTGCGGTT TCTCTATTCC TGCCCGGGTC GCGCCGGTCT GCTGCACGCT 
GATCCGCATC CCGGCAACTT CCGCCTGCTG TCCGACGGGC GGCTCGGCGT CCTGGACTTC 
GGCGCCGTGA ACCGCCTGCC GGACGGCCTG CCGGCGCCGA TCGGCCGGCT GGCTCGACAG 
ACCCTGGCCG GGGACGCCGA CGCCGTCGAG CAGGGACTGC GCCGCGAGGG CTTCATCCCG 
CCGTCGGCCG AAATCCGAGC CGAGGACCTG CTGGATTATC TGGCCCCGAT GCTGGAGCCG 
ATCGCGGTGG AGGAGTTCAC CTTCTCCCGA GGCTGGCTGC GCAAGGAGGC CGCCAGGCTC 
GGAGACTGGC GGTCGGCGGC GGCACAGCTC GGTCGCCAGC TCAATCTGCC GCCGTCGTAC 
CTGCTCATCC ACCGGGTGAC ACTCGGCGCG ATCGGCATCC TGTGCCAGCT GGGCAGCACC 
GGCCGCTTCC GGGACGAGAT GGAGCGCTGG CAACCCGGGT TCGCCGAACC GGGGACGGCG 
ACCGCCCGCG CGGCCGAGGA CGCCAACCGG CCCGGTCGTC CCCTGCCCGC TCTCCCCGTC 
CAGGACGAGG CCGGAATCGT CCGGCCGCTG GACGGCCCGG TCGTTCTGGC CGGCGGGTTG 
CCCGGCCCGC GCAAACCCCG CAGACCAGGA CGGACCGGCA GGACGACCAA GGCCCGCAAG 
GCCGGGAGGT CGGCGGCCGA CACCGCTCCG GCGACTGCCG ACGACCGGGC CACCGCCCCC 
GCGGCGCTGC CCCTACAGGC CGAGCCGGCC GAACCGAGCC GGCCCTCTAC CCCGGCGAAC 
CGCTCCGCCG CGGCTCGACC CGGGTCGGGC CGCAAGGCCG CCCCGCGCCG GGCACCGGAC 
GAGGAGTCGT TCTCCGACCC CGCAACCGTG ACCGACGCTT ATTGA

Protein sequence

MSEIPRRAVV RTAKLATLPI GIAGRATLGV GKRIGGRPAE AVASELQQRT AAQIFRVLGE 
LKGGAMKLGQ ALSVFEAVLP DDVAGPYRAA LTRLQEAAPP LPAAVVHRVL AEELGADWRS 
LFTSFDDVPA AAASIGQVHR AVWADGRAVA VKVQYPGAGP ALLADLTQLG RAARLFGAVT 
PGLDIKPLVE ELKARIAEEL DYRLEAAWQG AFAEAYADEP DVVIPRPLAG SGRVLVSEWI 
EGIPLSVIIA DGTPQQRDTA GLLLVRFLYS CPGRAGLLHA DPHPGNFRLL SDGRLGVLDF 
GAVNRLPDGL PAPIGRLARQ TLAGDADAVE QGLRREGFIP PSAEIRAEDL LDYLAPMLEP 
IAVEEFTFSR GWLRKEAARL GDWRSAAAQL GRQLNLPPSY LLIHRVTLGA IGILCQLGST 
GRFRDEMERW QPGFAEPGTA TARAAEDANR PGRPLPALPV QDEAGIVRPL DGPVVLAGGL 
PGPRKPRRPG RTGRTTKARK AGRSAADTAP ATADDRATAP AALPLQAEPA EPSRPSTPAN 
RSAAARPGSG RKAAPRRAPD EESFSDPATV TDAY