Gene Francci3_3531 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3531
Symbol
ID	3904470
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4219563
End bp	4220846
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	71%
IMG OID	637880852
Product	hypothetical protein
Protein accession	YP_482612
Protein GI	86742212
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0966276
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.218294
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCTACA CCGACCCGTA CACGCCACCG CCCGAGCACC ATCCCGCACC CGGCGGGGGT 
CAATCCCTGG CAGACGGGGC CGCCGGGCTG GCGCTGCTGC ACATCGCCTA TGCCCGCGCC 
GGGATCGGAG ACTGGGCCAC CGCCCACCAA TGGGTCAAGG CCATGACCGC CGAACCCGTG 
GCCGCGGACA CGGGCGCCGG CCTGTACCGG GGCGCCCCGG CGGTCGCATT CGTGCTGCGC 
ACCGCCGGCC AGCCCGTCTA CACCGGCGCA CTGCACACCC TCGACGAGCA CATCGCCGCG 
ATCACTTGCA CCCGCCTGGA GGCAGCGCAC GAGCGGATCG ACCGCGGCGA ACTGCCCGCG 
CTGCGGGAGT TCGACCTGAT CAACGGGCTG ACCGGACTCG AATGGGTCAA CGCCGCCGCC 
GACCAGCCGG GTCCGCAACG CCCGTCCTGG TGCTACGGCG CCCCCGGCCT GGCCCGCGCC 
CGCCACCTGA CCGCCCAGGC ACTGGACACC CCGAACAGGG TGGCCGACGC CAAGGCCACG 
CTCGTCGCGT GTCTCACCGA CGAGGCTCAA CTCGCCCAAC TCGGCGACGA CTCGCTGTGC 
CACGGCTGGG CCGGGCTGGT GCACGTCTCC CGCCGGATAC TCGCCGACAC CGAACCCGGC 
GGCGAATTCG CCGAGGTCCT GTCCCGGTTG GAACACCGCT GGCGTCACCG CCGCGCCCAG 
GCGGCCCGAA AACTATCGGA GGTGAGGGGG ATGCTGGAAG GCGACGCCGG AATCGCGCTC 
ACCGATCTGC CGCCGGGCAC CGGATGGGAC GCCTGCCTGC TCACCGTCCC GCCCACGGCC 
GGACCAACGC ACTCGCCCGT ATCCGCAAGT ACACACACGA AGGAACCGGA TGACCAACGC 
CACCAGCACC CGCCCCGAGG ACCTGCGCGA GCAGATGATC AGCAACATCC GCACCGCTGG 
TCACCTGCGC TCCGAGCGCA TCGAGCAGGC GTTTCGGGCC GTTCCCCGGC ACCGGTTCGT 
TCCCGCGGCC TCGGTCGAGG AGGCGTACGC CAACAAGGCG ATCACCATCA AGCCCGGCGC 
AGACCGGCCC GCCAGTTGCA TCTCCGTGCC GACCGTGGTG GCGATGATGC TCGGTCAGCT 
CGAACTGACC ACGCCCGCCG CGCCCTGGCC GAGACCAGCT ACGACCGAGT GCGGGTGGTC 
ACCGGCGACG GCGCCATCGG CGACGCGGAC CACGCCCCCT ACGACAAGAT CATCGTTACG 
GAACTGTTGA CCGGACTTTC CTGA

Protein sequence

MTYTDPYTPP PEHHPAPGGG QSLADGAAGL ALLHIAYARA GIGDWATAHQ WVKAMTAEPV 
AADTGAGLYR GAPAVAFVLR TAGQPVYTGA LHTLDEHIAA ITCTRLEAAH ERIDRGELPA 
LREFDLINGL TGLEWVNAAA DQPGPQRPSW CYGAPGLARA RHLTAQALDT PNRVADAKAT 
LVACLTDEAQ LAQLGDDSLC HGWAGLVHVS RRILADTEPG GEFAEVLSRL EHRWRHRRAQ 
AARKLSEVRG MLEGDAGIAL TDLPPGTGWD ACLLTVPPTA GPTHSPVSAS THTKEPDDQR 
HQHPPRGPAR ADDQQHPHRW SPALRAHRAG VSGRSPAPVR SRGLGRGGVR QQGDHHQARR 
RPARQLHLRA DRGGDDARSA RTDHARRALA ETSYDRVRVV TGDGAIGDAD HAPYDKIIVT 
ELLTGLS