Gene Francci3_3337 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3337
Symbol
ID	3904123
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3954344
End bp	3955492
Gene Length	1149 bp
Protein Length	382 aa
Translation table	11
GC content	73%
IMG OID	637880662
Product	hypothetical protein
Protein accession	YP_482423
Protein GI	86742023
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0204468
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCTGA CCGCCGAGAA GCCCCCGACC GCCCCGCCAC CCTCGACCGG AACGATCACA 
CCGCTGGCGG GCCCGCCAGC ACCACGACCC GCCGCGCCGC CACCCACCAG CCCGACCCGC 
GGGAATTCCA CCGGCGGAGA TGCCGGGAGC GGGAATGCCA TCGACAGAAG CACAGCAAGC 
GACGGCTCCC CTGCGGCAAC CGACGACCCG ACGACCACGC AGCCCGCGCC CCCACCGGCG 
ACGCCTTCAC CGACCCAGGC CGACGACATG AACCGCGCCG ACGACACGAA CCGCGCCGCC 
CTCGCGCCCC CAACCGCGCC GACGCGCCCA CCTGCCGCGC CCTCCTCGCC GGCCGCGAAC 
GCGCCGGCAG GAAATCCAGA CCGGCACGAC CCGACGTCAG CGCCGTCCCG GCGGCGGCGC 
TGGCGAACCG GCGATCTCTG GATCCATATC GCCACCGTCA TCGCCGTCCT CGGCGTCGCC 
GGCATCGCCG CCGTCGTCAG CTACCGCCAC ATGCGCGCCG TCGCCATCCT CCACGGCGAG 
AACCCCGCCA ACGCCGCGAT CATCCCGCTG TCCGTTGACG GCCTCATCGT CGCCGCCTCC 
ATGACCATGC TCGCCGACAG CCGCGCTCAC CGACACCGGT CCTGGCTCGC CTACAGCCTG 
CTCACCCTTG CCTCCGCCGC CAGCCTCGCC GCCAACGTCA TGCACGCCGA ACCCACCCTC 
GCCGCCCGCG TCATCGCCGC CTGGCCCAGC GCCGCCCTCA TCGGCGCCTA CGAACTCCTC 
ACCGCCCAGA TCCGCGGCGC CGTCACCACC CAGACCCACC CCGCCGCCCC ACCCGCTCCA 
GCCGCCGCGC CGACTTCCGC CCCCGCGCCC ACTCCAGCCG CCGCGCCCCC GGCGCCCGGC 
GCCCCGCCGA GCCCCGAACC CACGACGATC ATCACCCCCG AGAAGAACGG GAACGATCCC 
GGAACGAAAA CAGCATCCCA GCCGGTCACG GTCAGACCCG GCACGAAGAA GGCCAGGCTC 
CAGAAGCTCC TCGAAGCCCT GCCCGCCAAC GACCCCCGGT CCGTCTACGC CCTCGCCAAA 
GACCTCGCTC CCCTCATCGG CCTGAACGAA GGCACCGCCC GCCGCTACAT CCCCCACCTC 
AGGTCATGA

Protein sequence

MILTAEKPPT APPPSTGTIT PLAGPPAPRP AAPPPTSPTR GNSTGGDAGS GNAIDRSTAS 
DGSPAATDDP TTTQPAPPPA TPSPTQADDM NRADDTNRAA LAPPTAPTRP PAAPSSPAAN 
APAGNPDRHD PTSAPSRRRR WRTGDLWIHI ATVIAVLGVA GIAAVVSYRH MRAVAILHGE 
NPANAAIIPL SVDGLIVAAS MTMLADSRAH RHRSWLAYSL LTLASAASLA ANVMHAEPTL 
AARVIAAWPS AALIGAYELL TAQIRGAVTT QTHPAAPPAP AAAPTSAPAP TPAAAPPAPG 
APPSPEPTTI ITPEKNGNDP GTKTASQPVT VRPGTKKARL QKLLEALPAN DPRSVYALAK 
DLAPLIGLNE GTARRYIPHL RS