Gene Francci3_3746 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3746
Symbol
ID	3906030
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4490548
End bp	4491879
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	72%
IMG OID	637881072
Product	hypothetical protein
Protein accession	YP_482826
Protein GI	86742426
COG category	[C] Energy production and conversion
COG ID	[COG2421] Predicted acetamidase/formamidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGCTGC AGCCTGGCCG AGGAAGGATC GAGGGACGGC ACTACCTGCC CTCCACCCCC 
GAGACCATCA GATGGGGTGA GCTGCCGAAC GCCCTGACCA GGCCGGTTCT CAGTATCGAC 
TCCGGCGCCA CGGTCACCTT CGACACGGTC AGCCAAGAGG GGATCCTCTG CGACCAGGGG 
CGCGATCCCG ACGCCTTCTT CGCCGGTTTC GGGGTCGCGC CGTCGGAGGT GCTGGCCGAC 
GCCCGGGCGA TCGCCGCTTC GGGTATCCCG CACCGGTTCG GGGTGGACGG TCCCCACATC 
GTCACCGGAC CGGTGTTCAT CCGGGGCGCG GAACCGGGGG ACGTGCTGCG GGTTGAGGTG 
GTCTCGCTGC ATCCCCGCGC ACGGTATGGG ATCGTCTCGA CCCGCCATGG CGCGGGCCTG 
CTTGCAGGGG AGTTCCCCGA GGGGGGGCCG CCGGACGCGG ACGCCGACGC CCGCCATTGG 
CGACGCTTCC GCACCGTTAC CACCTTCTGT GCGGTGGAGC GCCGGCGGGG CCGCCTGTTC 
GGCGCCCTGA CCAGCGTGAA CGGCAGCAGG ACCCGGTTTC CGTTGGCGCC GTTCCTGGGC 
ATCATGGCGG TCGGCGTGGA CACTACCACC AAGATCGTCC CCTCCACCTC GATCGGTCTG 
CACGGCGGCG CCCTGGACTG CCGGGAACTC GGCGCGGGCG CGCGGCTGTT CCTGCCGGTC 
CAGGTGAGCG GCGCGTTGTT CGCCGTCGGC GATCCGCATT ACGCCCTCGG GGACGGGAAG 
ATCGGTGCCA CCGCCCTGGA TGGCCCGCTA CGGGCGACGC TGCGGCTGAC CGTGCTGCGT 
GACACGGCGG CCCGGTCGGT TCTCGGCGCG CTGCGGGAAC CGTTCATCGA GACCGACACG 
GCCTGGGTCA CCCTGGGGCT CGACGTTGAC CTCGCCGAGT CCGTCCGCCG CGCGGCGCGG 
TCGGCGGTGG TCTTCCTGCA GAGCCGGGTC GGGCTCGACC GGACCGAGGC GCTCGCCTAC 
CTGTCCGCCG CGGCCGACTT CGGGGCCTGC CAGCTCGGCA CCGGCACCCA GAGCGCGTTC 
TGCCGCATCC GTCGGGCGGA CTTCACCGAA CTGCCGATCG CGAAGCCGCG ACTGCCGCGA 
TCCGGACTCG TGCGGATCGT CGGCGTGGGC GACTCGGAGA CCGAGGACCC GACGGATCCG 
GAACACGCCG CGGAGAAGAC GCCGGATCGG GCCGACGAGA AGATCGGTCG CGCGGTGCGG 
ATTCACTGGG CCGAGCCGGC CGGTGCCTCA CCCCCGATCG ACGCGGAAGC CGGCGGCCCG 
GACACCCCGT GA

Protein sequence

MALQPGRGRI EGRHYLPSTP ETIRWGELPN ALTRPVLSID SGATVTFDTV SQEGILCDQG 
RDPDAFFAGF GVAPSEVLAD ARAIAASGIP HRFGVDGPHI VTGPVFIRGA EPGDVLRVEV 
VSLHPRARYG IVSTRHGAGL LAGEFPEGGP PDADADARHW RRFRTVTTFC AVERRRGRLF 
GALTSVNGSR TRFPLAPFLG IMAVGVDTTT KIVPSTSIGL HGGALDCREL GAGARLFLPV 
QVSGALFAVG DPHYALGDGK IGATALDGPL RATLRLTVLR DTAARSVLGA LREPFIETDT 
AWVTLGLDVD LAESVRRAAR SAVVFLQSRV GLDRTEALAY LSAAADFGAC QLGTGTQSAF 
CRIRRADFTE LPIAKPRLPR SGLVRIVGVG DSETEDPTDP EHAAEKTPDR ADEKIGRAVR 
IHWAEPAGAS PPIDAEAGGP DTP