Gene Francci3_0845 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0845
Symbol
ID	3904327
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	986294
End bp	987805
Gene Length	1512 bp
Protein Length	503 aa
Translation table	11
GC content	75%
IMG OID	637878178
Product	amidohydrolase
Protein accession	YP_479958
Protein GI	86739558
COG category	[F] Nucleotide transport and metabolism [R] General function prediction only
COG ID	[COG0402] Cytosine deaminase and related metal-dependent hydrolases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.664747
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCGCCA TGCCCACGTC CGCCACGCCC GCCGTCTCCC GTCCCGTCGC CGTTCCCGTT 
CCCGCCGACC TGGTCGTCGT CGGCGCCGAA CTGGTCGCGA CGGTGGACGC CGACCGCCGG 
GAGATCCGCG GCGGGTGGAT CGCAGTGACG AACGGCCTGG TCAGCGCCCT CGGCGGTCCC 
GACGAGCCAC CGCCTCCCGC CGTGCGCACG TTGCGGGCGG ACGGCTGCCT GATCACTCCC 
GGCCTGGTGA ACACGCATCA CCACATGTAC CAGAACCTCA CCCGCGCGTT CGCTCCGGCC 
CTGAACGGCA CGCTGTTCAC CTGGCTGTCG ACCCTGTACC CGCTGTGGTC CCGGCTGGAC 
GAGGAGGCCG TGCACGTCTC CGCCTACGTC GGGCTCACCG AGCTCGCCCT CGGCGGTTGC 
ACGACGACCA CGGACCACCT GTATGTGCAT CCGCGCGGGG GCGGAGACCT CGTCTCCGCC 
GAGATCGCCG CGGCGACGGC GCTGGGCATG CGCTTCCATC CCAGCCGCGG ATCGATGTCG 
CTGTCGGTGA AGGACGGCGG ACTGCCGCCC GACTCGGTGG TGCAGGACGA CGACGAGATC 
CTCGCCGAGT CGGCCCGGCT GGTGGCCCGC CATCACGACC CCTCGCCGGG CGCCATGGTG 
CGGATCGCCC TGGCGCCCTG CTCACCGTTC TCGGTCAGCC CGGAGCTGAT GCGGGCCACG 
GCGGAGCTCG CCGAGTCGCT CGACGTGCGG CTGCACACGC ATCTCGCCGA GGACCCCGAG 
GAGGACGAGT ACTGCCTCGC GCGGTTCGGC CGGCGTCCCA TCGACCAGTT CGCCGAGGTC 
GGCTGGGGCG GCGACCGGGC CTGGGTGGCG CACTGCATCC GCCCGAACCC CGCCGAGGTG 
GCCCGGCTGG GCGCCTGGGG CACCGGGGTC GCGCACTGCC CGAGCAGCAA CATGATCCTC 
GGCGGTGGGC TCGCCCCGGT CGCGGAGCTG CGTGCGGCGG GGGTACCGGT GGGACTGGGC 
TGTGACGGCT CGGCGTCGGC GGACTCGGCG TCGCTGTGGC TGGAGGCCCG CACGGCGATG 
CTGCTCGGGC GGCTGCGGCA CGGCGCCGCG GCGATGTCGG CCCGGGACGC GCTGGAGATC 
GCCAGTCGGG GCGGGGCCGG CTGCCTCGGC CGGGCCGGGA AGATCGGCGA GCTGTCCGTC 
GGGGCGGTGG GCGATCTGGT GGCATGGCCC CTCGACGGGG TCGGCTTCGC CGGGGCGCTG 
TCCGATCCCG TCGAGGCGTG GCTGCGCTGC GGCCCGGTCG CGGCCCGCCA CACGGTGGTC 
GCGGGTCGCG CGGTCGTCCT GGACGGCCAT CCGGTGCATC CCGACCTGTC GGCGATGCTC 
GCCCGCCACC GCGAGCTCGC CGCCGGCATG CAGGCAGCCT TTGACGATGC CGGCATCGCT 
GATGCCGGAA CCGCTCCCGG CGCCGGGCGG GCCGCGGGTA CGACGGGAGC CAGGGCGGCC 
GGGGCCCGGT GA

Protein sequence

MPAMPTSATP AVSRPVAVPV PADLVVVGAE LVATVDADRR EIRGGWIAVT NGLVSALGGP 
DEPPPPAVRT LRADGCLITP GLVNTHHHMY QNLTRAFAPA LNGTLFTWLS TLYPLWSRLD 
EEAVHVSAYV GLTELALGGC TTTTDHLYVH PRGGGDLVSA EIAAATALGM RFHPSRGSMS 
LSVKDGGLPP DSVVQDDDEI LAESARLVAR HHDPSPGAMV RIALAPCSPF SVSPELMRAT 
AELAESLDVR LHTHLAEDPE EDEYCLARFG RRPIDQFAEV GWGGDRAWVA HCIRPNPAEV 
ARLGAWGTGV AHCPSSNMIL GGGLAPVAEL RAAGVPVGLG CDGSASADSA SLWLEARTAM 
LLGRLRHGAA AMSARDALEI ASRGGAGCLG RAGKIGELSV GAVGDLVAWP LDGVGFAGAL 
SDPVEAWLRC GPVAARHTVV AGRAVVLDGH PVHPDLSAML ARHRELAAGM QAAFDDAGIA 
DAGTAPGAGR AAGTTGARAA GAR