Gene Francci3_3356 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3356
Symbol
ID	3905938
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	3980137
End bp	3981288
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	72%
IMG OID	637880679
Product	epoxide hydrolase-like
Protein accession	YP_482440
Protein GI	86742040
COG category	[R] General function prediction only
COG ID	[COG0596] Predicted hydrolases or acyltransferases (alpha/beta hydrolase superfamily)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.21914
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.116129
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGATCA CACCGTCCCG GATCCGGGTG CCCGAGGACG TCCTGACCGG ACTGCGGCAG 
CGGATCGCGC GGGTGCGCTG GCCGCAACCG GCCCCCGGCC CGGCCTGGTC CCAGGGCACC 
GACCTGGCGT TCCTCCAGGG AATGCTCGCC GACTGGGCCA CCTTCGACTG GCGTGCGGCC 
GAGGAGAGAA TCAACGGCGG GTACGACCAG TTCGTCGCCG AGGTGTCCGG GCTGCGGGTG 
CACTACGTCC ATCATCGGGT GCCGGGGGCC GACGGTCCGC CGGTCATCCT GACCCACGGC 
TGGCCGAGCA GCTTCGTGGA GATGCTCCCG CTCGTCGACC GCCTGCGCGA CCCCGCGGCG 
TACGGCATCG ACGCTCCCGC GCGGGATGTC GTCGCCGTGT CCCTGCCCGG GTATCCCTTC 
TCCGAGCGTC CGGCCGGGGA ACACACGCTG CGGGACACCG CGCGTGTCTG GCACGACCTG 
ATGACCGGGC TCGGCTATCC CCGGTACCTG GCCGCGGGCA GCGACTTCGG TTCCGGGGTC 
AGCACCTTCC TGGCACTCGA CCATCCCGAC ACGGTGGCCG GGCTGTACCT GACCGATCTC 
GAACTCGACC CCGTCCTGGA CCCGGCCGTC GACCCGACAC CGCTGTCCCC GGCCGAGCGT 
GCGTATCTGG ACGCCGGCGA ACGGTGGTCG CTGACCGAAG GCGGCTATCA CGCGATCGCG 
TCCACCCGGC CCCAGACCCT CGCGTACGGG CTGACCGACT CGCCCGCCGG GCTGGCCGCA 
TGGCTGCTGG AGAAGTGGCG TGCCTGGTCG GACTGCGCCG AAGGCCGGGT GCCCCGAGTG 
TCCCGGGAGT TCCTGCTGAC CACGCTCACG CTCTACTGGG CCACCGGTTG CGTCGGGAGC 
ACGCTGCGCG ACTTCCACGA CAACCGCCAG GTCCAGGAGG GCATGACGGT CGGTGACCGG 
GTCCTCGCCC CCACCGCGTT CGGGCGTTTC GGGAACGGCC TGGATGACCT TCGCCCGCCC 
CCGCCCGAGT TCGTCGGACG GCTGTGCCGC GTGGTGCGCT CCACGGTGCA CGACGAGGGC 
GGGCACTTCC CCGCGGTGGA GGTTCCCGAC CGGCTCGCCG CCGACATGCT CGCCTTCTTC 
GCCGAATGCT GA

Protein sequence

MLITPSRIRV PEDVLTGLRQ RIARVRWPQP APGPAWSQGT DLAFLQGMLA DWATFDWRAA 
EERINGGYDQ FVAEVSGLRV HYVHHRVPGA DGPPVILTHG WPSSFVEMLP LVDRLRDPAA 
YGIDAPARDV VAVSLPGYPF SERPAGEHTL RDTARVWHDL MTGLGYPRYL AAGSDFGSGV 
STFLALDHPD TVAGLYLTDL ELDPVLDPAV DPTPLSPAER AYLDAGERWS LTEGGYHAIA 
STRPQTLAYG LTDSPAGLAA WLLEKWRAWS DCAEGRVPRV SREFLLTTLT LYWATGCVGS 
TLRDFHDNRQ VQEGMTVGDR VLAPTAFGRF GNGLDDLRPP PPEFVGRLCR VVRSTVHDEG 
GHFPAVEVPD RLAADMLAFF AEC