Gene Francci3_0188 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0188
Symbol
ID	3903215
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	220282
End bp	221313
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	70%
IMG OID	637877519
Product	2OG-Fe(II) oxygenase
Protein accession	YP_479308
Protein GI	86738908
COG category	[R] General function prediction only
COG ID	[COG3491] Isopenicillin N synthase and related dioxygenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.406722
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.181391
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGACG AGATTCCCGC CATCGACCTG GAAGCGGCGC TGGCCGAGGA CGCGCCCGCG 
GACCTGCTGC TGCGCGTGCG CGAGGCGGCC GAGCGGATCG GCCTGATCCA GGTGGTCAAC 
CACGGCGTTC CGCTGGAGCT GATCGAGGAT TTCGAGCGTC GGGTCGAGCG CGTCCTGCGT 
CTGCCGCGGC CGGAGAAGGC GAAGTTGGCC AGCCCCACCG GACACCCCTT CCGGGGCTGG 
CGGCAGTGGC CCGACGACCT CGGCCGCCTC GAACTCGAAC GGTATTCCGT GGGCCAGTTC 
GACAACCCGG CCGATGCCGC CGCCGCAGGC GTGTCCGAAC GGTGGCTCGG GCTCTACAAA 
CACGGCAACG TCTGGCCGCC GGAGGACCCC GACCTGCGCG GGGTCACCTT CGCCTACGCC 
AAGGCGGCCG TGGTGCTGGC CCAGCGGGTG CTCGGCCTGT ACGAGCGGCT GCTCGGACTA 
CCGGCAGGCA GCTTCCCGGA CGCCGAGCCG CACCACATCA ACATGATCGT CAACGACTAC 
CCGACCTGGA CCTACCCGGA CACGGTCGCT GAGGAGGAGA AGCTTCTCCT GCTGGAGCAC 
ACGGACGGCT CGGCGGTGAC CATCCTGCAC CAGCACGGCG AGTACTCCGG GCTCCAGGCG 
CAACAGGCCG ACGGCACCTG GATTCCGGTG CCCGTCGTGC CCGGGGCGTT GCAGGTGTTC 
TCGGGGACAA TCCTCACCCG CTGGACCAAC GGTCTGTTCC GGCCCGTCCG CCACCGGGTC 
GTGGCCGGCG GCAGTGCGAC CCGGCAGTCG ACCGGGATCT TCTACCATCC GAGTCTGGAC 
ACCGTGCTGG AACCGCTGCC GGCCTTCGTC GGGGAGGACG GCACGGAGTT CGAGCCCGTT 
GTCCTGGGCG AGATCGACGA GACCAACGTC GAGAACTACC TGAAGGTCTT CGGCCGGCCG 
GAGCAGGTGG CCGCGTGGCG GGAGGGCCGT CCGTTCGTCT CGGAGCTTGC GGAGACCTCC 
GCCGGCCGCT GA

Protein sequence

MTDEIPAIDL EAALAEDAPA DLLLRVREAA ERIGLIQVVN HGVPLELIED FERRVERVLR 
LPRPEKAKLA SPTGHPFRGW RQWPDDLGRL ELERYSVGQF DNPADAAAAG VSERWLGLYK 
HGNVWPPEDP DLRGVTFAYA KAAVVLAQRV LGLYERLLGL PAGSFPDAEP HHINMIVNDY 
PTWTYPDTVA EEEKLLLLEH TDGSAVTILH QHGEYSGLQA QQADGTWIPV PVVPGALQVF 
SGTILTRWTN GLFRPVRHRV VAGGSATRQS TGIFYHPSLD TVLEPLPAFV GEDGTEFEPV 
VLGEIDETNV ENYLKVFGRP EQVAAWREGR PFVSELAETS AGR