Gene Francci3_0190 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0190
Symbol
ID	3903217
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	222852
End bp	223949
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	66%
IMG OID	637877521
Product	Rieske (2Fe-2S) protein
Protein accession	YP_479310
Protein GI	86738910
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	36
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.305045
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACAAGA CGACCGACAT GGTGCCCGCG GAGCGCCGCC AGCCGGCCTT GGCGTACACG 
GGCCAGGGAC GCTTCGAGCG CGAGCGCGAG CTTGTCCTGC GCTCTCCGCA GCTTGTCGGC 
TACCGCTCTG AGTTGCCGGC CCCCGGAAGC TACTGCACGA AGACCGTCAT GGGCGTTCCC 
GTGCTTCTGA CCCGGGGCGA GGACGGCACG GTCAGGGCTT TCCAGAACGT CTGCGCCCAT 
CGCCAGGCGC CAGTCGCGGA GGGCTGTGGC GCGGCAGAGC GGTTCGTCTG CCCGTATCAC 
GCCTGGGTGT ATGACGCCCA GGGTGACTTC GTCGGCGGAC CCGGCCGTGA AGGTTTCCCC 
TCGACGATGG CCGGGAAGCC CCGTCTCACG CAACTGCCCG CCGCGGAGCA TTCCGGATTC 
CTGTGGGTCG GTCTCCAGCC GGACAGCGGT CCCCTGGACA TCGATGCCCA CCTGGGAGAG 
CTCGGTCCGG AACTCGCGTC CTGGGACATC GGTAGCTGGG CCTCGGTGGG CGAGAAGGTG 
CTCGACTTCC CGATCAACTG GAAGTTCGCG CTCGACACGT TCGCCGAGAA CTATCATTTT 
GCCACGGTGC ACCGGGACAC GTTCGCGCTG ATCACCAAGA GCAACTGCGC GCTGTTCGAC 
TCCTTCGGCC CGCACCATCG GCTGGTCTTC CCGATGCGGC ACATCACGGA CCTCGCGGAC 
AAGCCCGAGG AAGAATGGGA ACCACTGCAC AACCTCGTGG TGATCTACGC ACTGTTCCCC 
AACATCGTCC TGTCGGTCAC TGTCGCCAAC GGCGAGGTGT TCCGGGTCTA TCCCGGGAGC 
GGACCGGGTC ATTCGATCAC CTATCACCAG AACGCGTCGC CGATGGATCT CACGGACGAG 
GCGACGCGAA CCGCCGCGGA CGAGATCTTC GAGTACGCGC ACGCCACGGT GCGCGACGAG 
GACTACCGCA TGGCGATCGA CATCCAGAAG AACATGGCGT CGGGGGTGCG GCCCGAGCTT 
GTCTTCGGAC GCAACGAGCC GGGGCTGCAC CATCGTCATG CGGTTATCGA CGAGGCGCTC 
GCCGCATTCG GCGGGTAG

Protein sequence

MDKTTDMVPA ERRQPALAYT GQGRFERERE LVLRSPQLVG YRSELPAPGS YCTKTVMGVP 
VLLTRGEDGT VRAFQNVCAH RQAPVAEGCG AAERFVCPYH AWVYDAQGDF VGGPGREGFP 
STMAGKPRLT QLPAAEHSGF LWVGLQPDSG PLDIDAHLGE LGPELASWDI GSWASVGEKV 
LDFPINWKFA LDTFAENYHF ATVHRDTFAL ITKSNCALFD SFGPHHRLVF PMRHITDLAD 
KPEEEWEPLH NLVVIYALFP NIVLSVTVAN GEVFRVYPGS GPGHSITYHQ NASPMDLTDE 
ATRTAADEIF EYAHATVRDE DYRMAIDIQK NMASGVRPEL VFGRNEPGLH HRHAVIDEAL 
AAFGG