Gene Francci3_2687 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2687
Symbol
ID	3904911
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3172802
End bp	3173872
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	68%
IMG OID	637880011
Product	Rieske (2Fe-2S) protein
Protein accession	YP_481777
Protein GI	86741377
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGAA GCATCGTGAC CGGAGATCTC GTGACCGCGG AAACCGAGCC GCCGCAGCCA 
GGCCTGGCCG CGGGCTGGTA CATCGCGCTT CCCTCCGAGG AGCTGGGAAA GCGCCGTGGC 
CAGCCTCTCA CCCTGTTCGG CCGTGAGCTG GTCGCCTGGC GCGACGGCAC GGGGCGACCT 
GTGATCATGC GGCGGCACTG CCCGCATCTC GGCGCCAGTC TCGCCTTCGG CAAGGTCGTG 
GACGGAACGC TCCGCTGCCC TTTCCATCAC TGGCATTTCG ACGCGGCGGG CGCGTGCACA 
CACGTGCCGG GGACGGACCG GCTTCCCCGC CGTGTGGCGC GGCGGTCCTA TCCGACCGAC 
GAGCGCTACG GCTATGTCTG GGTCTGGTAC GGGAACCCGG AGCCGAGTTA CCCGGTGCCC 
GCCGTGCCCG CGCTGGCGGA GGGCCGCGAG GCCTACCTCG GCTACCAGTT CTCGCACGTG 
ACCACCGCCT CGCCTCGACG AGTCCTGGAA AATGCTTTCG ACTGCGCTCA TTTCGGCACG 
CTGCACCGGG TCCGGTCAGG CGGTGGCCTG AAGATAAACA TTCTCACGGA ACCGTCAGCA 
ACGGCCGAAA ACGGTCCGCC GATCGGCGGT GATGCCTCGA TCGCCGCGGC GATGGAGACA 
GATATCCTCG ATCTGCCGCC GACGGTCCGG GCGCTGGGTA TTCGGGCGCG GAAGTTCACT 
CTCCTGATCG ACGGATGGCC CGGCGGCCAG CGCCTGACCT TCCTCCTGGA CGGCCATGTT 
CTCGCCAAGG AGTTGCTTGG CATCACTCCC ACGTCCGACG GCCGCACCGT CCTTCAGGGC 
TGGTCGCTCA TCCGCCGGAC GGGCAACCGG GCGCTCGACC ACCTGATTCG CCTCGCCTAT 
CGGGCCCAGC ACGAGTGGGG AACCAGGGAG GACCTCAGGA TCTACCGGCA CGCGAGCGAC 
GTCGACGGCA CCGTGCCGGT CACGGCCGAC CACGGTGTCC TGAAGTTTCG GAAGCATTAC 
CAGCGCTGGG TTGATGCAGC CCTTCCGGAC GATCGCGCGT GCATGTCGTG A

Protein sequence

MTGSIVTGDL VTAETEPPQP GLAAGWYIAL PSEELGKRRG QPLTLFGREL VAWRDGTGRP 
VIMRRHCPHL GASLAFGKVV DGTLRCPFHH WHFDAAGACT HVPGTDRLPR RVARRSYPTD 
ERYGYVWVWY GNPEPSYPVP AVPALAEGRE AYLGYQFSHV TTASPRRVLE NAFDCAHFGT 
LHRVRSGGGL KINILTEPSA TAENGPPIGG DASIAAAMET DILDLPPTVR ALGIRARKFT 
LLIDGWPGGQ RLTFLLDGHV LAKELLGITP TSDGRTVLQG WSLIRRTGNR ALDHLIRLAY 
RAQHEWGTRE DLRIYRHASD VDGTVPVTAD HGVLKFRKHY QRWVDAALPD DRACMS