Gene Francci3_2688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2688
Symbol
ID	3904912
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3173860
End bp	3174918
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	68%
IMG OID	637880012
Product	Rieske (2Fe-2S) protein
Protein accession	YP_481778
Protein GI	86741378
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCATGTCG TGAGCGCCCC ACGACAGCTG ACGGAGCCCA CCGCCCGGGA AGCCCTCAAC 
CTCGCCGCCG GCTGGTACGT CGCCATGCCG TCACGGCAGC TCGGGTCGCG CCCTCGGGCG 
CTCACGCTGT TCGGGCGCCC CCTCGTCGCC TGGCGGGACG CCCGCGGCGC TGCGTCGCTG 
ATGCGACGGC ACTGTCCGCA CATGGGCGCC AGCCTGGCGG ACGGCAGGAT TGTCGACGGC 
CTGCTGCAGT GCCCTTTCCA CGGCTGGCGT TTCGACGCCC TGGGCACCTG TCAATCGATC 
CCCGGCCAGG CCAGGATCCC CGCGGCCGCC TCGCGGCCGG CCTACCCGAC GGTCGAACGA 
TACGGATACC TGTGGGCCTG GTACGGAGGT CCCCACCCCC TGTATCCGCT CCCGGAACTG 
CCCGCCGCCT TCGACAGGCT GGGCTGGCAT CGCGGCTTCC GCCTCGCCGA CAGGACCAGG 
GCAACGGCCC GCAGAATCCT GGAGAACACC TACGACCCCG ATCACCTGGT GGACCTCCAC 
GGGCTTGAGA TCGCGGGCCC GATGACCCTC CGGCTGCTCG ACAGCCCGGT GGACACGGCG 
ACCAACGGGC CGCCCATCGT GGCCGACGCC TGGTTCGGTG CCGAGCTGAC CTGGCCCCGG 
TACATCGGGA GGACGGGTGC CATCGCCCAC GCGGTCGGCG TCAATGCCGA CAGCTTCCTG 
CTCCGCGTGG ACGGATGGCC AGCGGGCCAG CGCGTCTCCT ACTACTCGGA CGGCGTCCTG 
CGGTACCAGC TCCTGCTCGC CGTCAGTCCG GTCGGGCCCA ACGAAACCAT TCAACATATC 
GCCGTCGCGG TCACGCCCGC CGCACGCGCC TGGAAGAACA TAACAAAATA CCTGGTTGAC 
AGGCTTGAGG TCACCTTTGC GTCGAACCAG GATCTACCGG TGTTCGACAG CATACGAGCG 
GGAGACAGGC ACGGAATCTA TCTTGAGAGC GAGTACGGCC TGCGGGCCTT CCGCAAATAC 
TATCAGTCCT GGGTGGACCG GGTGAGCGTC GATGCGTGA

Protein sequence

MHVVSAPRQL TEPTAREALN LAAGWYVAMP SRQLGSRPRA LTLFGRPLVA WRDARGAASL 
MRRHCPHMGA SLADGRIVDG LLQCPFHGWR FDALGTCQSI PGQARIPAAA SRPAYPTVER 
YGYLWAWYGG PHPLYPLPEL PAAFDRLGWH RGFRLADRTR ATARRILENT YDPDHLVDLH 
GLEIAGPMTL RLLDSPVDTA TNGPPIVADA WFGAELTWPR YIGRTGAIAH AVGVNADSFL 
LRVDGWPAGQ RVSYYSDGVL RYQLLLAVSP VGPNETIQHI AVAVTPAARA WKNITKYLVD 
RLEVTFASNQ DLPVFDSIRA GDRHGIYLES EYGLRAFRKY YQSWVDRVSV DA