Gene Francci3_2686 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2686
Symbol
ID	3904910
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3171675
End bp	3172805
Gene Length	1131 bp
Protein Length	376 aa
Translation table	11
GC content	68%
IMG OID	637880010
Product	Rieske (2Fe-2S) protein
Protein accession	YP_481776
Protein GI	86741376
COG category	[P] Inorganic ion transport and metabolism [R] General function prediction only
COG ID	[COG4638] Phenylpropionate dioxygenase and related ring-hydroxylating dioxygenases, large terminal subunit
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCTGAGA TACACATCAA GAACCAGAAG CCGCGGCTCG AGCCGCCAGC GGACCCCGTC 
CCGAAGGAGC TGGCAGCAAG CTGGTACGTC GCGCTGGCCT CCGGCGAGCT GCGCGGGCAG 
CCGAAGGCGT TCCAGCTGTT CGGGCGAGAC GTGGTCGCCT GGCGCGAAGC GAGCGGGCGA 
CCGGCAGTCG CGGGCCGGTA CTGCCCGCAC CAGGGCGCCA GCCTGGCACT GGGGGCCGTG 
GTCGACGGCT GCCTCCGCTG CCCCTTTCAC GGCTGGCGGT TCGACAGCTC CGGCGCGTGC 
GTCGAGGTTC CCCGCTCCCA GCGCATTCCC ACGACGGCGC GACTCGACTC ATACCCGACC 
ATCGAGCGCT TTGGTTACAT CTGGGTGTGG TACGGGACCC GCACACCACT TTTCGAGCTT 
CCCGGCTTCC CGGCTCTTGA GGAGGAACAG GAACACTATC TGGGGTTCCG CTACACCGAC 
TGGACCGCCG GTCACCCCCG CCAGCTCCTT GAGAACGCGT TCGACTACTT CCATTTTCAG 
ACCCTCCACA GCCTGCCCCT GGACCGTGCG GAGTTCCGGG TCCTCTCCGA TCCCGAGCAG 
GCCGCGGACA ACGGTCCCCC GATCGACAGG GAGGCCTATC TCGGGGGCTG GATGGAAGGT 
GTCGTGACCC CGGGGCATCC CCTTCGTCGG CCTCGGCACT GGCTGGTCGC GGCCGGCGCC 
ACCTTCTTCA CGGGGGACGC GTTCCAGCTC CTGATCGACG GGTGGCCCGG TGGCCAGCGC 
TACACCGGCT ATGTCGGCGG CAGGGAGATC TTCAAGTACC TGATGGGAAT CACCCCGACC 
GCGAACGGCT CGACCATCCA GCATGCCTGG ACCGGCGTCC GCCGCAGCGA CCGGCGCTGG 
CGAACCTGGC TGAACGTGGC GATGCTCATC GGGCAGAGCA GGGCCGGGAC TCTCCAGGAC 
ATGCCGATCT ACGACTACAC TCAGGCGCAC GTCGGCACGG CCAGGATGTT CTACGACACC 
AACCTGATCA GGTTTCGCCG GTACTACAGG TCATGGGTGG ACCGGGTGGC AGAAGGCCAG 
GGGGAGCCGC AGCCGGCCAT GGCCCGCATC CCGGGAGCCG GCGCGTCATG A

Protein sequence

MPEIHIKNQK PRLEPPADPV PKELAASWYV ALASGELRGQ PKAFQLFGRD VVAWREASGR 
PAVAGRYCPH QGASLALGAV VDGCLRCPFH GWRFDSSGAC VEVPRSQRIP TTARLDSYPT 
IERFGYIWVW YGTRTPLFEL PGFPALEEEQ EHYLGFRYTD WTAGHPRQLL ENAFDYFHFQ 
TLHSLPLDRA EFRVLSDPEQ AADNGPPIDR EAYLGGWMEG VVTPGHPLRR PRHWLVAAGA 
TFFTGDAFQL LIDGWPGGQR YTGYVGGREI FKYLMGITPT ANGSTIQHAW TGVRRSDRRW 
RTWLNVAMLI GQSRAGTLQD MPIYDYTQAH VGTARMFYDT NLIRFRRYYR SWVDRVAEGQ 
GEPQPAMARI PGAGAS