Gene Franean1_2108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2108
Symbol
ID	5670508
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2534053
End bp	2535282
Gene Length	1230 bp
Protein Length	409 aa
Translation table	11
GC content	74%
IMG OID	641241029
Product	coproporphyrinogen III oxidase
Protein accession	YP_001506450
Protein GI	158313942
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0635] Coproporphyrinogen III oxidase and related Fe-S oxidoreductases
TIGRFAM ID	[TIGR00539] putative oxygen-independent coproporphyrinogen III oxidase

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCATCCA AGCCTCTCGA GGGGGCGCCG GCACCCGTCG ACGGCGCACT CCCCGACGCC 
GCGCTCACCG AGGTCGGGAC CCGGCCGTTC GGTGTCTACG TGCACGTGCC GTACTGCGCG 
GCGCGCTGCG GGTACTGCGA CTTCAACACC TATACCCCGG CCGAGCTCGG CGCGGGCGGC 
CAGGGTGGGG CCGCCTCGTT CGTCGACTCG GTGGCCACCG AGGCCCGGCT GGCCCGCTCG 
GTCCTGGGCG AGCGGGACCT GACGGTCTCG ACAGTCTTCG TCGGCGGTGG CACCCCGACG 
CTGCTGCCGG CCGCCGACCT GGCCAAGGTC CTGCGGGTCC TGGACGACAC CTTCGGCCTG 
GCCGGCGACG CGGAGGTCAC CACCGAGGCC AACCCGGAGT CCGTCGACCG GGAGACTCTC 
GAACAGCTCC GGGCGAGTGG GTACACGCGG ATCTCGTTCG GCATGCAGAG CGCCCGCCCG 
CACGTGCTCG CGGCGCTGGA CCGGCGGCAC ACCCCCGGCC GGGTGCCCGA GGTGGTCGGA 
TGGGCGCGGT CCGCCGGGTT CCGCCAGCTC AGCCTCGACC TCATCTACGG CGCGCCGGGG 
GAGTCCGAGA GCGACTGGGC GGCGAGCCTG GACACGGTGA TCGAGCTCGC GCCCGACCAC 
GTCAGCGCCT ACGCCCTGAC CGTGGAGGAG GGCACCAAGC TTTCCCGCCG GGTGCGCCGC 
GGCGAGCTGC TGGAGCCGGA CGACGACCTG CTCGCCGATC GCTACCTGCA GGCCGACGAG 
GCGCTCGCCG CCGCCGGCCT GACCAACTAC GAGGTCAGCA ACTGGGCACG CGACCAGTCC 
TCCTGGTGCC GCCATAACAT GGGCTACTGG CGGGGCGACG ACTGGTGGGG GCTGGGGCCG 
GGCGCCCACA GCCACGTGGG TGGCGTCCGC TGGTGGAACG TCCGCCACCC GACCGAGTAC 
GCCACCCGGG TCGGCGCCGG CCACAGCCCG GCCGCCGGCC GCGAGGTGCT CGATGCCCAG 
GCCCGCCGGG TCGAGCGGGT CATGCTGGGG GTCCGCCTCG TCGAGGGGCT GGGCGTCGAC 
GCGCTGGGCG AGCAGGCGCT GGACGTCGCC GCCGAGCTCG CGGCGGACGG CCTCATCGTC 
GCGGACGTCC TCGCGCAGGG CCGGGTGGCC CTCACTCGCC GTGGCAGGCT GCTGACCGAT 
ACGGTCGTCC GTGCCCTGTT GCCCGACTGA

Protein sequence

MPSKPLEGAP APVDGALPDA ALTEVGTRPF GVYVHVPYCA ARCGYCDFNT YTPAELGAGG 
QGGAASFVDS VATEARLARS VLGERDLTVS TVFVGGGTPT LLPAADLAKV LRVLDDTFGL 
AGDAEVTTEA NPESVDRETL EQLRASGYTR ISFGMQSARP HVLAALDRRH TPGRVPEVVG 
WARSAGFRQL SLDLIYGAPG ESESDWAASL DTVIELAPDH VSAYALTVEE GTKLSRRVRR 
GELLEPDDDL LADRYLQADE ALAAAGLTNY EVSNWARDQS SWCRHNMGYW RGDDWWGLGP 
GAHSHVGGVR WWNVRHPTEY ATRVGAGHSP AAGREVLDAQ ARRVERVMLG VRLVEGLGVD 
ALGEQALDVA AELAADGLIV ADVLAQGRVA LTRRGRLLTD TVVRALLPD