Gene Franean1_1494 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1494
Symbol
ID	5669898
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1794993
End bp	1796144
Gene Length	1152 bp
Protein Length	383 aa
Translation table	11
GC content	74%
IMG OID	641240414
Product	bifunctional uroporphyrinogen-III synthetase/response regulator domain protein
Protein accession	YP_001505840
Protein GI	158313332
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1587] Uroporphyrinogen-III synthase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.074261
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGACT CCGGCCCGGT GACGGCGCCC GTCGAGCCGC TCGCCGGTTA CACGGTCGCG 
CTCACCGCGG CGCGCCGGCG TGAGGAGTTC GGCGCGGCCC TGGAGCGACG CGGCGCCAAG 
GTCGTCTACG CCCCCGCCAT ACGCATCGTG CCGCTCGCGG ACGACGCCCG GCTGCGGGAG 
GCCACCGAAC GCTGCATCGC CGCACCCGTG GACGTCGTCG TCGCCACCAC CGGAATCGGC 
TTCCGGGGCT GGGTCGACGC GGCCGAGACG TGGGGTCTCG CCGACCGGCT GGTCGCGGCG 
TTCGAGTCGG CGGACCTGCT GGCACGCGGG CCGAAGGCGC GCGGTGCGAT CCGGGCAACC 
GGGCTGCGTG AGGCGTGGTC ACCCGAGTCG GAGTCATCCT CCGAGGTCAT GTCATACCTG 
ACCGCCCACG GTGGCCTGGA CGGCAAGCGG ATCGCGGTGC AGCTGCACGG CGAGCCACTG 
CCGGACATGG TCCAGACGCT GTGCGCGGCA GGCGCCGAGG TCATCGAGAT TCCCGTCTAC 
CGGTGGGTCC CGGCGCAGGA CATGGCTCCC GTCCGCCGCG TGGTGGAGTG CGTCGCGGCA 
CGGTCGCTGG ACGCGGTCGC GTTCACGAGC GCGCCCGCCG CCGCGAGCTT CCTGCAGACA 
GCCGACGAGA TGGCGCTGCG ATCCGCCGCC GCGGAGGCGA TGCGCGGCCC GGTTGTCGCC 
GCCTGCGTCG GCCCGGTGAC GGCCGCTCCC CTCGGGCGGG CTGGGATTCC GTGCGTGATC 
CCGTCGCGGG GACGTCTGGG CGCGCTTGTC CGGGAGATCG TGGAGCAGGT GCCCATCCGG 
CGTGGCCTGC GACTGCGCGT CGGCGAGCGC GCGCTGGACG TCCGTGGCCA CGCCGTGGCC 
GTCGACGGTG TGCTCGTCGC GCTGCCCGCC GCCTCGATGA CGCTGCTGCG CGCCCTGGCG 
GCCAGGCCTG GCTATGTCGT CTCCCGGGCG GACCTGCTCA ACCTGACCGG CACGACCGAC 
GAGCACGCGC TCGAGGTCGC CGTGGGCCGC CTGCGCACGT CGCTCGGCGA CCCCGCCCTC 
ATCCGGACCG TGGTGAAGCG CGGATACCGG CTCGACTGTG AGCCGGTATC CGCCTCCTCC 
GGGTGCCTCT AG

Protein sequence

MTDSGPVTAP VEPLAGYTVA LTAARRREEF GAALERRGAK VVYAPAIRIV PLADDARLRE 
ATERCIAAPV DVVVATTGIG FRGWVDAAET WGLADRLVAA FESADLLARG PKARGAIRAT 
GLREAWSPES ESSSEVMSYL TAHGGLDGKR IAVQLHGEPL PDMVQTLCAA GAEVIEIPVY 
RWVPAQDMAP VRRVVECVAA RSLDAVAFTS APAAASFLQT ADEMALRSAA AEAMRGPVVA 
ACVGPVTAAP LGRAGIPCVI PSRGRLGALV REIVEQVPIR RGLRLRVGER ALDVRGHAVA 
VDGVLVALPA ASMTLLRALA ARPGYVVSRA DLLNLTGTTD EHALEVAVGR LRTSLGDPAL 
IRTVVKRGYR LDCEPVSASS GCL