Gene Franean1_6115 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6115
Symbol
ID	5674436
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7441576
End bp	7443090
Gene Length	1515 bp
Protein Length	504 aa
Translation table	11
GC content	70%
IMG OID	641244967
Product	UbiD family decarboxylase
Protein accession	YP_001510365
Protein GI	158317857
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0043] 3-polyprenyl-4-hydroxybenzoate decarboxylase and related decarboxylases
TIGRFAM ID	[TIGR00148] UbiD family decarboxylases

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.612596
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.345473
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGAGCGCC CTGGGACAGG GTACGACCAG CGGCCCTTCG TCGGCGCTGC AAAGATGGAC 
GCCATGGCCT GGGCCGATCT CCGCGCGTTC CTCGCTCACC TCGACCGGAG CGGGGACCTT 
CGCCGGGTGC GGGTTCCCGT CGATCCCCGC CTGGAGGTGA CCGAGATCGT CACCCGGGTC 
GTCCGCGAAC GCGGCCCGGC ACTGCTCTTC GACAAGCCCC TCGGTTCCGA CATGCCGCTG 
GCGATCAACG TGTTCGGCAC CGAGGCCCGG ATGGCCGCGG CGCTCGGCGT CGACCGCCTC 
GACGACGTCG GCACGCGCAT CGGCGAGATG CTGCGCCCCG AGCTGCCAGT CGGCTTCGGC 
GGCCTGCGTG GCGCGCTCGG CAAGGCCGCG CAGCTCACCT CCCTGCCGCC GCGCAAGGTC 
CGCACCGCTC CCTGCCAGGA CGTCGTCCTC AAGGGCTCGG ACGTCGACCT GAACCTGCTG 
CCCGGCGTGC ACGCCTGGCC GCGTGACGGC GGGCCGTTCC TCAACCTGGG GCTGACCCAC 
ACGAAGCATC CCGAGACCGG GGCGCGCAAC CTCGGCATGT ACCGGCTGCA GCAGCACGAC 
GCCCGCACCG TCGGCATGCA CTGGCAGATC CACAAGGACT CCAACGCCCA CCACGCCGTC 
GCCGAGCGGC GCGGCGAGCG GCTGCCGGTC GCGATCGCGT TCGGCTGCGA CCCCGCTGTC 
ACCTACGCGG CGTCCGCCCC GCTGCCCGCC GAGATCGACG AGTACCTGTT CGCCGGCTTC 
CTGCGCCGCG AGCGCGTCGA GATGGTCGAC TGCCTGACCG TCCCGCTCCA GGTGCCGGCG 
AACGCCCAGG TCGTGCTCGA GGGCTGGCTC GAGCCCGGCG AACGGCTGCC CGAAGGCCCC 
TTCGGAGACC ACACCGGCTT CTACACGCCG ATCGAGCCGT TCCCCGCGCT GCACGTCGAC 
GTGATGACCA TGCAGCGCGA CCCGGTCTTC CAGAGCATCG TGGTCGGACG TCCACCGCAG 
GAGGACGGGC CGATGGGCAA GGCGACCGAG CGCATCTTCC TGCCGCTGAT CCGGATGATG 
ATCCCCGAGA TCGTCGACTA CGACCTGCCC GAGGCCGGGG TCTTCCACAA CTGCGCGATC 
GTCTCGATCG AGAAGCGGTT CCCCAAGCAC GCCCAGAAGG TGATGAACGC GGTCTGGGGC 
GCGGGCCTGC TCTCGCTGTC GAAGCTGATC GTCGTCGTCG ACGCCGACTG TGACGTCCAC 
GACTACCACG AGGTCGCCTG GCGGGCGTTC GGCAATGTGG ACTACGCGCA CGATCTGCTC 
ACCACGGTGG GCCCGGTCGA CCACCTCGAC CACGCCTCCT ACGAGCAGTT CTACGGCGGC 
AAGGTCGGGG TCGACGCGAC CCGCAAGCTG CCCACCGAGG GATACCGGCG CGACGGCGGA 
TGGCCCGAGG AGATCGTCAT GGATGAGGCC GTCCGGGACA GGGTGACGCG TCGGTGGAAG 
GAGTACGGCC TGTGA

Protein sequence

MERPGTGYDQ RPFVGAAKMD AMAWADLRAF LAHLDRSGDL RRVRVPVDPR LEVTEIVTRV 
VRERGPALLF DKPLGSDMPL AINVFGTEAR MAAALGVDRL DDVGTRIGEM LRPELPVGFG 
GLRGALGKAA QLTSLPPRKV RTAPCQDVVL KGSDVDLNLL PGVHAWPRDG GPFLNLGLTH 
TKHPETGARN LGMYRLQQHD ARTVGMHWQI HKDSNAHHAV AERRGERLPV AIAFGCDPAV 
TYAASAPLPA EIDEYLFAGF LRRERVEMVD CLTVPLQVPA NAQVVLEGWL EPGERLPEGP 
FGDHTGFYTP IEPFPALHVD VMTMQRDPVF QSIVVGRPPQ EDGPMGKATE RIFLPLIRMM 
IPEIVDYDLP EAGVFHNCAI VSIEKRFPKH AQKVMNAVWG AGLLSLSKLI VVVDADCDVH 
DYHEVAWRAF GNVDYAHDLL TTVGPVDHLD HASYEQFYGG KVGVDATRKL PTEGYRRDGG 
WPEEIVMDEA VRDRVTRRWK EYGL