Gene Franean1_4898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4898
Symbol
ID	5673238
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5880199
End bp	5881683
Gene Length	1485 bp
Protein Length	494 aa
Translation table	11
GC content	65%
IMG OID	641243753
Product	hypothetical protein
Protein accession	YP_001509169
Protein GI	158316661
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG1232] Protoporphyrinogen oxidase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	4
Plasmid unclonability p-value	0.00550747
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0440629
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGAAA AGCCAGAGGT AGTCGTCATC GGAGCCGGGC CGGCCGGTCT CTCCGCCGGC 
TGGGAGCTGA TGAAGCGGGA GATCCCCGTG ACGATTATCG AGGGTGACTC GGTGGTCGGC 
GGAATCAGCC GTACGGCCCA GCGGGACGGA TGGCGTTTCG ACATCGGGGG CCACCGTTTC 
TTCACCAAGG TCCCCGAGGT CGAGAAGCTG TGGCACGAGA TCCTGCCGGA CGAGGACTTC 
CTACTCCGGC CGCGGTCGAG CCGCATCTAC TACAACGGCA AGTTCTTCGA CTACCCACTG 
AAGGCCGGTA ACGCCCTCGG CGGGCTCGGG GTCGCCGAGG CGGCACGCTG CATCGGCTCG 
TACGCGCTGG CGAAGCTGCG CCCGCCGAAG GACCAGTCGA ACTACGAGAA CTGGCTGGTC 
GCCCGGTTCG GCTGGCGGCT CTACCGCACC TTCTTCAAGA CCTACACCGA GAAGCTCTGG 
GGTGTGAAGG TCAGCGAGAT GCCGTCCGAC TGGGCCGCCC AGCGGATCAA GAGCCTCTCT 
CTGATGAACG CCATCACCAA CGCGGTGCTG CCCAAGCGGA ACCAGAAGGA CATCACCTCC 
CTCATCGAGG AGTTCCAGTA CCCGAAGTTC GGGCCGGGAA TGATGTGGGA GACGGCCGCG 
GACAAGATCG TCAAGCAGGG CGGTCGGATC GTCTTCGAGG AGAAGGTCCG CAAGATCCAT 
CACGAGAACG GGCGCGCGAC CGGTGTCACG ACAGTGGTCA CTGGCGGCTA CGGGCCGGGC 
GCCGGCGCGC CGGAGTCGTC CCGGGATGAC CTAGGCACCG AGTACCAGTA CACCGGCGAC 
CACTTCATCT CCTCGATGTC GTTCTCGTCG CTGGTGCGCG TGATGGACCC GCCGGTCCCG 
GCGCGCGTCC TGGCCGCCGC GAACGCCCTG AAGTACCGCG ACTTCCTCAC CGTCGCGCTG 
GTCGTTCCCA AACCGGCCGG ATTCCCAGAC AACTGGATCT ACATCCACGC TCCGGACGTC 
AAGGTCGGCC GCATCCAGAA CTTCGCGTCC TGGTCGCCGT TCCTGGTGAA GGACGGCCGG 
ACCTGTCTCG GCCTGGAGTA CTTCGTCTTC GAGGGCGACG AGATGTGGAA CTCCTCGGAC 
GAGGAGCTGA TCGCGCTCGG CACCAAGGAG CTGGCCAAGC TGGGCCTCGT CCAGGCGGAC 
CAGGTCGAGG GCGGCTATGT CGTGCGGATG CCCAAGGCGT ACCCGTACTA CGACATGGAC 
TACAAGAAGA ACGTCGACAT CATCCGCGGC TGGCTCGAGG ACTACGCTCC CAACGTCCAC 
CCCGTCGGCC GTAACGGAAT GCACCGCTAC AACAACCAGG ACCACTCGAT GCTCACCGCG 
ATGCTCACCG TCGAGAACAT CATCGACGGG AAGAGCCACG ACGTGTGGGA GGTCAACGTC 
GAGGAGGACT ACCACGAGGA GGTCTCCTCC CCGGGCCGGT CGTAG

Protein sequence

MTEKPEVVVI GAGPAGLSAG WELMKREIPV TIIEGDSVVG GISRTAQRDG WRFDIGGHRF 
FTKVPEVEKL WHEILPDEDF LLRPRSSRIY YNGKFFDYPL KAGNALGGLG VAEAARCIGS 
YALAKLRPPK DQSNYENWLV ARFGWRLYRT FFKTYTEKLW GVKVSEMPSD WAAQRIKSLS 
LMNAITNAVL PKRNQKDITS LIEEFQYPKF GPGMMWETAA DKIVKQGGRI VFEEKVRKIH 
HENGRATGVT TVVTGGYGPG AGAPESSRDD LGTEYQYTGD HFISSMSFSS LVRVMDPPVP 
ARVLAAANAL KYRDFLTVAL VVPKPAGFPD NWIYIHAPDV KVGRIQNFAS WSPFLVKDGR 
TCLGLEYFVF EGDEMWNSSD EELIALGTKE LAKLGLVQAD QVEGGYVVRM PKAYPYYDMD 
YKKNVDIIRG WLEDYAPNVH PVGRNGMHRY NNQDHSMLTA MLTVENIIDG KSHDVWEVNV 
EEDYHEEVSS PGRS