Gene Franean1_4323 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4323
Symbol
ID	5672678
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	5164138
End bp	5165763
Gene Length	1626 bp
Protein Length	541 aa
Translation table	11
GC content	72%
IMG OID	641243196
Product	hypothetical protein
Protein accession	YP_001508613
Protein GI	158316105
COG category	[I] Lipid transport and metabolism [R] General function prediction only
COG ID	[COG0183] Acetyl-CoA acetyltransferase [COG1545] Predicted nucleic-acid-binding protein containing a Zn-ribbon
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.51495
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCCAC TCCCCGAGCT CACCCCCGCC ACCGAGTGGT TCTGGACCTC CGGCGCCGAC 
GGCACCCTGC GGGTGCAGGG CTGTTCCGAC TGCGGCCAGC TCGTTCACCC GCCGGTGCCG 
ATCTGCCCGA AGTGCCGCAG CCGCAACTGG GCGCCGACGG CGGTGTCCGG CCGGGCCACG 
GTCGTCGGGT TCACGGTGAA CGCGCAGCAG TGGTCACCGG CGATGAAGCC GCCCTACGTG 
ATCGCCAACG TGGCCCTGGT GGAGGACGCC GGCGTCCGGC TGACCACGAA CATCATCGGC 
TGCGAGCCGA AGGACGTGCA CATCGGCCAG GAGGTCGACG TCCGCTTCGA GCAGCACGAG 
GACGTCTGGC TGGCGCTGTT CGAGCCGACC GGCACAACCG ACCCGACCGA CCGCGTCGGT 
GAGCCGAACC TGCCCACCCC CCGCGCGCCG CTGAGCTCGG ACCGCTTCGA GCACCGCGCG 
GTCCTCTCCG GCATCGGGCG CTCGGCGATC GGGCGCCGGC TGATGGTCGA CCCGCTGTCG 
CTGACCATCG ACGCCTGCCT CAAGGCAGTC GAGGACGCCG GCCTGCGGCT GGAGGACATC 
GACGGGCTCT CCACCTACCC GGGGGCCGGC GCGGCGGGAA TGAGCGAGGG CGGGGTGAGC 
GCCGTCGAGG AGGCGCTGCG CATCCACCCG ACCTGGACGA ACGGCGGCGG CGACCTGCCC 
GGCCCGGGTG GCTCGGTCAT CACCGCGATG ATGGCGGTCG CCTCGGGCCT GTGCCGGCAC 
GTCCTGTGCT TCCGGACGGT GTGGGAGTCC ACCTACCGGG CGCTCGGCCT GGGCCAGGCA 
CCCGCGCGGG TCTCCAACCC TTCTTCGCTG TGGCGCGCGC CGTTCGGGGC GCTGTCGGCG 
GCGAACTGGA TCGCCATGAA CGCCAACCAG TACTTCCACC GTTACGGCGC CGACCGGGAG 
ATGCTCGCCG CGATCGCCCT CAACGGCCGG GCCGGCGCGG CGCGCAACCC GGCGGCCATC 
TACCGGGAGC CGCTGACCCT CGACGACTAC ATGTCGGCGC GGCCCATCAC GACGCCGTTC 
GGGCTCTACG ACTGCGACGT CCCGTGCGAC GCGTCGATCG CGGTCATCGT CTCCGACGCC 
TCGGTGGCCG GCGACCTGCC GAAGCCGGCC ATCCGCGTCG AGGCGGTCGG GACGCAGATC 
CTCGAGCGGG TCTCCTGGGA CCAGGGCATC ATCACGCACG AGCCGCAGGT GCTGGGCCAG 
TCCTCGCATC TGTGGACCAG AACGGACATG CGCCCCTCGG ATGTCGACCT GGCCCTGGTC 
TACGACGGCT TCACCTTCAA CGCGATCTCC TGGATCGAGG CGCTGGGATT CTGCGGCATC 
GGCGAGGCCA AGGACTGGCT GGACCAGGGC CGGCGGATCG CGATCGACGG CGAGCTACCC 
ATCAACCCGC ACGGCGGCCA GCTCTCCGAG GGCCGCACCC ACGGGTACGG GTTCTTCTAC 
GAGGCGATCA CCCAGCTTCG CCACGAGGCC GGCGAGCGGC AGGTCGCCGA CGCGCGGACG 
GCCGTGGTCA CCTCCGGCGG CGGCACGCCG TCCGGCGTAC TGCTCCTCCA GCGCGACGGC 
GTGTGA

Protein sequence

MRPLPELTPA TEWFWTSGAD GTLRVQGCSD CGQLVHPPVP ICPKCRSRNW APTAVSGRAT 
VVGFTVNAQQ WSPAMKPPYV IANVALVEDA GVRLTTNIIG CEPKDVHIGQ EVDVRFEQHE 
DVWLALFEPT GTTDPTDRVG EPNLPTPRAP LSSDRFEHRA VLSGIGRSAI GRRLMVDPLS 
LTIDACLKAV EDAGLRLEDI DGLSTYPGAG AAGMSEGGVS AVEEALRIHP TWTNGGGDLP 
GPGGSVITAM MAVASGLCRH VLCFRTVWES TYRALGLGQA PARVSNPSSL WRAPFGALSA 
ANWIAMNANQ YFHRYGADRE MLAAIALNGR AGAARNPAAI YREPLTLDDY MSARPITTPF 
GLYDCDVPCD ASIAVIVSDA SVAGDLPKPA IRVEAVGTQI LERVSWDQGI ITHEPQVLGQ 
SSHLWTRTDM RPSDVDLALV YDGFTFNAIS WIEALGFCGI GEAKDWLDQG RRIAIDGELP 
INPHGGQLSE GRTHGYGFFY EAITQLRHEA GERQVADART AVVTSGGGTP SGVLLLQRDG 
V