Gene Franean1_2440 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2440
Symbol
ID	5670836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2901455
End bp	2902552
Gene Length	1098 bp
Protein Length	365 aa
Translation table	11
GC content	76%
IMG OID	641241357
Product	cation diffusion facilitator family transporter
Protein accession	YP_001506778
Protein GI	158314270
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG1230] Co/Zn/Cd efflux system component
TIGRFAM ID	[TIGR01297] cation diffusion facilitator family transporter

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.516557
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.641383
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAACACCC CCGAAGGCCG CCACGGTGAC CACGGGCACG ACAACGGTCA GGGTCTCGTC 
CCGCCGCAGA CCCGGCCCGC CCACGGCCAC GACTCCGGCC ACACCCACGC CCACGGCGGG 
CCCTGCGCGC CGGGCGGGCA CGAGCACGCG GCGGGTGGGT CCGCTCCGCG CGGCTTCGAC 
TCCCAGCACC GCAGGCTGGC GTTCGCGACG GGCCTGAACG TCGCGATCGT CGTCGGCCAG 
GCCGCGGCCG GGCTGCTCGT CGGGTCGGTC GCCCTGCTCG CCGACGCCGC GCACAACCTC 
GCGGACGCGG CGGGCGTCGC GTTCGCGCTG ATGGCGATCC GGCTCGCGAG GCAGGCGCCG 
TCCGCCACCC GGACCTTCGG CGGGCTGCGC TGGCCGGTGC TCGCCGCCCA GGCGAACGCG 
GCGAGCGTGC TGGTCGTGAC CACCCTGGTC TGCGTCGAGG CCGCCGGGCG GCTCGCCCAC 
CCCGAGCCGG TCGACGGCTT GGTCGTCCTG ATCGTGGCGA TCGCCGCGGC CGTCGGTAAC 
GGGGTCAGCG CGCTCTTCGT CCACGAACGG CACGGTGATC TCAACACCAG GGCGGCGGTC 
ACCCACCTGG CCGGCGACGC GCTGGTGTCG GTCGCGGTGG CCGGCGCCGG GCTCGTCATC 
TGGCTCACCG GCGGCTGGTA CTGGCTCGAC CCGGCGCTCT CCCTGGTCGT GGCGGCGCTG 
ATCGGGATCC AGGGCGTGCG CCTGCTGGCC GAGTCGTCCC GGGTGCTGCT CGAGGCGACC 
CCCGTCGGGC TGGACCTGGC GGCAGTCCAG GCGGACGTCC TTGCCGTGGA GGGCGTGACC 
GGGGTGCACG ACGTGCACGT GTGGGGCCTG TCCGACCGGG TCGCCGCGGC GAGCGCCCAT 
GTCGAGGTGG CCGGCCATCC GACACTCGAG GAGGCGCGGG CGGTCTCAGA CCGGGTCAAG 
GCGGTGCTGG CGGAGAAGCA CGGCGTCGTG CACGCCACCG TCGAGACGGA GTGCGAGCCG 
TGCTCGCCCG CCGGCGGCGA CCCGTGCGAC GTGCGCAGGG TGACCGTGCA CCAGCTGGCC 
CCGGCGCACC GCCACTGA

Protein sequence

MNTPEGRHGD HGHDNGQGLV PPQTRPAHGH DSGHTHAHGG PCAPGGHEHA AGGSAPRGFD 
SQHRRLAFAT GLNVAIVVGQ AAAGLLVGSV ALLADAAHNL ADAAGVAFAL MAIRLARQAP 
SATRTFGGLR WPVLAAQANA ASVLVVTTLV CVEAAGRLAH PEPVDGLVVL IVAIAAAVGN 
GVSALFVHER HGDLNTRAAV THLAGDALVS VAVAGAGLVI WLTGGWYWLD PALSLVVAAL 
IGIQGVRLLA ESSRVLLEAT PVGLDLAAVQ ADVLAVEGVT GVHDVHVWGL SDRVAAASAH 
VEVAGHPTLE EARAVSDRVK AVLAEKHGVV HATVETECEP CSPAGGDPCD VRRVTVHQLA 
PAHRH