Gene Franean1_5042 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5042
Symbol
ID	5673378
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6042669
End bp	6043796
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	72%
IMG OID	641243893
Product	cation diffusion facilitator family transporter
Protein accession	YP_001509308
Protein GI	158316800
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0053] Predicted Co/Zn/Cd cation transporters
TIGRFAM ID	[TIGR01297] cation diffusion facilitator family transporter

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.0727034
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCACCAC GCCGCATTGA TCGTTTTCGT CTATCGTCCT GGACCGTGAA CAGCGGCCAC 
GAGCATGAGC GCCCCATGCA CGGCCACGGC CATGCTCACC AGCACGGCCA TCCTCCTGGC 
GGGCACGCGC ACGAAGGCGG GCATGACCGC CACACGAACG GATGGTGGGC GCGGCTTCGT 
CACAGCCTGT CGGGCATGCT CGGAGGACAC AGCCACGACC CGGCGGACCA GATCGACGGC 
GTGGTGGAAG CCGACACCGC CGGCCGCCGC GCCCTGCTGA TCAGCCTGGC CGGTCTCGGC 
CTGACCGCCG CCCTCCAAGC CGTCGTGGTG GCGCTGTCCG GATCGGTGGC ACTGCTAGGC 
GACACCCTGC ACAACATCGC CGACGCGCTC ACCGCCGTCC CGCTGCTACT CGCCTTCACC 
GTCGCACGCC GCCCGGCCAC CGCCCGGTTC ACCTACGGCT ACGGCCGCGC CGAAGACCTC 
GCCGGCCTCG CCGTCCTCGT GATGATCAGC CTGTCGAGTC TGGTCGCTGC CTGGGCCGCG 
ATCGACCGCC TGCTCCACCC CCAGCCCATC AACCATCTGA CCGCGGTCGC CGCGGCAGGG 
CTCGTCGGCT TCCTCGGCAA CGAGACCGTC GCCCGCTACC GCATCCGCGT CGGCCACCAG 
ATCGGCTCCG CCGCCCTCGT CGCCGACGGG CTGCACGCCC GCACCGACGG CTTCACCAGC 
CTCGCGGTCC TGTTCGGCGC CGCCGGCGTC GCGGCCGGCT GGCGGTGGGC CGACCCCGTC 
ATCGGCCTGG CGATCACCCT GGCGATCCTC GGGGTCCTGC GCTCCGCCGC CCGCGTCGTC 
GGCGCCCGGC TTATGGACGC TGTCGACCCC GCCCTCGTCG CCGAAGCCAC CAGGACACTT 
CTGCACACCG ACGGCATCGA AACCGTCCGC GAACTACGGC TGCGCTGGAT CGGTCACACC 
CTGCGCGCCG AAGCCGACGT CACCGTCGAT GCGCACCTGA CCCTGGCCGC AGCCCACGAC 
CTCGCCCATG CCGCCGAGGC CCACCTGCTG CGCCACATCC GCCGCCTGTC CGCCGCCACC 
ATCCACATCA GCCCCGCCCA CCACCACAAT CCAACGACGG TCCCTTAA

Protein sequence

MPPRRIDRFR LSSWTVNSGH EHERPMHGHG HAHQHGHPPG GHAHEGGHDR HTNGWWARLR 
HSLSGMLGGH SHDPADQIDG VVEADTAGRR ALLISLAGLG LTAALQAVVV ALSGSVALLG 
DTLHNIADAL TAVPLLLAFT VARRPATARF TYGYGRAEDL AGLAVLVMIS LSSLVAAWAA 
IDRLLHPQPI NHLTAVAAAG LVGFLGNETV ARYRIRVGHQ IGSAALVADG LHARTDGFTS 
LAVLFGAAGV AAGWRWADPV IGLAITLAIL GVLRSAARVV GARLMDAVDP ALVAEATRTL 
LHTDGIETVR ELRLRWIGHT LRAEADVTVD AHLTLAAAHD LAHAAEAHLL RHIRRLSAAT 
IHISPAHHHN PTTVP