Gene Francci3_1898 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1898
Symbol
ID	3906847
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2231546
End bp	2232661
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	73%
IMG OID	637879236
Product	cation diffusion facilitator family transporter
Protein accession	YP_481003
Protein GI	86740603
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0053] Predicted Co/Zn/Cd cation transporters
TIGRFAM ID	[TIGR01297] cation diffusion facilitator family transporter

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.338439
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAATGGC AGCTGCCACC ATGCCGCATT GATCGTTTTC GTCTATCGTC GCGGAACATG 
AACAGCGGCC ACGAGCATGA GCTCCCCGCC CAAGGGCACG GGCACGGCGG GCACCCGCGC 
GGCGGACGGC ATGACCACCA CGCGAGCGGG CGGTGGACGC GGCTTCGTCA CGGCCTGTCA 
GACCTGGCCG GAGGGCACAG CCACGACCCG GCGGACCAGA TCGACGACGC GTTGGAAGCC 
GACACCGCCG GCCGCCGCGC CCTCCTGATC AGCCTGGCCG GTCTCGGGCT GACCGCCGCC 
CCGCAAGCCG CCGTCGTGGC ACTGTCCGGA TCGGTCGCGC TCCTCGGCGA CACCCTGCAC 
AACGTCGCCG ACGCGCTCAC CGCGGTCCCC CTGCTCATCG CCTTCACCGT GGCACGCCGC 
CCGGCCACCG CCCGGTTTAC CTACGGCTAC GGCCGCGCCG AGGACCTCGC CGGCCTCGCC 
GTCCTCGCGA TGATCGCCCT GTCGAGTGCG CTCACCGCCT GGGCCGCGAT CGACCGCCTC 
CTGCACCCCC AGCGCGTCGG CCATCTGGGA GCGGTCGCCG TGGCCGGGCT CGTCGGCTTC 
CTCGGCAACG AGATCGTCGC CCGCTACCGC ATCAGGATCG GCCATCAGAT CGGCTCCGCC 
GCCCTCGTCG CCGACGGCCT ACACGCCCGC ACCGACAGTC TCACCAGCCT CGCGGTGCTC 
CTCGGCGCGG CCGGTGTCGC GGTGGGCTGG CACTGGGCCG ACCCCGCCAT CGGCCTGGCG 
ATCACCCTGG CGATCCTCGG AGTCCTGCGC TCCGCCGCTC GCGTCGTCGG GGCCCGGCTC 
ATGGACGCCG TCGACCCCGC CGTGGTCGCC GAAGCCACCA GGGCGCTCCT GCACACCGAG 
GGCATCGAGG CCGTCCGCGA ACTGCGGCTG CGCTGGATCG GCCACACCCT GCGCGCCGAA 
GCCGACGTCA CCGTCGATGC GAACCTGACC CTGACCGCCG CTCACGACCT CGCCCACGCC 
GCCGAAGCCC ACCTGCTGCG CCGCATCCGC CGCCTGTCCG CCGCTACCAT CCACACCAGC 
CCCACCCACC ACCACGCCGC CACGACGGTC CCCTAA

Protein sequence

MEWQLPPCRI DRFRLSSRNM NSGHEHELPA QGHGHGGHPR GGRHDHHASG RWTRLRHGLS 
DLAGGHSHDP ADQIDDALEA DTAGRRALLI SLAGLGLTAA PQAAVVALSG SVALLGDTLH 
NVADALTAVP LLIAFTVARR PATARFTYGY GRAEDLAGLA VLAMIALSSA LTAWAAIDRL 
LHPQRVGHLG AVAVAGLVGF LGNEIVARYR IRIGHQIGSA ALVADGLHAR TDSLTSLAVL 
LGAAGVAVGW HWADPAIGLA ITLAILGVLR SAARVVGARL MDAVDPAVVA EATRALLHTE 
GIEAVRELRL RWIGHTLRAE ADVTVDANLT LTAAHDLAHA AEAHLLRRIR RLSAATIHTS 
PTHHHAATTV P