Gene Franean1_2464 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2464
Symbol
ID	5670860
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2933385
End bp	2934401
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	68%
IMG OID	641241381
Product	extracellular solute-binding protein
Protein accession	YP_001506802
Protein GI	158314294
COG category	[E] Amino acid transport and metabolism [T] Signal transduction mechanisms
COG ID	[COG0834] ABC-type amino acid transport/signal transduction systems, periplasmic component/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.00586162
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGACGCG CCGCGCTGGT GGCGGCGGCG CTGATGACCG CAGCGGCGCT GGTTGGGTGC 
TCGACCGTTT CCGGTGACCT GCCCCGCGCG GCCGACCAGC CATGGGAGCC GCTGGTGACT 
GCGTCGGGCG AGGCGGCCGA CGCAGCCCAG GACGCCCGTC CTGAGGCTGC GGTGCCCACG 
AACCTCGTCC TGCCCACCGA CGCCGGGGAC TTCGCGTCGG GAGGATCACT CGACAAGATC 
CGCAAGCGCG GCTTCCTGCG GGTGGGTGTC TCGCGCGACA CCCAGACCCG CGGCGCATGG 
AGTCCGGTGT CGCACCGGTT CGAGGGCTTC GACGTCGAGC TCGCCCAGCG GATCGCGGAG 
GCCCTGTTTG GTCCGGGCAC GGCGGACGAG AAGGTGCGGT ACCGCCCGGT CAGCTACGCG 
GAACGCCTGC CGGCGGTCGA GAACGGGGAG GTGGACATCC TCGTCAGCAC CCTGACCTAC 
TCGGAGTCAC GGGCCGAGCG TGTGGGTTTG TCCGCGGCTT ACTTCACCGC CCATCCACGG 
CTGCTCTCCC ATCGGGAGAG CACGCACTCG GGAGCGGGGC CCGGCATCGA TTCCCCGGAG 
GAACTCGCCG GGAAACGGGT GTGCGCCCCG CGGGGGACGA CGACGCTGAC GAACCTGGAG 
AATACCCATC AAACCCATCC CACGTTCGAG ATCGTGGATC ACCTTAACGA GCTGTCCGAC 
TGTCTGGTTG CCTTCCAGCA GGGTGAGGTC GACGTCGTGG CCGCGAATGA CGCAAGTCTG 
GTGGGGATGC TGGAACAGGA TGCCACCGCC GTACTTGGAA CGTTCTCAGT CGGGCGGGAC 
GAGTACTACA GTGTCGCATT CGAGCGGGAC GACACCGAGC TCGCCGGATT CGTCAACGGG 
GTTTTGGAGC GTCTACGGCG CGACAAGCCG GAGTGGCTGA AATTATGCGA GAGGTGGAAG 
GCTCCCGAGA TGCCCTGCGA GGAGTCGCTG CCACCCGAGC CGCAGTGGGC ACGCTGA

Protein sequence

MRRAALVAAA LMTAAALVGC STVSGDLPRA ADQPWEPLVT ASGEAADAAQ DARPEAAVPT 
NLVLPTDAGD FASGGSLDKI RKRGFLRVGV SRDTQTRGAW SPVSHRFEGF DVELAQRIAE 
ALFGPGTADE KVRYRPVSYA ERLPAVENGE VDILVSTLTY SESRAERVGL SAAYFTAHPR 
LLSHRESTHS GAGPGIDSPE ELAGKRVCAP RGTTTLTNLE NTHQTHPTFE IVDHLNELSD 
CLVAFQQGEV DVVAANDASL VGMLEQDATA VLGTFSVGRD EYYSVAFERD DTELAGFVNG 
VLERLRRDKP EWLKLCERWK APEMPCEESL PPEPQWAR