Gene Franean1_0022 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0022
Symbol
ID	5668449
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	26953
End bp	28206
Gene Length	1254 bp
Protein Length	417 aa
Translation table	11
GC content	68%
IMG OID	641238951
Product	extracellular solute-binding protein
Protein accession	YP_001504397
Protein GI	158311889
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0687] Spermidine/putrescine-binding periplasmic protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.68503
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCAGCA ATGACCGGCA GGGAATTCCC GCGGCACCGG GGGCGTCGCA CGGGGCGGTT 
CCCGACCCGG CGCTGCTGCG CGGCCTGACC AGACGTCGTT TCGACCGACG GGACCTCCTG 
CGCCTCACCA GGGCGGCCGG TAGCGCCGCG CTCCTGGCCG CCTGTGGGGT CAAGGGCGAG 
GCCGGTGATT CGGCGCAGGC CGCCGACGTC GCCGGCTACT GGGCGGGCAA GGCGAAGGCG 
GGAACGCTCG ACTTCGCGAA CTGGCCGCTC TACATGGATG TCGGTAGCAC CGACGCGGAG 
CGTCCCTCGC TCGACCTGTT CACCCAGGAG ACGGGCATCA AGGTCACCTA CCGCGAGGTG 
ATCCAGGAGA ACGAGTCCTT CTTCGCCCAG ATCCGGCCCA GCCTCGCCGA GAACCAGCCT 
ATCGGGTACG ACCTGATGGT TCTGACCAAC GGCATCACCC TCAGCCGGGT CATCCAGCTC 
GGTTACCTCG CCCCGCTCGA CCACAAGAGG CTGCCCACCT TCGCCGCCAA CGCCGACCCG 
AGCGTCAAGG ATCCCGCGTA CGACCCGGGA AACCAGTTCA CCGTGGCCTG GCAGTCCGGT 
ATCACCGGCA TCGCCTACGA CCCGGAGAAG ACCGGCCGGG AGATCACCAG TTTCGCCGAC 
CTCATGGACC CCGCCTTCGC CGGCAAGGTC GGGATGTTCG GTGAGAACCA GGAGCTGCCG 
AACCTGGCGC TACTCGGCAT CGGCGTCGCC CCGGCCGACT CCGCTCCGGA GGACTGGCGG 
CGCGCGGCCG ACAAACTGAT CGAGCAGCGC GACGCCGGAA TCGTCCGCAA GTACTACGAC 
CAGAGCTACA TCGACTCACT CGCCGGCGGC GACCTGTGGA TCTCGATGGC GTGGTCGGGG 
GACGTCTACC AGCAGCTCGC GGCCGGGACG AAGCTGAAGT TCGTGGTGCC GGAGGAAGGC 
GGCCTGATCT GGACCGACAG CATGTGCATC CCGAGGACCG CCGCGCACCC GGTGGACGCC 
CTCACCTACA TGGACTTCGT GTACCGGCCC GACATCGCCG GGATGCTGGC CGAGTACATC 
AACTACATAA CGCCGGTGCC GGCCGCCCGT GACCACGTCT CCCCCGAGCT GGCCGAATCC 
ACGCTGCTGT TCCCGACCCG CGCGGAGTTC GACCGTGTGC ACCGCTTCCG GGTGCTGACG 
ACGGAGGAGG AGACCGAGTG GAACAAGATC TTCCAGCCGG TCTACCAGTC CTAG

Protein sequence

MTSNDRQGIP AAPGASHGAV PDPALLRGLT RRRFDRRDLL RLTRAAGSAA LLAACGVKGE 
AGDSAQAADV AGYWAGKAKA GTLDFANWPL YMDVGSTDAE RPSLDLFTQE TGIKVTYREV 
IQENESFFAQ IRPSLAENQP IGYDLMVLTN GITLSRVIQL GYLAPLDHKR LPTFAANADP 
SVKDPAYDPG NQFTVAWQSG ITGIAYDPEK TGREITSFAD LMDPAFAGKV GMFGENQELP 
NLALLGIGVA PADSAPEDWR RAADKLIEQR DAGIVRKYYD QSYIDSLAGG DLWISMAWSG 
DVYQQLAAGT KLKFVVPEEG GLIWTDSMCI PRTAAHPVDA LTYMDFVYRP DIAGMLAEYI 
NYITPVPAAR DHVSPELAES TLLFPTRAEF DRVHRFRVLT TEEETEWNKI FQPVYQS