Gene Franean1_3045 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3045
Symbol
ID	5671424
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3578882
End bp	3579868
Gene Length	987 bp
Protein Length	328 aa
Translation table	11
GC content	64%
IMG OID	641241943
Product	periplasmic binding protein
Protein accession	YP_001507363
Protein GI	158314855
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0614] ABC-type Fe3+-hydroxamate transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	30
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTTA CCAGACCACG GCGCCGCAGT GCGGCCCTGG TCGCCGCGTT GCTGGGCACC 
GTGATCCTCC TTGCGGGGTG CGGCAGCGAC GACAGCGACG ATCAAGGTGG CGCGGTCGGA 
GCGACCCGCA CTGTGGAGGC CGACAACGGC GCGGTCGAGA TTCCGGCGCA CCCGCAGCGG 
ATTGCAACGC TCGGGAGACT AACCGTGTCG TTCCTCGACC TCGGCGGCGA GCCAGTGGGC 
GTCACGGAGG TGGACGCTTC CGTGCTCGAC GTACTGCCCG AGGAGCAGCA GGCCGCGTAC 
AAGGCGGCCA AGCTCCTCGG CTCCGGCGCC AGCGAAGCCG ACCTCGAGCT GCTGGCCACC 
CTCAAGCCCG ACCTCATCTT GTTCTCCGCA CCTGACTCCG ACTTCGAGCA GATGAAGTCG 
CAACTGGAAT CGATCGCACC GACGATCTTC TTCGGATTCA GCTCGGACTG GAAGACCCGC 
CTGTCCGTGA CCGCGGATGC CACTGAGTTG ACAGATGCTC TCAACGAGCA GAAGACCGAG 
TATGAGGAGA AGCTCGCCGA GTTCCAGAAC AAGTACCCGG AGATCATAAA GACCACCAAG 
TTCGGCGAAG TCAACAGAGG TTCTTGGCAG GACGCAGGAA TGTTCACCCT CAACGGCTCG 
CAGTGCTCGG AGATAGCGCG AGCGGACATT CCCCTCGACA TACCCGATCT GGGCGAAGGG 
GGCGAGGAGC GATCGTTCGA GCAGATCGGC GGCCTGTCCG AGTACGACGT GCTCCTGTAC 
CCCGTGGACG CTGAGGGTAA GGTCACGGAA GGCTTCGCCC CCGTGGCGGA ATCGGGCGCA 
TGGAAGGCCC TTCCCGCCGT GACCTCGGGC AAGGCCCTGG GTGTCTACTG CTTCGGCGAT 
GTCAGCTTCA CCAGATCCTA TCGGACCTAC TCTCAATACC TGGATTCGCT CGGCCAGGCG 
CTGGCGAAGC TCGCGACGGC GGGATGA

Protein sequence

MTFTRPRRRS AALVAALLGT VILLAGCGSD DSDDQGGAVG ATRTVEADNG AVEIPAHPQR 
IATLGRLTVS FLDLGGEPVG VTEVDASVLD VLPEEQQAAY KAAKLLGSGA SEADLELLAT 
LKPDLILFSA PDSDFEQMKS QLESIAPTIF FGFSSDWKTR LSVTADATEL TDALNEQKTE 
YEEKLAEFQN KYPEIIKTTK FGEVNRGSWQ DAGMFTLNGS QCSEIARADI PLDIPDLGEG 
GEERSFEQIG GLSEYDVLLY PVDAEGKVTE GFAPVAESGA WKALPAVTSG KALGVYCFGD 
VSFTRSYRTY SQYLDSLGQA LAKLATAG