Gene Franean1_3046 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3046
Symbol
ID	5671425
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3580023
End bp	3582014
Gene Length	1992 bp
Protein Length	663 aa
Translation table	11
GC content	68%
IMG OID	641241944
Product	transport system permease protein
Protein accession	YP_001507364
Protein GI	158314856
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG4779] ABC-type enterobactin transport system, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGATGCG CTGTTTCATC CGTCGGCCGA CATCGATCAG TTCTCGATCC GCGACTACCG 
TCTGCCGCGC ACGGTCGTCG GGCTCGTCGT AGGCATGGCG TTGGGGGTCG CGGGGGCGTT 
GATCCAGGCA TTGACGCGCA ATCCGCTGGC CGACACCGGT ATCCTCGGCG TGGGCGCGGG 
TTCCTCCTTC GCGGTGACCA TGGCCGTCGG CGTGCTCGGA ATCCGCGATA TCAGTGGCTA 
CATGTGGTTC GCGTTCGCCG GGGCACTGAT CGTCACGATC ATGGTCTTGC TCCTGGGATC 
GACCCGACGC GGCCAGTCGC CGGGAGTCAT GGTGCTCGCC GGGGTCTGTG TCAGCGCGGT 
GCTCGATGGC GCCGGGTCGG CACTTCAGCT GACCAACCCG GACGCGTTCG ATGCGATGCG 
GTCGTGGACT GCCGGTTCGA TCCTGGGGCG CCCCCTCGAC GTGGTGTGGC CGGTCCTGCC 
GTTCTTCGCC GTGGCGCTCA TTCTGGCCTT TGCGGTGTCG GGTCCACTCA ACGCGATGGC 
TCTCGGCGAC GAGATCGCCG CCGCCCAGGG CGTCCGTCTG GCTCGTACCC GCGTCCTCGC 
GATCATCGCG ATCACACTGC TCGCTGGAGG CGCGACCGCC ATCGCGGGCC CCATCGGATT 
CGTCGGGCTC ATGGTGCCGC ACGTGGCCCG CTGGTTCGTC GGACCGAACC AGCGCTGGGT 
CTTCGCCTAC AGCATCCTCC TCGCCCCGAG CCTGCTGCTG GCCTCCGACG TTCTCGGGCG 
AATCGTCATG CGGCCCAGCG AGATCCCCGT GGGTATCGTC ACCGCCTTCA TCGGCGCCCC 
CGTTCTCATC GCACTGGTGC GGCGGAAGAA GGCGAGCGGA CTATGAGTAT CGGCGTTACT 
TCTCGGTCCG GACTAACGCG CCATCGCTCA ACAGGTGGGG CTCCCGGGGG GCGGCTGGAC 
TTCGGGCGGC GGGTGCTGGT GCTGCGGCGA TGGAGGATCG CGGTCCGGCT CGAGTGGCGC 
TCGGTCATCG TCTGCGCGGT GCTCGCGGTC GCGGTCGCCT GCATGGCGGT GCTCGCGCTG 
ATGACGGGCT CGTACCAGCT CAGCCCTGGG CAGGTGGTCT CCGCGCTGGT CGGCGGGGAG 
ACCGGGCTGG TCCACGACAT CGTGGTCGAG TGGCGGGCGC CCCGGGTGGT TGCGGCGCTG 
GTGTTCGGTG CCGCGTTGGG GGCGAGCGGG GCGGTCTTCC AGTCGATGTT GCGCAACCCG 
CTCGCTGACC CCAGCATCAT CGGATTCTCC CAGGGCTCCT ACACCGGCGC GTTGATCGTG 
ATCCTCCTCA TCAACGGCAC CTACGTGCAG TTGATAGGCG GGGCGTTGCT AGGGGGGATG 
GCCACCGCCA TCGCCGTGTA CGTGCTCGCC TACCGGCGAG GGGTGCAGGG GTTCCGGTTG 
ATCATTGTCG GCATCGGCGT CTCGGCGATG CTCGGCTCGC TCAACACCTG GTTGATACTC 
AGAGCCGACC TGGAACAGGC GATTGCAGCC GCCGCGTGGG GCGCCGGATC ACTCAACGGG 
GTGTCCTGGG ATCAGGTGGC CATCGGCGGT GTGTGCATCG CTGTGCTTCT GCTGTTGGCT 
GCGATGTTGA GCCGGCCGAT GCGGCAGATG GAGCTGGGTG ATGATACCGC CGCCTCCCAA 
GGGGTGCGGG TCTCGCCCGC CCGCCTCGGC ATGGTCGTGG TGGGGGTGGC GTTGACGGCG 
ATTGTCACGG CTGCATCGGG GCCGATCGCG TTCATCTCCC TGGTCGCGCC GCAGATCGGA 
CACCGCCTTG TCCGCACTGC GGGGATAACC CTCGCACCCG CCGCCTTCGT CGGCGCGCTG 
CTGTGTCTGG TGGCGGACTA CCTCGCCCAG CACGTCGCCC CAACTCCCCT GCCGGTGGGG 
ATCATCACCG TCATGCTCGG CGGTGGGTAC CTCGGGTATC TGCTTTTCAC CGAAGCCAGG 
AGACGCCTAT GA

Protein sequence

MGCAVSSVGR HRSVLDPRLP SAAHGRRARR RHGVGGRGGV DPGIDAQSAG RHRYPRRGRG 
FLLRGDHGRR RARNPRYQWL HVVRVRRGTD RHDHGLAPGI DPTRPVAGSH GARRGLCQRG 
ARWRRVGTSA DQPGRVRCDA VVDCRFDPGA PPRRGVAGPA VLRRGAHSGL CGVGSTQRDG 
SRRRDRRRPG RPSGSYPRPR DHRDHTARWR RDRHRGPHRI RRAHGAARGP LVRRTEPALG 
LRLQHPPRPE PAAGLRRSRA NRHAAQRDPR GYRHRLHRRP RSHRTGAAEE GERTMSIGVT 
SRSGLTRHRS TGGAPGGRLD FGRRVLVLRR WRIAVRLEWR SVIVCAVLAV AVACMAVLAL 
MTGSYQLSPG QVVSALVGGE TGLVHDIVVE WRAPRVVAAL VFGAALGASG AVFQSMLRNP 
LADPSIIGFS QGSYTGALIV ILLINGTYVQ LIGGALLGGM ATAIAVYVLA YRRGVQGFRL 
IIVGIGVSAM LGSLNTWLIL RADLEQAIAA AAWGAGSLNG VSWDQVAIGG VCIAVLLLLA 
AMLSRPMRQM ELGDDTAASQ GVRVSPARLG MVVVGVALTA IVTAASGPIA FISLVAPQIG 
HRLVRTAGIT LAPAAFVGAL LCLVADYLAQ HVAPTPLPVG IITVMLGGGY LGYLLFTEAR 
RRL