Gene Franean1_0108 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0108
Symbol
ID	5668533
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	126171
End bp	127487
Gene Length	1317 bp
Protein Length	438 aa
Translation table	11
GC content	72%
IMG OID	641239036
Product	putative ABC transporter
Protein accession	YP_001504481
Protein GI	158311973
COG category	[C] Energy production and conversion [P] Inorganic ion transport and metabolism
COG ID	[COG1668] ABC-type Na+ efflux pump, permease component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.850247
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	20
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCCGG AATCCGATCA CGAACACGGC CGCGAGGCCA CGGCCGGCCC GGCCCCAGGC 
ATCCCGGCCC AGACCGGTGC CGGGCCGGCG CCGGCGCCGG GTTCCGGTGG CCGGGGCGAC 
TATCCGGCGC TGGGCTCCTG GGCGACCGTG CGGCTCGTCG CCGGTCGCGA GCTCGGCGTA 
CGGCTGCGTT CCAAGGTCTT CCGGATCACC ACCGTCGCCC TCCTCGTCCT GCTCGTCGGC 
GCCGCGGTCG TGATCGATCT GGTCGACGGC GGCGATTCGA CGGAGTCCGT CGGCGTGACG 
GCGGCGGAAT CCGCGATCAC GGCGCCGCTC ACCGCCGCCG CCCGGAGCCT GGACGTCGGC 
ATCACGACCC GCGAGGTGCC CGACGAGGCC ACCGGGTTGC GCCAGGTCGC CGACGGCGAT 
CTGGACGCCC TGGTGACCGC GTCCCCGAAC GGCCTGCGCG TTGCCGTCAA GGAGGACCTG 
AACGACGAGT GGCGCGCCGT GCTGGCTGTT GTGGCCCGCC AGCAGGTTCT CGACAACGAG 
ATCAGCGTGC TCGGCGGCGA CCCGGCCCGG GTGAACGAGG CGGTCGCCGC CACGCGGGTC 
GATGTCACCC AGCTCGACCC GGCGCCGGCC CACCAGGGCG AGCGGCTCGT CCTCGGGATC 
GCCGCCGCGT TGCTGATCTA CATGGGCCTG ATGCTCTACG GGCCGGCCGT TTCCCAAGGG 
GTGGTCGAGG AGAAGTCGAG CCGGGTGGTC GAGCTGCTGC TGTCGACGGT CCGCCCGTGG 
ACGCTCATGG CCGGCAAGGT GTTGGGTATC GGGCTGGTAG CGCTGATCCA GATGATCGTG 
CTGGCCGGCG GGGGCCTGGT CGCCGCGCTG GTCACCGGCG CGCTCTCGCT GCCCTCCGGC 
GAGGCCACCG GGACGGTGAT CTGGTCGGTG GTCTGGTACG TCATCGGGTT CTTCCTCTAC 
GCCCTCCCGT TCGCCGCGGT CGGGGCGATG GTCTCCCGGC AGGAGGACGT CGGGGGCATC 
TCGAGCCCCA TCGTGCTGGC GATCGTGGTG CCCTGGGTGC TGGGGATCTC GATCGTGCCG 
GGCGATCCCG ACAACGGCCT GATCGCGGTG CTGTCCCTGC TGCCGATCTT CGCGCCGGTG 
CTGATGCCGA TGCGGATCGC TCTCGGGGTG GCGCCGGTGT GGCAGTTGGT CCTCTCGGTG 
GTGCTCGCCT TGGCGCTGAT CGGCGTGCTC ATCCGGCTCA CCGGGCGGAT CTACCGCAAC 
GCGGTGCTGC GGACCGGGGC GAGGGTCTCC TTCCGGGACG CCCTGCGCGA GGCCTGA

Protein sequence

MSPESDHEHG REATAGPAPG IPAQTGAGPA PAPGSGGRGD YPALGSWATV RLVAGRELGV 
RLRSKVFRIT TVALLVLLVG AAVVIDLVDG GDSTESVGVT AAESAITAPL TAAARSLDVG 
ITTREVPDEA TGLRQVADGD LDALVTASPN GLRVAVKEDL NDEWRAVLAV VARQQVLDNE 
ISVLGGDPAR VNEAVAATRV DVTQLDPAPA HQGERLVLGI AAALLIYMGL MLYGPAVSQG 
VVEEKSSRVV ELLLSTVRPW TLMAGKVLGI GLVALIQMIV LAGGGLVAAL VTGALSLPSG 
EATGTVIWSV VWYVIGFFLY ALPFAAVGAM VSRQEDVGGI SSPIVLAIVV PWVLGISIVP 
GDPDNGLIAV LSLLPIFAPV LMPMRIALGV APVWQLVLSV VLALALIGVL IRLTGRIYRN 
AVLRTGARVS FRDALREA