Gene Franean1_5891 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5891
Symbol
ID	5674213
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7153452
End bp	7154708
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	71%
IMG OID	641244740
Product	ABC transporter related
Protein accession	YP_001510142
Protein GI	158317634
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1134] ABC-type polysaccharide/polyol phosphate transport system, ATPase component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.559875
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCGTCGC AACCGCTCGC CCCGCCCCCG ATGCAGCCCG CGCAACCGGC CGCCTCCGCG 
CCGTCGGCGC CGCCGGCACC GGGCGCCCCG GTGGTCATCC GCGCCTCCGG CGTCGGCAAG 
AAGTTCGTCG CCTATCACAA GCGCGCCACC AGCCTGAAGG AACGCTTCGT CCGGCGGGAC 
ACGACGAGCG GCGAGGACTT CTGGGCGCTG CGCGACATCG ACGTCGAGAT CGGCCGCGGG 
CAGACGGTGG GGCTCGCCGG GGCGAACGGC TCGGGCAAGT CGACGCTGCT CAAGGTACTC 
GCCGGAATCC TGCGCCCGAC CCACGGCGAC GTGTCCGTCA GTGGTCGGAT CGCGTCCCTG 
CTCGAGCTGG GCGCGGGGTT CAACGGCGAG CTCTCCGGCC GGGACAACGT CTACCTCAAC 
GCGTCCCTGC TCGGCCTGTC CAAGCGCGAG ATCGACCGGC TCTTCGACTC GATCGTCGAC 
TTCTCCGAGC TGCGCCACAA GATCGACGAC GAGGTCAAGC ACTACTCGTC CGGCCAGTAC 
GTGCGCCTCG GCTTCGCCGT GGCCGTGCAC GTCGACCCGG ACGTCCTGCT CGTCGACGAG 
GTGCTCGCCG TCGGCGACGA GGCGTTCCAG CGCAAGTGCC TGGCCAAGAT CGCCCAGTTC 
CGCGACGAGG GCCGGACGAT CCTGTTCGTC ACCCACTCCC TCGACCTGAT CGAGAACATG 
TGCGACCGGA TCCTGGTGCT GGAGTCCGGC GGCCTGATCT TCGACGGGCA GCCGGTCGTC 
GGGACGAAGC TGCTGCGCCA GCGGCTGGGC AGCCTGCCCG CGGACAGTCC GATCCCCTTC 
GACCTGGCGC CGGTGAAGCC GACGGCGGTG GCGTTCAGCC GCAACCCGGG CGGGCCGACC 
GAGGTGCAGT ACGACCCGGG TGAGCAGCTC ACGGTCAGCG TCGAGCTCGA CCTCACCGAC 
AGCGCGCCGC AGTACGTCTA CCTGCACGTG GAGATCATGG GGCAGGGAGA GGTACCGATC 
TGGATGATGG AGACCCCGCC GGGCGGGGTC AGCCCCGGCC CGGGGACCGC CGTGGTGGAC 
TTCGTCGTCC CCCGGCTGCC CGAGCTGCTG GGGGCGTTCG CGATCAACGT CCGGGTGTCG 
GACGCGGCCA CCGGCCAGCC GGTGACGGTA CGGCGCTTCG AGGAGCTGTT CGGGGTCAGC 
GGCCCGCAGG TCGCCGGGCT GCTCAAGGTC GACTACGAGG CGAGGCTGCG CCGATGA

Protein sequence

MPSQPLAPPP MQPAQPAASA PSAPPAPGAP VVIRASGVGK KFVAYHKRAT SLKERFVRRD 
TTSGEDFWAL RDIDVEIGRG QTVGLAGANG SGKSTLLKVL AGILRPTHGD VSVSGRIASL 
LELGAGFNGE LSGRDNVYLN ASLLGLSKRE IDRLFDSIVD FSELRHKIDD EVKHYSSGQY 
VRLGFAVAVH VDPDVLLVDE VLAVGDEAFQ RKCLAKIAQF RDEGRTILFV THSLDLIENM 
CDRILVLESG GLIFDGQPVV GTKLLRQRLG SLPADSPIPF DLAPVKPTAV AFSRNPGGPT 
EVQYDPGEQL TVSVELDLTD SAPQYVYLHV EIMGQGEVPI WMMETPPGGV SPGPGTAVVD 
FVVPRLPELL GAFAINVRVS DAATGQPVTV RRFEELFGVS GPQVAGLLKV DYEARLRR