Gene Franean1_1966 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1966
Symbol
ID	5670367
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2362451
End bp	2363407
Gene Length	957 bp
Protein Length	318 aa
Translation table	11
GC content	68%
IMG OID	641240887
Product	ABC-2 type transporter
Protein accession	YP_001506309
Protein GI	158313801
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1682] ABC-type polysaccharide/polyol phosphate export systems, permease component
TIGRFAM ID	[TIGR00025] ABC transporter efflux protein, DrrB family

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.115517
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGCCG CCGAGACGAC CACCGCCGGA ACAGGCACCG CCGGAACAGG CACCGCCGGA 
ACAGCCACCA CCAGCGCAGG CACCGCCGGA ACAGGCGCCA CGGGCACGGG CTCCGGTGCG 
GACACAAGGC CGCCGGCGGC CGGGGCGGCC GTGCCGCCGG ATCTGCGCGC GGTGCTCGCG 
ACCGGTGCCC GCCCGGCGCG GCCCACCCCG CTGGCGGCCT CGCTCACCTT CGACTGGCGG 
GCCCTGCTGA AGATCAGACA TGTGCCCGAG CAGCTCTTCG ACGTGACCGT CTTCCCGATC 
ATGTTGACCC TGATGTTCAC CTATCTGTTC GGCGGCGCGC TCGCCGGGTC GACGCAGGAG 
TACGTACAGT TCCTGCTGCC CGGAATCCTC GTCCAGGCGA TCGTGATGAT CACGGTTTAC 
ACCGGGGTGA CCGTCAACAC CGACATCACC AAGGGTGTCT TCGACCGGTT GCGGTCACTG 
CCGATCTGGC AGCCGTCCGC ACTCGTCGGA GCGCTGCTGG GCGACGTGTT CCGCTATTCG 
ATCGCCGCCG TCCTCATCCT CGCGCTGGGG CTGGCGATCG GTTTCCGGCC GGAGGGGGGC 
GCGCTCGGCG TCCTGGCCGC GGTGGCCGTC GTCATCGCCT TCTCGTTCAG CCTCACCTGG 
GTGTGGACGG TGCTGGCGAT GGTGCTGCGC ACCCCGAACT CGGTGATGGG CGTGAGCATG 
ATGATTCTTT TTCCACTGAC CTTCGTCAGC AACATCTTCG TGCGGCAGGA GACGCTGCCC 
GGGTGGCTCC AGGCCTTCGT CGACGTCAAC CCGATCACCC ACACGACGAA CGCCTCCCGC 
GGGCTGATGC ACGGCGTCGC CACGGCTGAG CAGCTCGGAT GGGTCGCGCT GTCGTGCGCG 
CTTCTGCTCA TCGTGTTCGG CCCCCTGACG ATGCGGATGT ATCGCGGCCG GAGTTGA

Protein sequence

MTAAETTTAG TGTAGTGTAG TATTSAGTAG TGATGTGSGA DTRPPAAGAA VPPDLRAVLA 
TGARPARPTP LAASLTFDWR ALLKIRHVPE QLFDVTVFPI MLTLMFTYLF GGALAGSTQE 
YVQFLLPGIL VQAIVMITVY TGVTVNTDIT KGVFDRLRSL PIWQPSALVG ALLGDVFRYS 
IAAVLILALG LAIGFRPEGG ALGVLAAVAV VIAFSFSLTW VWTVLAMVLR TPNSVMGVSM 
MILFPLTFVS NIFVRQETLP GWLQAFVDVN PITHTTNASR GLMHGVATAE QLGWVALSCA 
LLLIVFGPLT MRMYRGRS