Gene Franean1_0721 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0721
Symbol
ID	5669137
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	838110
End bp	839147
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	72%
IMG OID	641239648
Product	alkanesulfonate ABC transporter
Protein accession	YP_001505085
Protein GI	158312577
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.587353
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0488805
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCATC GACGGACCCG TGGGCGGCGG CTGGCGCTCG CGTCCGCCGG CCTGGCGGCC 
CTGCTGACGG TCGGCCTCGC CGCGTGCGGC GGCGGCGACT CGGACCCGGC CGCCCCCGCG 
TCCGGCGGAA AGGCCGGCAC GCTGCGGATC GGCGACCAGA GTAAGTCCCT GGAGCTCCCG 
ATCACGCTGT CGGGCGCGGG CCGCGACACC CCCTACAAGC TGAACTGGAA CAACTTCGCC 
GACGGGCCGC ACATGAACGC CGCGTTCAGC GCGGGCCGGC TCGACGTCGG TTTCATGGGC 
GACACGCCGG TCCTGTTCGC GAACGCCGCG GACGCCGGAG TGGTCGCCGT GGCCGTGGCG 
GAGAACCGGG TGAACAGCCA GACCATCTTC GCCTCCGCCG GCTCCGGCAT CCACAGCCTC 
GCCGACCTGA AGGGGAAGCG GGTCGCGTTC ACCCGGGGGA CCTCCCTGCA CGGCTATCTC 
CTCAACCAGC TCGACTCGGT CGGGCTCACC CAGGACGACG TCACCCCGGT CAACGTCCCG 
GCGGCGAGCC TGCCCGCCAC CTTCTCCTCC GGAGCGGTGG ACGCCGTGGT GTACGTCCGC 
CAGTTCGGCG CGGCGGTCAC CGCGCAGAGC GCCGGGTCCT ACGAGGTGGA GACCAAGCCG 
CTGCCGCAGT ACTCGGTGCT GCTCGCGGCG AAGGACGCGC TGGCGGACCC GGCCCACCGC 
GAGGCGGTGC GGGACTTCGT GCTCCGCCTC TCCCGGGCCT CGGCGTGGCC CAAGCAGAAC 
CCGGACGAGT GGATCCAGAA GTACTACGTG GAGACGCTCA AACAGGATCC GGTCGCCGCG 
CGGAAGTACT TCGAGAGCCT GCCGGAGAGC AGGTACACCC CGGTCACGGC GGCGTTCGTC 
GACAGCCAGC GGACGCAGGC GAAGCTGCTC GTCGACGTCG GGGAGCTGCC CCCGTCGCTG 
AACGTCGACG ACGAGGTCGA CAAGGCGTTC ACCACCGAGC TGACCGCGGC GTTCACCGCC 
GCGAGCCTGC CGACATGA

Protein sequence

MHHRRTRGRR LALASAGLAA LLTVGLAACG GGDSDPAAPA SGGKAGTLRI GDQSKSLELP 
ITLSGAGRDT PYKLNWNNFA DGPHMNAAFS AGRLDVGFMG DTPVLFANAA DAGVVAVAVA 
ENRVNSQTIF ASAGSGIHSL ADLKGKRVAF TRGTSLHGYL LNQLDSVGLT QDDVTPVNVP 
AASLPATFSS GAVDAVVYVR QFGAAVTAQS AGSYEVETKP LPQYSVLLAA KDALADPAHR 
EAVRDFVLRL SRASAWPKQN PDEWIQKYYV ETLKQDPVAA RKYFESLPES RYTPVTAAFV 
DSQRTQAKLL VDVGELPPSL NVDDEVDKAF TTELTAAFTA ASLPT