Gene Franean1_7054 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_7054
Symbol
ID	5675365
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8608574
End bp	8609617
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	69%
IMG OID	641245900
Product	glycosyl hydrolase family 32 protein
Protein accession	YP_001511291
Protein GI	158318783
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1621] Beta-fructosidases (levanase/invertase)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTGCGAC TCCCGGACGT CTGGACATGG GACTTCTGGT TCGCCGACGA CGGCGTGCAC 
TACCATATGT TCTTCCTCAA GGCATCCCGC GCTCTCGGCG ATCCCGACCA GCGCCACTGG 
AAGGCCGTCG TCGGGCATGC CGTCTCGTCC GACCTCACCA GGTGGGACGA GGTCGCGGAC 
GCGGTCGCGC CCAGCGACCC GGTGGCCTTC GACGACATCG CCACCTGGAC CGGATCGGTC 
GTCCGGGACG ACGACGGAAC CTGGATGATG TTCTACACCG GTGCCAGTTC CGGCGAGCGG 
GGGCTCAAAC AGCGGATCGG CCTCGCCACC TCCACAGACC TCCACACCTG GGAGAAACAT 
CCGGCAGCGC CGGTGCTGGA GAGTGATCCG CACTGGTACG AGCAGCTGGT CGACGCACAG 
TGGCCCGACG AGGCATGGCG CGACCCGTGG GTGTTGCGTG ACCCGGCCGG CGATGGCTGG 
CACATGCTGG TCACCGCGCG CGCCGCGACC GGGCCCGGTG ACCAACGGGG CGTGATCGGA 
CACGCCCGTT CCCACGACCT GGTGCACTGG TCGGCCCAGC CACCCCTGAG CCTGCCGCAG 
ACGGGTTTCG GACATCTCGA GGTCCCCCAG GTCGAGGTCG TCGACGGTCG TCCCGTGTTG 
GTGTTCTCGT GCCTGCGGGG TGAGCTCTCC CGGGAACGCC GTGAGCGCGG CGTACACGGC 
GGAACGTGGT GCGTTCCCGT CGAGACGCTT CTGGGTCCCT ACGATGTCAC GCGCGCGGTG 
CAGGTGACCG ACGAGTCCCT CTACAGCGGA CGCCTGGTCC GGGACCGGTC CGGGCGCTGG 
GTGATGCTCG CCTTCCACAA CGTGGTGGAC GGCGGTCGGT TCGTCGGGGA GATCAGTGAT 
CCGATGTACG TCTCGTGGGC GCAGGACGGC ACCAGGCTGG TGCTCAGCGG GACGGCGCGA 
GACGACCCGG GGCGCGCCTC GGACGACGCC ACCGCCAGCC ACGACGACCC GGGGCTCAAC 
CCGGTCTCTC GGCCGGGGGT GTGA

Protein sequence

MLRLPDVWTW DFWFADDGVH YHMFFLKASR ALGDPDQRHW KAVVGHAVSS DLTRWDEVAD 
AVAPSDPVAF DDIATWTGSV VRDDDGTWMM FYTGASSGER GLKQRIGLAT STDLHTWEKH 
PAAPVLESDP HWYEQLVDAQ WPDEAWRDPW VLRDPAGDGW HMLVTARAAT GPGDQRGVIG 
HARSHDLVHW SAQPPLSLPQ TGFGHLEVPQ VEVVDGRPVL VFSCLRGELS RERRERGVHG 
GTWCVPVETL LGPYDVTRAV QVTDESLYSG RLVRDRSGRW VMLAFHNVVD GGRFVGEISD 
PMYVSWAQDG TRLVLSGTAR DDPGRASDDA TASHDDPGLN PVSRPGV