Gene Franean1_7281 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_7281
Symbol
ID	5675582
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	8891779
End bp	8893059
Gene Length	1281 bp
Protein Length	426 aa
Translation table	11
GC content	68%
IMG OID	641246118
Product	hyaluronan synthase
Protein accession	YP_001511506
Protein GI	158318998
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.265868
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.277341
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGAGTGGT TCGGCGTCGC GTTCGATTTC GTTCGCGATC ATCGTTCTCT GGTCCCGCTC 
GGGATCGCGG GCGTTGTCTC CTGGGTGGTG TGGCTCACTC GCCGCCTGCT CTCCACCCGG 
TACCGCCCCG TCCGGAACAA CTTCCGAGCC AGTACCTCGG TGATCGTTCC ATCGTTCCGG 
GAAGACCCCG ACGTCCTCAT CCGGTGCCTG GAGACCTGGC TCTCCCAGCA GCCGGACGAG 
ATCATCATCA TCCCGGATGT GGAGGACACC GAGCTCATAG CGAGGCTCGC CCAGCGCGCC 
GACCCGACGG TCCGCGTGAT CCCGTTCGTC CACGAGGGCA AGCGTTCGGC GCTGGGGGTC 
GGCCTGTCCG CGGCGACCAG GGACATCGTC GTGCTCTGCG ACTCCGACAC CGCTTGGGAG 
CCGGGGCTGC TCGCCGCGGT GCAGATGCCG TTCGTCGACC CGCAGGTCGG CGGGGTGGGA 
ACCCGGCAGA ACGTCTACGA GCCGCGCAGC AGCGTGTGGC GGCGGGTCGC GAACTGGCTC 
GTCGACATCC GCTACCTCGA CTACGTGCCG GCGCAGGGCC GGGTCGGCGC CGTCGCCTGC 
CTGTCCGGGC GCACGGCGGC CTACCGGCGC TCGGCGATCC TGCCCGTGCT GCACAACCTG 
GAGCACGAGT TCTTCCTCGG CCGGCGGTGC ATCGCCGGTG ACGACGGCCG GCTGACCTGG 
CTGGTGCTCG CGTCCGGCTA CAAGACCATG CACCAGCACA CGGCGCACGC GATGTCGATG 
TTCCCCGACA ACCTGCGGGC CTTCATCAAG CAGCGGGTGC GCTGGAGCCG GAACTCCTAC 
CGGACCTACC TGACCGCCAT CTACAAAGGC TGGCTGTGGC GGCAGCCACT GATCACCCAG 
GTCAGCGTGC TGCAGATCGT GCTCACCCCG CTGACCATGG GTGTCGCGAT GACCTACTTC 
GTGCTGTGGA TGTTCCGGCC GGAGGCGAAC GCCCCGATCA TCGCGATCGC CTGGCTGCTG 
CTCGGGCGGT TCATCCGCGG GCTCTCCCAC CTCAAGGAGC ACCCGCGGGA CATCTTCATC 
CTCCCGCTCA CAGTGTTGAT GATCATCGTC GTCGCGCTGC CCATCAAGAC CTGGGCGTTC 
GTGTCGATGA ACAAGCAGGG CTGGCTGACC CGGCGCTCCG ACCTCATCGG CGGGGAGGGC 
CAGACCGACG CCTCTACGCG AACCAGCCCG GCCGCGAGCC CCCGCCCGGC GACAGCGACC 
GCGATGGGTG GTACCCGATG A

Protein sequence

MEWFGVAFDF VRDHRSLVPL GIAGVVSWVV WLTRRLLSTR YRPVRNNFRA STSVIVPSFR 
EDPDVLIRCL ETWLSQQPDE IIIIPDVEDT ELIARLAQRA DPTVRVIPFV HEGKRSALGV 
GLSAATRDIV VLCDSDTAWE PGLLAAVQMP FVDPQVGGVG TRQNVYEPRS SVWRRVANWL 
VDIRYLDYVP AQGRVGAVAC LSGRTAAYRR SAILPVLHNL EHEFFLGRRC IAGDDGRLTW 
LVLASGYKTM HQHTAHAMSM FPDNLRAFIK QRVRWSRNSY RTYLTAIYKG WLWRQPLITQ 
VSVLQIVLTP LTMGVAMTYF VLWMFRPEAN APIIAIAWLL LGRFIRGLSH LKEHPRDIFI 
LPLTVLMIIV VALPIKTWAF VSMNKQGWLT RRSDLIGGEG QTDASTRTSP AASPRPATAT 
AMGGTR