Gene Franean1_5882 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5882
Symbol
ID	5674205
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7138971
End bp	7140188
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	76%
IMG OID	641244732
Product	glycosyl transferase group 1
Protein accession	YP_001510134
Protein GI	158317626
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.72005
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTATCG CGATCATCGG GCCGACCCAC CCGTACAAGG GCGGCATAGC CCAGCACACC 
ACCGAGCTGG CGCACCGCCT CGCCGCGCGC GGGCACGAGG TGCGGATCGA GTCGTGGTCC 
CGCCAGTACC CGGCGCGGCT CTACCCCGGA CAACAACGGG TGGACACCCC GGAGGGGACG 
CCGTTCGCGG CGACGTCCTA CCCGCTGTCC TGGCGCCGCC CCGACTCGTG GTTCCGGCTG 
GGCCGCCGGC TGCGTGCTCC GGCCTCGGGC GGCCCGGGTT CCGGCGCCAC GGTGGACCTC 
GTCGTCCTCG TCGTCGTCAC CCCGATCCAG GCTCCCGCCT ACCTGGGCAT CCTGGCCGGG 
CTGCGCGGGC TGCGCGGGCT GCGCGGGCTG CGCGGGCGTT CAGGGGGCGG CCGGTCGTCC 
CGCGACGTCC TCGCGCTGTG CCACAACGTG CTGCCGCACG AGCGCCGGCG GATCGACGAG 
CCACTGGTCT CCGCGGTGCT CCGCCGCTGC TCAGCCGTCC TGGTGCACAC CGAGCCGCAG 
GCCAGGCTCG CCGCGGAGCT CACCGCCGCC CCCGTGCGCG TCGCCGAGAT GGCACCCCAC 
CTGTGGACCG CCGCCGGCGG GGACATGATC CTGTCCGGGT CCGGGTCCGG GTCGGCGCGC 
GCGCCAGAGG CGGGATCGTC GCAGCCGTCG CCGTCGCCGT CGCGCGAGTT GCTCTTCTTC 
GGGCTGGTCC GGCCGTACAA GGGCCTCGAC GTGCTGCTGC GCGCCCTCGC CGCCGGCCCC 
GACGACGTCC GCCTGACCGT GGCCGGGGAG TTCTGGGGCG GCATCGAGAG CACTCGTACC 
CTGGTGGCCG AGCTGGGCCT CGGCGAGCGG GTCACGCTGC GCCCCGGCTA CGTGCCGGCC 
GAGGACGTCC CCGCCTTGTT CGCCGCCGCG GACGCGCTGG TCCTGCCGTA CCGGGCCGGC 
ACCGCCTCGC AGAACGTCGA CCTCGCGCAC CTGCACGGTG TCCCCGTCGT CGCCACCCGC 
GTCGGCACCC TCACGACGTC CGTGCGCGAC GGCGTCGACG GCCTGCTCGT GCCGCCCGAC 
GACCCGGCGG CGCTGGCGGC GGCCCTGCGC CGGCTGTACG AGCCGGGAGT CCTCGCCGCC 
CTGCGCGCCA AGGTGACTCC GCCCGACGTC GACATCGCCT GGGACAGCTA CCTCGACGCC 
GTGCTGAAAC CGTGCTGA

Protein sequence

MRIAIIGPTH PYKGGIAQHT TELAHRLAAR GHEVRIESWS RQYPARLYPG QQRVDTPEGT 
PFAATSYPLS WRRPDSWFRL GRRLRAPASG GPGSGATVDL VVLVVVTPIQ APAYLGILAG 
LRGLRGLRGL RGRSGGGRSS RDVLALCHNV LPHERRRIDE PLVSAVLRRC SAVLVHTEPQ 
ARLAAELTAA PVRVAEMAPH LWTAAGGDMI LSGSGSGSAR APEAGSSQPS PSPSRELLFF 
GLVRPYKGLD VLLRALAAGP DDVRLTVAGE FWGGIESTRT LVAELGLGER VTLRPGYVPA 
EDVPALFAAA DALVLPYRAG TASQNVDLAH LHGVPVVATR VGTLTTSVRD GVDGLLVPPD 
DPAALAAALR RLYEPGVLAA LRAKVTPPDV DIAWDSYLDA VLKPC