Gene Franean1_6558 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6558
Symbol
ID	5674873
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7976592
End bp	7977968
Gene Length	1377 bp
Protein Length	458 aa
Translation table	11
GC content	63%
IMG OID	641245407
Product	glycosyl transferase group 1
Protein accession	YP_001510801
Protein GI	158318293
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGAAAGA AACGTGACAT AAGTACTGCA CTGATAGTGC GGCGGAATCG CGAGGAGATG 
CCTACTTCGG CAGCCGTCGG TACGGGCCGG TCCGGTCCCA TCGACATGGG ACGAAGACGG 
CGAGTCCTAA TTGTCGTCCA GAATCTTCCC GTCCGAATCG ATCGGAGGGT ATGGCAGGAA 
TGCGTGGCTC TCATCGCCTG CGGTTACCAG GTCTCGGTCA TCTGCCCACG CGGTGACGGG 
GAGCGGCGCC ATCAAATCAT TGAAGGTGTC AGCGTGTGGA CATACCGGGC CGCACCCGCG 
GCCAGCGGAG TGCTGAGCTA CATTTTCGAG TTCGTCTACT GCTGGTTTCG CACCTTCATC 
CTGACCCTGG CCGTGGTCCG TAAGGAGGGC TTCGATGTAA TTCAGGCATG CAACCCTCCC 
GACACGTACT GGTTGCTGGC GGTGCTTTAT AAGCCGTTTG GTAGGAAGTT CGTCTTCGAC 
CATCACGATC TATGTCCGGA GCTGTACCGC TCGCGGTTCG ACCGGGATTC CCCGATTTTG 
CTCCGCGCGC TGCTGCTGCT CGAACGGGCA AACCAGGCCA TGGCCGACCA TGTGATAGTC 
ACGAATGACT CCTACCGACA GCTCGCCATG ACCAGGGGTC GAAAGCGACC GGACCGGGTG 
ACCGTGGTCC GCAGCGGACC GGACCCTGAC CTCATGAAGC CAGCGTCGCA GCGCCCGGAG 
CTACGGCGTG GCCGCCGACA CCTCGCCTGC TACCTGGGTG TCATGGGCCC GCAGGATGGC 
GTCGACCAGT TGCTCGACGC CATCGAGCAC TATGTCCACG GTCTGCGCCG TACCGACTGC 
TTCTTCGCGT TGCTCGGCTT CGGTGACTGC CTGGATGAGT TGCGGGTGAG ATCCAGCAGG 
CTCGCCCTCG ATGACTGGGT CGAGTTCACC GGATTGGCCG ACGACGTGAT GATCCGCGAC 
TATCTCTCCA CTGCAGCCGT CGGTTTGTCT CCCGACCCGC GCAGTCCCCT GAACGAGATC 
TCGACCATGA ACAAGACCCT GGAATACATG GCCTATGGGC TACCGGTCGT GGCCTACGAC 
CTGGTGGAGA CGCGGGTCAG TGCGGCCGAC GCGGCGGTCT ACGCGGCCTC GGACACAGCG 
GAGGACTTCG CCCGCACGCT CGCCGGCCTG CTGGACGACC CGGAAGGTTG CCGCGTCCTC 
GGAGCTCGCG GCAGGGAGCG GATCGTCAAC GAGCTGTCCT GGCAGCATTC CGCGCGCAGA 
TATGTGGAGA TCTACGATCA CCTCCTCGGT GCCGGCGCCC GGCCCGTCAT TCCGGTACCC 
CGACAGAGCG AAGCGCCGGT GGGGCAGGAC CGGAACGATC AGCGGGCCGT CCGGTGA

Protein sequence

MRKKRDISTA LIVRRNREEM PTSAAVGTGR SGPIDMGRRR RVLIVVQNLP VRIDRRVWQE 
CVALIACGYQ VSVICPRGDG ERRHQIIEGV SVWTYRAAPA ASGVLSYIFE FVYCWFRTFI 
LTLAVVRKEG FDVIQACNPP DTYWLLAVLY KPFGRKFVFD HHDLCPELYR SRFDRDSPIL 
LRALLLLERA NQAMADHVIV TNDSYRQLAM TRGRKRPDRV TVVRSGPDPD LMKPASQRPE 
LRRGRRHLAC YLGVMGPQDG VDQLLDAIEH YVHGLRRTDC FFALLGFGDC LDELRVRSSR 
LALDDWVEFT GLADDVMIRD YLSTAAVGLS PDPRSPLNEI STMNKTLEYM AYGLPVVAYD 
LVETRVSAAD AAVYAASDTA EDFARTLAGL LDDPEGCRVL GARGRERIVN ELSWQHSARR 
YVEIYDHLLG AGARPVIPVP RQSEAPVGQD RNDQRAVR