Gene Franean1_5302 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_5302
Symbol
ID	5673636
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	6382350
End bp	6383492
Gene Length	1143 bp
Protein Length	380 aa
Translation table	11
GC content	74%
IMG OID	641244159
Product	glycosyl transferase family protein
Protein accession	YP_001509566
Protein GI	158317058
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.157801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.641383
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGACCTTG TGCCTGTGAG CGTGGTCATT CCCGCTTACA ACGAGGCACT TCGTCTTCCG 
GCGTCCCTGC CGCGGCTGCT GGCTGTCGTG GGCAAGATCC CCAGGGCTGA GGTGATCGTC 
GTCGACGACG GCAGCACCGA TGGCACCGCC GGGGTCGCCG AGGACCTGCT CGAGGGCTTT 
CCGAACCACC GTGTGGTACG CCTGCCGTGG AACTGCGGAA AGGGCACCGC GGTAAGGGCG 
GGCGTGTCGG CCGCGCATGG CCGGTCGATC GTCTTCATGG ACGCCGACGG GGCCTCCGAC 
GTGAACGACC TGCCGTTGCT GCTCGCCGCG CTCGAGCACG CCGAGGTGGC GCTGGGCTCG 
CGGCGAATCG GCGACGGAGC CACCCGGACA AGCGGCCGCA GGGCCGGTAG CTGGGCTTTC 
AATCAGATTA CGCGTTCACT CGCGGCGCTG GACGTCGCTG ACACGCAGTG TGGCTTCAAG 
GCGTTTCGGC ACGCGGAAGC CAAGATTCTT TTCAGTCTCG CGCGCTCCAC CGGCTTCGGA 
TTCGACGTCG AGGTGCTCTC GATCGCGCGC TCGGTTGGCT ATCGCATCGC CGAGGTACCC 
GTGCGCTGGG AGGAGACGCC CGGCGGCACC TTCCGGATCA CCCGGCACAC CCCCGCGATG 
CTCGTCGACG TCGTCCGGGC CCGCCGCTAT CTCAGCCGGG TCGGGCTCCC GCCGGTCAGC 
CGTCGCCAGC GGCTGGGCGA GCTCGGTGTC GTGGACGCGT CCGAGCTGCT CGGCCGGCCG 
GCCACGCCGC GCGGTGCGGG GGAACCGCAG GGTGCCCCGC CCGGCCAGCT GCCGGTGCCC 
GCGGCCCCCA CCCGGCCCGG CACACCGGCC CGGCCGACGG CCCGTACCCG GCCCGGCACA 
CCGGCCCGGC CGGTGCCCGC CGCCCGGCCC ACGACCGCCG CCGCTCCCGC CCGGCCCGCG 
GCCGTTCCCG CACTGCCCAT GACTCCCGCG CTGCCCGCCG CCCCCGCGCG GCCCCCCGCG 
GTGCCCCGCC CCACGCCGCG TCCCGCTCCC GCGGTTCCAG CCGTGAGCGT GGCGCACGGG 
ACCGGGCGGT TCACCCCGTC GCCCTCCCGC GGTGAGATCC CCGGTCCCGC GCCCGCACCG 
TGA

Protein sequence

MDLVPVSVVI PAYNEALRLP ASLPRLLAVV GKIPRAEVIV VDDGSTDGTA GVAEDLLEGF 
PNHRVVRLPW NCGKGTAVRA GVSAAHGRSI VFMDADGASD VNDLPLLLAA LEHAEVALGS 
RRIGDGATRT SGRRAGSWAF NQITRSLAAL DVADTQCGFK AFRHAEAKIL FSLARSTGFG 
FDVEVLSIAR SVGYRIAEVP VRWEETPGGT FRITRHTPAM LVDVVRARRY LSRVGLPPVS 
RRQRLGELGV VDASELLGRP ATPRGAGEPQ GAPPGQLPVP AAPTRPGTPA RPTARTRPGT 
PARPVPAARP TTAAAPARPA AVPALPMTPA LPAAPARPPA VPRPTPRPAP AVPAVSVAHG 
TGRFTPSPSR GEIPGPAPAP