Gene Francci3_0318 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0318
Symbol
ID	3903350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	369431
End bp	370813
Gene Length	1383 bp
Protein Length	460 aa
Translation table	11
GC content	71%
IMG OID	637877647
Product	glycosyl transferase family protein
Protein accession	YP_479434
Protein GI	86739034
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.163788
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCGGGA CCTTCGAGAC GACCGGGAGC ACCGGAGAGA GCATTCCCGT TCAACATCAT 
CAGCCCGGGT GGCTCGGGCC GGACGGCGGC CGTCCGCGCC CGGTGCTGGA CGTCGTCATC 
CCCGTGTACA ACGAGGAGAA CGACCTCGCC CCCTGCGTCC GACGGCTGTA CGCCCACCTG 
ACCGGGACGT TCCCGTACCC CTTTCAGATC ACGATCGCCG ACAACGCCAG CACCGACGGC 
ACCCTGGCCA TCGCCCAGGC GTTGGAGAAG GAGCTCCCCG AGGTCGCCGC GATCCACCTC 
GAGGCCAAGG GCCGCGGCCG GGCACTGCGG GCGGCCTGGG GCCTCTCGCC CGCACCGGTG 
CTCGCCTACA TGGACGTCGA TCTGTCGACC GACCTCGCCG CGCTGCTGCC CCTGGTGGCT 
CCGCTCATCA GCGGCCACTC GGATCTCGCT ATCGGCACCC GGCTCTCCCC CGCCTCCCGG 
GTCGTGCGGG GACCGCGCCG GGAGGTGATC TCCCGCTGCT ACAACCTGAT CCTCCGCAGG 
ACCCTGGCGG CCCGGTTCTC CGACGCGCAG TGCGGCTTCA AGGCGATCCG CGCCGACGCC 
GCAGCGGGCC TGCTACCCCT GGTGGAGGAT AGCGGCTGGT TCTTCGACAC CGAACTGCTC 
GTCCTGGCCG AACGGGCCGG GATGCGCATC CACGAGGTCC CGGTCGACTG GATCGATGAT 
CCGGACAGCC GCGTCGACGT CCTCGCCACG GCCATCGCCG ACCTGAAGGG TGTGGTCCGC 
CTCTTGCGGG CGTTCGGCAG CGGAAAGCTG CCGCTCGCCA AGCTGCACCA GGAGTTCGGC 
CGAGGTCCGC TCACCGCCGG CCACGCCGAG GAGGGCAAGG TCGTCGAGGT CCCGGGGGTA 
CCGAAGGGAC TCGCCGGTCA GCTCCTGCGA TTCGCCGCGA TCGGGGTCGC CAGCACGCTG 
TCCTATCTGG TGCTCTTCGT CCTGCTGCGG ACAGTCACCG GGGCGCAGAT CGCGAACCTG 
CTGTCGCTGC TTCTCACGGC GGTCGCGAAC ACCGCGGCGA ACCGGCGGCT GACCTTCGGT 
CTCACCGGTC CGCGGCGCGC CGGTCGCCAC CATCTGCAGG GCCTGGTGGT GTTCGCCGTC 
GGCCTCGGCC TGACCAGCGG TTCGCTCGCG CTCCTGCACG CGGCGAGCAC GAACCCCGGC 
CGCGGCCTCG AACTCTCCGT GCTGGTGCTG GCGAACCTGG CCTCCACGGT CATCCGGTTC 
CTTCTGCTAC GCGCCTGGGT TTTCCGCCCG GACCGGGAGG CGAGGAACGT GGCCGGGATG 
CCCCCGGCCA CGACACCCCC GCGGAGGCGG GCCCCGACCG GCGAGATCAG GAACGCAGAG 
TAA

Protein sequence

MTGTFETTGS TGESIPVQHH QPGWLGPDGG RPRPVLDVVI PVYNEENDLA PCVRRLYAHL 
TGTFPYPFQI TIADNASTDG TLAIAQALEK ELPEVAAIHL EAKGRGRALR AAWGLSPAPV 
LAYMDVDLST DLAALLPLVA PLISGHSDLA IGTRLSPASR VVRGPRREVI SRCYNLILRR 
TLAARFSDAQ CGFKAIRADA AAGLLPLVED SGWFFDTELL VLAERAGMRI HEVPVDWIDD 
PDSRVDVLAT AIADLKGVVR LLRAFGSGKL PLAKLHQEFG RGPLTAGHAE EGKVVEVPGV 
PKGLAGQLLR FAAIGVASTL SYLVLFVLLR TVTGAQIANL LSLLLTAVAN TAANRRLTFG 
LTGPRRAGRH HLQGLVVFAV GLGLTSGSLA LLHAASTNPG RGLELSVLVL ANLASTVIRF 
LLLRAWVFRP DREARNVAGM PPATTPPRRR APTGEIRNAE