Gene Francci3_1393 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1393
Symbol
ID	3903374
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1674423
End bp	1675610
Gene Length	1188 bp
Protein Length	395 aa
Translation table	11
GC content	75%
IMG OID	637878730
Product	glycosyl transferase family protein
Protein accession	YP_480499
Protein GI	86740099
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.0519554
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.000418344
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGACGGCGC CGTGGCGGAC AGGGCACGGG ACGAGGCACC GGACGGTACC GAGATCCCCG 
GCCCGGTGGC TTGCCGGGCG ATGCTGGTCG GGTGCGGTAC GGTCCGCCGC GGTGGCGTCC 
ACCGCCATCG CCGTGCACAC GGCGGTGAAC GCGCGGCTGC TACGCGTCCC ACCGCCGGCC 
CGGCCGGTAC GCGAACGGGT GACGGTCGTG CTACCCGTCC GCGACGAGGC CAGGAGCCTG 
CCGCGGTGCC TGTCGGCCCT GCTCGGCTCA CGGTGGGTGC CCGACCTCGA GATCCTCGTC 
TACGACGACG GTTCCACCGA CGGCACCGGG GAGATCCTCG CGCGGTGGGC GGCGAGGGAC 
AACCGGATCG TCGCGCTGCG CGGTGCGGAG CCGCCCGCCG GCTGGCTCGG CAAACCGCAC 
GCCTGCGCCC GGGCCGCGGC GGCGGCCACA GGCACGGTCC TCGTCTTCGT CGACGCCGAC 
GTCACGGTGG CCCCCGACGG CGTCGCGCGG ACCGTTCTCC TCCTGCGGGA CGCCGGCCTC 
GACCTCGTCT CGCCCTACCC GCGTCAGGAG GCGGCCGGTG TCGCCGAAAG GCTGATCCAA 
CCCCTGCTCC AGTGGTCGTG GCTGGCGCTG CTGCCGCTGC GGCTGGCCGA ACGCTCCGCC 
CGGCCGTCGC TTTCGGCGGC GGGCGGACAG CTGCTGGCCG TGGACGTGGC GGCCTACCGC 
CGGGCCGGCG GCCACGAGGG TGTCCGGGAC CAGGTCATCG AGGATGTCGC CCTGCTGCGC 
AGGCTCAAGC GTGCCGGCGG GCGGGGAGTG GTCGTGGACG GCACCGATCT CGCGGTCAAC 
CGGATGTACT CCGGATGGTC ACAGCTGCGG GACGGCTACG CGAAGTCGCT GGCCGTCGCC 
GGTGGAAGCA CGCTCGGCAG CGTCGGGCAG ATCGGCATGC TGGCCTGGCT GTTCGTCGTG 
CCGGCGGTGG CGGCACTGGG TGGCTCGGGC CCGGGCGCGG TCGGGTACCT CGCCGGGGTC 
GCCGGCCGGG TGCTCGCCGC CCGCCGCACG GGCGGCCGGA GCTGGCCCGA CGCCGCCGCT 
CATCCGGCTT CCGTGAGCCT GTTGGGCTAC CTGACTGCGG TGTCGTGGTG GCGTCGTCGG 
CGGGGTACCG CCCGATGGAA GGGACGACCG GTTACCCGCT GCCCCTGA

Protein sequence

MTAPWRTGHG TRHRTVPRSP ARWLAGRCWS GAVRSAAVAS TAIAVHTAVN ARLLRVPPPA 
RPVRERVTVV LPVRDEARSL PRCLSALLGS RWVPDLEILV YDDGSTDGTG EILARWAARD 
NRIVALRGAE PPAGWLGKPH ACARAAAAAT GTVLVFVDAD VTVAPDGVAR TVLLLRDAGL 
DLVSPYPRQE AAGVAERLIQ PLLQWSWLAL LPLRLAERSA RPSLSAAGGQ LLAVDVAAYR 
RAGGHEGVRD QVIEDVALLR RLKRAGGRGV VVDGTDLAVN RMYSGWSQLR DGYAKSLAVA 
GGSTLGSVGQ IGMLAWLFVV PAVAALGGSG PGAVGYLAGV AGRVLAARRT GGRSWPDAAA 
HPASVSLLGY LTAVSWWRRR RGTARWKGRP VTRCP