Gene Francci3_1577 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1577
Symbol
ID	3903712
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1891571
End bp	1893142
Gene Length	1572 bp
Protein Length	523 aa
Translation table	11
GC content	67%
IMG OID	637878914
Product	undecaprenyl-phosphate galactosephosphotransferase
Protein accession	YP_480682
Protein GI	86740282
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03022] Undecaprenyl-phosphate galactose phosphotransferase, WbaP [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.673615
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.183885
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCAAGG CCGGGGACAC CGCACGACGA AGGCCCGAGG TGTCTGACTC GACCGGGGGG 
CGGGACGAGG ACCCCGCGGT GCTCTCGTCG GTGGCGGCCA CGCCCCGGGA CACGACCGTC 
CCGGCTATTC CGCGACAACG GCAACCAGAG CCGCCGGCAG CCGGGCCGCC GGAGTGGAAG 
GTCAGGCTGA CCGCCAGAAT CTTCATCATC GATGCCACGG CAATCACGGT CGCGCTTACC 
TGTTCCTATC TCCTCCGGTT CGGCATGAAT GCGAACCCAA CCGTCCACGG GGCGTCATAT 
CTTTCCGTCG CGATAGGTAT CGGACTGGGC TGGATCGCCA TGCTCGGCGC CGCCGACACC 
TATCAGACGA AATATCTGGG CATCGGAACC GAGGAATACC GGCGGATCAG CGTCGCGACA 
TTCCGACTGT GGGGCACGAC GGCGATCCTC TCCTACGTCC TGCGCGCAGA AGTCGCTCGC 
GGGTTCTGTC TGGTGGTCCT GCCGCTGGGG CTACTGCTGC TGATTACCGG TCGGATGCTC 
GCCCGCCGAC GGCTGGTGGC GGCTCGGCAG GCCGGCCGTG CCCGCCACCG GGTCGTCGTC 
GTCGGCGACC GTAGCACGGT GGCCGAACTC GTCAGCGAGC TCCGATATGA ACCCGCAGCC 
GGATTCGAGA TCGTCGGCGC ATGTCTACCC CGGCAGGACG ACTACTCGGC CGATTATTCT 
CCCTTTCCCG TCCTCGGCGC CCTGCCGGCG CTGCGGTCCA CCGTCGCCCG CGCCATGGCC 
GACACGGTGG TGGTCGCCTC GTCCGTGGCG GTCAACATCG AAGCCGCCAA GCGGATCGCC 
TGGGACCTCG AGGGGACCGG TGTCGATCTT GTCATCGCGT CGAGCATGGC CGGAATCGCC 
GGGCCGCGGG TATCCCTGCG GCCGATCGCC GGTCTCCCCC TGCTACACGT GGAGAGCCCG 
GTCTATACCG GTTGGCGAAA GGTGGCCAAA GACATCTTCG ACCGGGTCCT TGCCGCCGTG 
GCCCTCGTTA CCCTGTCCCC GCTGCTGCTT CTCGTCGCGT TGACCATCCA GGTTGACAGC 
ACCGGACCGG CATGGTTTCG CCAGACCCGG GTGGGTAAGG ACGGCCGCGA GTTCCAGATC 
CTCAAGTTCC GGACGATGTA CGTGGATGCC GAACGGCGCC GGGCAGCGCT GGAGGAGCGC 
AACGAGGCCG ACGGACCACT TTTCAAAATT CGCGACGACC CCCGCGTCAC TCGGGTCGGA 
CGAACGCTAC GGCACCTGTC GATCGACGAG CTGCCGCAAC TCGTCAACGT CCTCCGCGGC 
GAGATGTCGC TGGTGGGGCC GCGGCCGCCG CTGCCGGCAG AGGTCGCTCA ATATCACGAC 
TCCGTCCACC GTCGATTCAA GGTCAAGCCC GGCCTGACCG GACTGTGGCA GGTGAATGGG 
CGTTCAGAAC TGCCCTGGCG GGACGGGGTG CGACTCGACC TCTACTACGT AGAGAATTGG 
TCGATCATGC TCGACCTCGC CATCATCGCC CGGACTGTTA GCGCCGTGCT GCGGCGGTCC 
GGCGCATTCT AG

Protein sequence

MAKAGDTARR RPEVSDSTGG RDEDPAVLSS VAATPRDTTV PAIPRQRQPE PPAAGPPEWK 
VRLTARIFII DATAITVALT CSYLLRFGMN ANPTVHGASY LSVAIGIGLG WIAMLGAADT 
YQTKYLGIGT EEYRRISVAT FRLWGTTAIL SYVLRAEVAR GFCLVVLPLG LLLLITGRML 
ARRRLVAARQ AGRARHRVVV VGDRSTVAEL VSELRYEPAA GFEIVGACLP RQDDYSADYS 
PFPVLGALPA LRSTVARAMA DTVVVASSVA VNIEAAKRIA WDLEGTGVDL VIASSMAGIA 
GPRVSLRPIA GLPLLHVESP VYTGWRKVAK DIFDRVLAAV ALVTLSPLLL LVALTIQVDS 
TGPAWFRQTR VGKDGREFQI LKFRTMYVDA ERRRAALEER NEADGPLFKI RDDPRVTRVG 
RTLRHLSIDE LPQLVNVLRG EMSLVGPRPP LPAEVAQYHD SVHRRFKVKP GLTGLWQVNG 
RSELPWRDGV RLDLYYVENW SIMLDLAIIA RTVSAVLRRS GAF