Gene Francci3_1338 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1338
Symbol
ID	3906551
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1605550
End bp	1607211
Gene Length	1662 bp
Protein Length	553 aa
Translation table	11
GC content	71%
IMG OID	637878671
Product	undecaprenyl-phosphate galactosephosphotransferase
Protein accession	YP_480444
Protein GI	86740044
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG2148] Sugar transferases involved in lipopolysaccharide synthesis
TIGRFAM ID	[TIGR03022] Undecaprenyl-phosphate galactose phosphotransferase, WbaP [TIGR03025] exopolysaccharide biosynthesis polyprenyl glycosylphosphotransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.508778
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGGAGA CGGTGTCCGG CGGCACGCGC GCGACCGCTG GGTCGAACTT CGTTCCGCGC 
ACCCGCGGCG GGCAGGGGAT GCCGTTCCCG CCGGACGCGC CGGCGGGAAC GGCCGGCCGG 
CCCGCCGGCG CACCGCCGAG CCGCACGGCC ACCGGGCCCG GCGGGCGGCA CAGCGCGGGG 
AGGGTGAGCC CGGCCGCCGT CGAGACGGGC GGCTACCGCG CTCAGGTGAC CTGGGAACGG 
CGTTACGTCC GGCTGCTTGT CCTGTTCGAC GCGGCCGCCT GCGTGGTGGC AGCGGGGCTC 
GCGTATTTCG TGCGATTCGG CGACCTGGTC GACTTCGGCA CCCAGCCGGT GTCCTCCAAG 
CCGTACATCC TCATGACGGT TCTGCTGCCG CTCGCCTGGG TGCTGGCGAT GTCCCTGAAC 
CGGGCCTACG AGAGCCGGTT CCTCGGTGGC GGGTCGGAGG AGTTCCGGCG GGTGGTCAAC 
ACGGCGGCCC GGTTCACCGC GGCGGTGGCC ATCGCCTCGT ACGCGACGAA GGCGGAGATC 
GCCCGTAGTT ACGTGCTGAT CGCCTTCCCG GCCGCGACCC TGTTCTCCAT GGTGGGTCGG 
GTCGTCGGCC GCGGCCTCCT ACACCGGATG CGCCGGGCGG GCCGCTGCCT GCACCGGGTG 
CTCGTGGTCG GGGCCGGGGA GTCGGCTGCC ACCCTGGTCC GGCTGGCCCA GCGGGATCCG 
ACGTCGGGTT GGGCGGTCGT CGGTGTCGTG CTCGACCGCT CGCCCGGCCG GCACAGTCAC 
GACTCCCCGG AACGCAGTGG GTTCGACCTG CTCGGGGTGC CGATCGTCGG CACCTCGGAA 
ACCCTGCACA CGGCCATCCG GGCGACGTAC GCCACCACGG TTGCCATCAG TCCGCAGATG 
GACGGCGAGA CGTTGCGCCG GGTGCTGTGG ACGCTGGAGG GCAGCGACGT CGACGTGCTG 
GTCTCCTCGG CGCTGACCGA CGTGACCGGG CCGCGGATCT CGATTCGTCC GGTGGCCGGG 
CTGCCGCTGC TGCACATCGA GGAGCCGGAG CTCACCGGTA CCCGTCGGGT GATGAAGATG 
GTCTTCGACC GGTGCGTGGC CGGAACGATC ATCCTGCTGT TCTCCCCGCT GCTGCTCGGT 
CTCGGGCTCG CGGTGCGCCT GACCAGCCGC GGCCCGGCGT TGTTCAAGCA GATCCGGGTG 
GGGCGGGGTG GTGAGCACTT CACGATGTAC AAGTTCCGGT CGATGTACGT CGACGCGGAG 
GCGCGCAAGG CGGAGCTGGA GTCGCGCAAC GAGCGGGCCG AGGGGCTGCT GTTCAAGATG 
CGTGACGACC CGCGGATCAC CAAGGTCGGG AAGTTCCTGC GCAAGTGGTC GCTCGACGAG 
CTGCCGCAGT TGTTCAACGT GCTGGGCGGC ACGATGTCGC TGGTGGGGCC GCGTCCGCCG 
CTGCCGTCGG AGGTCGCCCG CTACGAGGAC GACGTGCACC GCCGGCTGAT GGTGAAGCCG 
GGGCTGACCG GCCTGTGGCA GATCAGCGGC CGGTCGGACC TCGAATGGGA CGAGTCGGTC 
CGTCTCGACC TGCGCTACGT CGAGAACTGG TCACTGGCGA TGGACTTCGT CATCCTCTGG 
CGCACCGTGT TCGCCGTGCT GCGTCGCGAG GGGGCGTATT AG

Protein sequence

MTETVSGGTR ATAGSNFVPR TRGGQGMPFP PDAPAGTAGR PAGAPPSRTA TGPGGRHSAG 
RVSPAAVETG GYRAQVTWER RYVRLLVLFD AAACVVAAGL AYFVRFGDLV DFGTQPVSSK 
PYILMTVLLP LAWVLAMSLN RAYESRFLGG GSEEFRRVVN TAARFTAAVA IASYATKAEI 
ARSYVLIAFP AATLFSMVGR VVGRGLLHRM RRAGRCLHRV LVVGAGESAA TLVRLAQRDP 
TSGWAVVGVV LDRSPGRHSH DSPERSGFDL LGVPIVGTSE TLHTAIRATY ATTVAISPQM 
DGETLRRVLW TLEGSDVDVL VSSALTDVTG PRISIRPVAG LPLLHIEEPE LTGTRRVMKM 
VFDRCVAGTI ILLFSPLLLG LGLAVRLTSR GPALFKQIRV GRGGEHFTMY KFRSMYVDAE 
ARKAELESRN ERAEGLLFKM RDDPRITKVG KFLRKWSLDE LPQLFNVLGG TMSLVGPRPP 
LPSEVARYED DVHRRLMVKP GLTGLWQISG RSDLEWDESV RLDLRYVENW SLAMDFVILW 
RTVFAVLRRE GAY