Gene Francci3_0456 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0456
Symbol
ID	3903262
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	533725
End bp	535032
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	72%
IMG OID	637877787
Product	glycosyl transferase, group 1
Protein accession	YP_479571
Protein GI	86739171
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID	[TIGR03449] UDP-N-acetylglucosamine: 1L-myo-inositol-1-phosphate 1-alpha-D-N-acetylglucosaminyltransferase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.778621
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.271812
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTCTGA TCAGAAGTGG CGCCGCCCAG GTCCGCGGTG AGGCCGAACG GCGCGGGCGG 
CCCAGCCGGG TCGCGATGCT GTCCATGCAC ACCTCACCAA TGGAACAGCC GGGAACGGGC 
GATGCCGGGG GGCTCAACGT CTACGTCGTC GAGCTGTCTC GGCAGCTCGC GGCGCTGGGG 
GTGGAGGTCG AGGTGTTCAC CCGCGCGGTG AGCAGCAAGC TGCCGACCTC GGCCGAGCTG 
TTGCCGGGTG TGACGGTCCG CCACGTTGAC GCCGGCCCGT TCGAGGAGAT CCACCGGGAG 
GATCTTCCCG CCTGGCTGTG TGCGTTCACC GCGGCTCTGC TGCGCGCCGA GGCCGGGCAC 
GAACCAGGGT GGTTCGATGT GATCCACTCG CACTACTGGC TGTCGGGCCA GGTCGGTCTC 
GCGGTGGCAC AACGATGGGG TATCCCGCTC GTGCACACCT CCCATACGCT GGCGAAGATC 
AAGAACGGCG CGCTGGCCGT CGGAGACCGC CCGGAGCCGC CTGGCCGGCT ACTCGGCGAA 
CAGGAGGTCA TCGGGGGGGC CACCCGGCTG CTCGCCTCCA CGCCGGACGA GTACCGGCAC 
CTGATCGATC TGTACGACGC GGCGTCGGAC CGGGTCGACG TCGTCGCGCC CGGCGTCGAC 
CTTGAGGTCT TCCGGCCAGG TGACATGGCG CAGTCCCGGG CCCGCGTCGG CGTGGATCCC 
GCCGACGACC TGCTGTTGTT CGTCGGTCGG ATCCAACCGC TCAAGGCGCC CGATCTGCTG 
CTGCGCGCCG CCGCGGAACT GCTGCGGCGC GATCCCGCCC GCCGCTCGCG GCTCACCGTC 
GCCGTGGTCG GCGGCCCCAG CGGATCCGGT CTGGAACAAC CCGACGCCCT GGTCAAGCTC 
GCGGCGTATC TCGGGATCTC CGATCGCGTC CGCTTCCAAC CGCCGGCCCC GCAGCAGGAA 
CTCGTCCACT GGTACCGCGC GGCCACCGCC GTCGTCGTCC CCAGTCACAG CGAGAGCTTC 
GGCCTCGTCG CGCTCGAGGC CCAGGCCTGC GGCACCCCGG TGGTCGCCGC GGCGGTCGGG 
GGCCTGCGCA CCGCGGTCGC CGACGGTGTC TCCGGGCTGC TCGTCTCCGG TCGGACCCCC 
GCCGTCTATG CCGACGCGCT GGACCGGCTG CTGCGCCAAC CACGATGGCG GGCCCGGCTC 
TCCGCCGGAG CGGTGGCCTG GGCCGGTGGG TTCGGCTGGT CGGCCACGGC CCATGGCGTG 
CTGCGCAGCT ACCGGCACGC GCTGAGCCCC ACCGCCGTCG CCGTCTGA

Protein sequence

MRLIRSGAAQ VRGEAERRGR PSRVAMLSMH TSPMEQPGTG DAGGLNVYVV ELSRQLAALG 
VEVEVFTRAV SSKLPTSAEL LPGVTVRHVD AGPFEEIHRE DLPAWLCAFT AALLRAEAGH 
EPGWFDVIHS HYWLSGQVGL AVAQRWGIPL VHTSHTLAKI KNGALAVGDR PEPPGRLLGE 
QEVIGGATRL LASTPDEYRH LIDLYDAASD RVDVVAPGVD LEVFRPGDMA QSRARVGVDP 
ADDLLLFVGR IQPLKAPDLL LRAAAELLRR DPARRSRLTV AVVGGPSGSG LEQPDALVKL 
AAYLGISDRV RFQPPAPQQE LVHWYRAATA VVVPSHSESF GLVALEAQAC GTPVVAAAVG 
GLRTAVADGV SGLLVSGRTP AVYADALDRL LRQPRWRARL SAGAVAWAGG FGWSATAHGV 
LRSYRHALSP TAVAV