Gene Francci3_3848 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3848
Symbol
ID	3905596
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4609963
End bp	4611090
Gene Length	1128 bp
Protein Length	375 aa
Translation table	11
GC content	63%
IMG OID	637881174
Product	glycosyl transferase, group 1
Protein accession	YP_482927
Protein GI	86742527
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.454248
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGGACGG CACTGAGGGT GCTCCAGGTG GCGGCACGAT TCTTCCCGGA CATGGGTGGT 
ACCGAGACGC ATGTCTACGA GACGAGTCGT CGACTCAACG CTACTAGTGA CATTACCGTG 
GAGATATTGA CGACCGACCG CAGCGGCAAG CTTCCCAGCA GGGAGAATGT CGCGGGAACG 
GTGGTGCACC GGGTCGCGGC GTGGCCGCAA GAGAAAGACT ATTATTTGGC GCCGGCCGTT 
GCCAAAGTGG TCGGATTCGG TTCTTATGAT CTTGTTCATT GTCAGGGAAT TCACAATCTC 
GTGCCGCCGG TGGCGATGGC GGCGGCTCGC CTGAGGGGTA TTCCTTATAT TGTCTCACCG 
CATACCGGCG GTCATTCCTC GCAGGTCCGG AACACGGCGC GCCGAGTACA GTGGGGCCTG 
CTCGGGCCAC TGATCAGGAA CGCCCGCCGC GTCATCTGCG TCGCGGAGTT CGAGTCCCAC 
ATCTTCATGC GCCAAGCCGG GGTCGCTGCA GACCGGATCT CGGTCGTCCC GAACGGAGTG 
TCCATCGTTC CACCGAGTGG CCATGTCAAA CCCGATACGA GTGAGCCGCT TGTCGTCTGC 
GTCGGCCGGT TGGAGAAGTA CAAGGGACAG CGGCACCTTG TCCGCGCTCT GCCGAGTCTG 
ATTACTCTAG TTCCTGACGT ACGGCTGATG CTGGTGGGGC GGGGCCCTGA TGAGCCGGAG 
TTGAGGCGCC TGGCTGACCG GCTGGGTGTG GTGGACCGGG TGAGTTTCAC CTCGATACCA 
CCGGAGGACC GGCAGGCAAT GTCTGACTGT ATCGCGAGAG CGGGTGTCGT GGCCCTGCTT 
AGCGAGTATG AGGCTCATCC GGTCGCGGTC ATGGAAGCCG TGGCCCTGGG TAGGCCGGTG 
GTGGTGGCGC CCACTGCCGG ACTGGGAGAG CTGGCTGCGG CAGGGCTCGC GCAGAGCGTT 
GCGGATCCGG CCGATGAACA ACTCGTGGCG AAGACGCTGG GCATCTACCT GCTCGCCAGC 
GCTGGGGACT CACCGAGCGA GACGAGGCCG ACTCCCGAAA TCTCCACCCT GCCGACCTGG 
GACGGCTGCG CGGAAGCCTT GGCGAGGATT TATCGTGAGT CGGTCTGA

Protein sequence

MGTALRVLQV AARFFPDMGG TETHVYETSR RLNATSDITV EILTTDRSGK LPSRENVAGT 
VVHRVAAWPQ EKDYYLAPAV AKVVGFGSYD LVHCQGIHNL VPPVAMAAAR LRGIPYIVSP 
HTGGHSSQVR NTARRVQWGL LGPLIRNARR VICVAEFESH IFMRQAGVAA DRISVVPNGV 
SIVPPSGHVK PDTSEPLVVC VGRLEKYKGQ RHLVRALPSL ITLVPDVRLM LVGRGPDEPE 
LRRLADRLGV VDRVSFTSIP PEDRQAMSDC IARAGVVALL SEYEAHPVAV MEAVALGRPV 
VVAPTAGLGE LAAAGLAQSV ADPADEQLVA KTLGIYLLAS AGDSPSETRP TPEISTLPTW 
DGCAEALARI YRESV