Gene Francci3_4040 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_4040
Symbol
ID	3907001
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4825318
End bp	4826364
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	69%
IMG OID	637881369
Product	UDP-glucose pyrophosphorylase
Protein accession	YP_483119
Protein GI	86742719
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1210] UDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01099] UTP-glucose-1-phosphate uridylyltransferase

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCTGTG CATTGCCTGT GCTGGGGCCG TGGACGGTGC CCGTGTCCAC GGACCCGACT 
AAGGTTTCGG CTATGCCAGT AACGAAGGCG GTCATTCCAG CCGCGGGTCT GGGGACCCGC 
TTCCTGCCGG CGACGAAGGC CGTCCCCAAG GAGATGCTGC CGGTCGTCGA CAGGCCGGCT 
ATCGAATACG TCGTCGAGGA GGCGTCCCGC GCCGGCCTGC GCGATGTCCT GCTTGTCACA 
AGCCGCACGA AAAAGGCGAT CGAGGATCAT TTCGATCGTG AGGCGGACAT CGAGGCGGCC 
CTCGAACGGA AGGGTGACGA TCTTCGTCTC CGTCGGGTCC GGGTGTCGGC GGAACTGGCC 
GAGGTCCACT CGGTCCGCCA GCAGTCGCCG CGTGGGCTCG GTCATGCCGT GCTCTGCGCG 
GCGGCGCACG TGGGAAACGA GCCGTTCGCT GTCCTCCTCG GTGACGATCT CATCGACGAG 
CGGGACCTGC TGCTCGAGGA GATGCTTGCC GTGCAGCGCC GCTTCGGGGG CAGCGTCATC 
GCCCTGATGG AGGTGCCCGA GGACCAGGTC TCCCTCTACG GCGTCGCCAC GGTGGAGTCC 
GTCGGCACCA GTGCCGGCAC CGGCAGTGCC GACGACCGGT ACGGGATCGT GCGGATCCGT 
GACCTGGTCG AGAAGCCACC GGTCGCGCAG GCCCCGAGCA ATCTGGCGAT CATCGGGCGG 
TACATCCTCT CGCCGACGAT CTTCGACGTC CTGCGGCGGA CCGAGCCGGG ACGGGGCGGG 
GAGATCCAGC TCACCGACGC CCTGCGGATC CTGGCGCTAC GGGCGGTCGA ACCGGCCGGT 
GCCGCGGGGG ACGCCGGCAC CGACACTGCC GCCGAGCCCG TGCACGGGGT GATCTTCACG 
GGTCGGCGGT ACGACACCGG TGACCGGGTG GACTACCTGA AGGCCGTCAT CCGGCTCGCG 
TGCGAGCGCG CCGACCTTGG CCCCGAGCTG TACCCGTGGA TCGAGGAGTA TGTCGCGTCC 
GGTGGTCCGA AGGCAGCATT GTCCTGA

Protein sequence

MSCALPVLGP WTVPVSTDPT KVSAMPVTKA VIPAAGLGTR FLPATKAVPK EMLPVVDRPA 
IEYVVEEASR AGLRDVLLVT SRTKKAIEDH FDREADIEAA LERKGDDLRL RRVRVSAELA 
EVHSVRQQSP RGLGHAVLCA AAHVGNEPFA VLLGDDLIDE RDLLLEEMLA VQRRFGGSVI 
ALMEVPEDQV SLYGVATVES VGTSAGTGSA DDRYGIVRIR DLVEKPPVAQ APSNLAIIGR 
YILSPTIFDV LRRTEPGRGG EIQLTDALRI LALRAVEPAG AAGDAGTDTA AEPVHGVIFT 
GRRYDTGDRV DYLKAVIRLA CERADLGPEL YPWIEEYVAS GGPKAALS