Gene Franean1_0688 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0688
Symbol
ID	5669105
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	807092
End bp	808096
Gene Length	1005 bp
Protein Length	334 aa
Translation table	11
GC content	72%
IMG OID	641239615
Product	UTP--glucose-1-phosphate uridylyltransferase
Protein accession	YP_001505053
Protein GI	158312545
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1210] UDP-glucose pyrophosphorylase
TIGRFAM ID	[TIGR01099] UTP-glucose-1-phosphate uridylyltransferase

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.289129
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCAGTGA CGAAGGCGGT CATTCCCGCC GCGGGTCTGG GGACCCGGTT CCTGCCCGCG 
ACGAAGTCGG TTCCGAAGGA GATGCTACCT GTCGTCGACA GGCCGGCCAT CGAATACGTC 
GTCGAAGAGG CCTCCCGCGC GGGCCTGCGT GATGTGCTGC TCGTGACGAG CCGCACCAAG 
AAGGCCATCG AGGACCACTT CGACCGGGAG GGGGATGTCG AGGCCGCGCT TGAGCGCAAG 
GGCGACAAGG TTCGCCTCGA ACGCGTCCGG GCCTCCGCCG AGCTGGCCGA GGTCCACTCC 
GTCCGTCAGC CCTCGCCGCG GGGGCTCGGT CACGCCGTTC TGTGCGCCTC CGCGCACGTG 
GGCGACGAGC CGTTCGCGGT CCTGCTCGGG GACGATCTCA TCGACGAGCG TGACCCGCTG 
CTGGTCGAGA TGCTCGCCGT CCAGGAGCGG CACGGCGGGG CGGTCGTCGC GCTGATGGAG 
GTGCCCGAGG AGGCCGTCTC CATGTACGGC GTGGCGACGA TCGCTCCGAC GGCCGCTGCT 
CCCGCCTCGG CTGCTCCCGC CTCGGCGGTC TCGGCGGTCT CGGCGGCTTC GGTGGAGCGG 
GTCTCGGCGG GCGGGTCCGG CGGGCGCTAC CGGACGGTGC GCATCACCGA CCTGGTCGAG 
AAGCCGCCGG TGGACGAGGC GCCCAGCAAC CTGGCTGTCA TCGGGCGCTA CGTGCTGCCT 
GCGGAGATCT TCGACGTCCT GCGGGCCACG CCGCCCGGCC GGGGGGACGA GATCCAGCTG 
ACCGACGCGC TGCGGACGCT GGCGGAGCGG GCCGGCGCCG ATCCGGGCGC GGAGATTCCG 
GTGCACGGCG TCGTGTTCAC CGGGCGCCGT TATGACACCG GTGACCGGGT CGACTACCTC 
AAGGCGGTCG TCCGGCTCGC CTGCGAGCGG CCGGACCTCG GCCCGGAGTT CTACCCGTGG 
CTGGAGGAGT ACGTGGCGTC CGGCGGTCCC AAGGCCGAAT GCTGA

Protein sequence

MPVTKAVIPA AGLGTRFLPA TKSVPKEMLP VVDRPAIEYV VEEASRAGLR DVLLVTSRTK 
KAIEDHFDRE GDVEAALERK GDKVRLERVR ASAELAEVHS VRQPSPRGLG HAVLCASAHV 
GDEPFAVLLG DDLIDERDPL LVEMLAVQER HGGAVVALME VPEEAVSMYG VATIAPTAAA 
PASAAPASAV SAVSAASVER VSAGGSGGRY RTVRITDLVE KPPVDEAPSN LAVIGRYVLP 
AEIFDVLRAT PPGRGDEIQL TDALRTLAER AGADPGAEIP VHGVVFTGRR YDTGDRVDYL 
KAVVRLACER PDLGPEFYPW LEEYVASGGP KAEC