Gene Francci3_3550 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3550
Symbol
ID	3904489
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4245428
End bp	4246495
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	68%
IMG OID	637880871
Product	UDP-galactose 4-epimerase
Protein accession	YP_482631
Protein GI	86742231
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1087] UDP-glucose 4-epimerase
TIGRFAM ID	[TIGR01179] UDP-glucose-4-epimerase

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.211522
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACGTCGA CGAGTCGAGC CGAGACGGTC CTGGTGACCG GGGCGACGGG GTTCATCGGC 
TCTCATACCT GGGTGGACCT GCTCGCCGCG GGTCATCGGG TAGTGGGAGT GGACAACTTC 
GTCAACAGCT CACCGCGGGT GCTGGACAGG CTGCGTAAGG TGGTGGACGG CGACATCGAC 
TTCGTGCGGC TCGATGTCCG TGACCGGGCG GCGCTCGGTG ACGTGTTCCG CCGATGGAAG 
ATCGATTCCG TTATTCACTT CGCCGCTCTC AAAGCCGTCG GCGAGTCGGT CGACATCCCG 
CTGGAGTACT ACGACACGAA CGTCAACGCG ACGTTGGGTC TGGTCCGCGT GATGGCGGAG 
CACGGCGTGC GCCGGCTGGT CTTCTCGTCC TCGTGCGCAA TCTACGGAGC GGCGGACAAG 
GTACCGATCG CCGAGGACAC GCCGGCCCGC CCGACCAATC CCTACGCGCG CACCAAATGG 
ATGTGCGAGC AGATCCTCGC CGACCTCTGC GCCCGGGATC CGTCCTGGCA CGTGACGTCC 
CTGCGATACT TCAACCCCGC CGGGGCGCAC GAGTCGGGCC TGCTCGGCGA GGATCCCCGT 
GGGGTGCCGA ACAACGTCAT GCCCTACCTG GCCCAGGTGG CGGTCGCCCG GCGCCCGGAG 
CTGTCCATCT TCGGCGACGA CTACCCCACG CCCGACGGCA CGGGCGTACG CGACTACATC 
CACGTGGTCG ACCTGGCGGA GGGCCATCGA CTCGCTCTCG ATCATCTCGA TGACCAGGCG 
GGACATCGGG TCATCAACCT CGGGACCGGC GCTGGCACCT CCGTGCGGGA ACTGCTCGCG 
GCCTTCTCCG CGGCCTGCGC TCGTGATCTC CCCAGTCGCG TCGTGGCGAG GCGGCCGGGG 
GACGTCGCCG CCCTGGTCGC CGACGCGGCG CTCGCCCGTA CGGCACTCGG CTGGTCAGCC 
CGCCGGGATG TCGCGGACAT GTGCCGGGAC GCCTGGGAGT TTCAGCGTCT CAATCCAGGG 
GGGTACGACG ATGAGGAGGA GCCTGATGAG CTCGTCGGAC AGCCTTGA

Protein sequence

MTSTSRAETV LVTGATGFIG SHTWVDLLAA GHRVVGVDNF VNSSPRVLDR LRKVVDGDID 
FVRLDVRDRA ALGDVFRRWK IDSVIHFAAL KAVGESVDIP LEYYDTNVNA TLGLVRVMAE 
HGVRRLVFSS SCAIYGAADK VPIAEDTPAR PTNPYARTKW MCEQILADLC ARDPSWHVTS 
LRYFNPAGAH ESGLLGEDPR GVPNNVMPYL AQVAVARRPE LSIFGDDYPT PDGTGVRDYI 
HVVDLAEGHR LALDHLDDQA GHRVINLGTG AGTSVRELLA AFSAACARDL PSRVVARRPG 
DVAALVADAA LARTALGWSA RRDVADMCRD AWEFQRLNPG GYDDEEEPDE LVGQP