Gene Francci3_0010 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0010
Symbol
ID	3902957
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	13122
End bp	14525
Gene Length	1404 bp
Protein Length	467 aa
Translation table	11
GC content	73%
IMG OID	637877340
Product	glycosyl transferase, group 1
Protein accession	YP_479133
Protein GI	86738733
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.785418
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	21
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGCGGATTG CGTTGTTGTC GTACCGGAGT CTGCCCACCT GCGGTGGCCA GGGTGTGTAC 
GTCCGACATC TGTCCCGCGA ACTGGTCGCC CTGGGGCACC GCGTCCAGGT GGTGAGCGGG 
CCGCCGTACC CGGTGCTTGA GGAGGGTGTC GGCCTCACCG AACTGCCCAG CCTTGATCTC 
TACCGGGACT CCGACCCGTT CCGGTGGCCC GGACTGGCCG AGTTCCACGG CCTGCCGGAC 
GTCGTCGAGT TCGCCATGAT GCGGACCGGC CAGTTCTCCG AGCCGCTCGC CTTCAGCCTG 
CGTGCCTGCC AAGCCCTGCG CCCCAGGGCA TCCGGGGGTC GGCCGCCGTT CGACATCGTC 
CATGACAACC AGGGGCTGGG ATACGGCCTG CTGGCGCTGC GGGCAGCCCT GCGCCCGTAC 
CGGATCCCGG TCGTGGGCAC CGTGCATCAT CCGATCACGG TCGATCGCCG CCTGCACCTC 
GCCGCGGCGA CCACCTTCAC CTCCCGGCTG GGCCTGCGCC GGTGGTACTC GTTCCTCCCG 
ATGCAGGCCC GGGTCGCGCG GGGGCTGGAT GGCATCGTCA TCCCGTCGGA GAGCTCCCGG 
CGAGAGATCA TCGCGGACAT GAACCTCCCC CCGACGGTCA TGCGCACGGT TCCCTTGGGA 
GTCGACGCCG ACGTCTTCAC GCCGGCGCCC GCGGGCAATC CGGCGGTTCC GGGCCGTGTC 
GTCGTCGTGA CCAGCGCCGA TGTTCCGCTT AAGGGCCTGC TTGTCCTGCT CGAGGCGCTC 
GCGAAGCTGC GGGTGGATCG CTCGGCGCAC CTGGTCTGCG TCGGCAAGGT CCGCGAAGGG 
GGAACGGCCC AGCGCCAGGT TGCCGAGCTG GGCCTGGCCG ACGCCGTGAC GTTCCGTTCC 
AACATGCCGG AACCGGAGCT GGTGGACCTG TTGCGCTCCG CCGAGGTCGC GGTCGTTCCC 
TCGCTTTACG AGGGGTTCAG CCTGCCCGCC GTCGAGGAGA TGGCCTGCGG GATCCCGCTG 
GTCGCCACCA CCGCCGGGGC GTTGCCCGAG GTCGCCGGTC CGGACGGGGA GGCCGCGTTG 
CTGGTCCCAC CGGGGGATGC GGGAGCCCTG GCGGACGCCA TCGGTTCCCT GCTCGATGAT 
CCCGAACGAC GGGCCCGAAT GGGTGCCGCC GGGCGCCGCC GGGTGGAGGC GCGGTTCTCC 
TGGCGGGCGG CCGCCGCGGC CACCGCGGAC TGGTACGCCG AGCGGATCGC GGCGGTCGGC 
GGGACGCCCA CCTCCCCGGT CCCGGCCCCG GGACCGGGAC CGGGACCGGC GGCCCAGTGG 
ACGCCGGCAC CGCTGTCCAC ACCCGGCGCC GTCACACCCG GCGCCGCGGC GTCCGCACCG 
GCGTCGTCGA CGCTGACCGG CTGA

Protein sequence

MRIALLSYRS LPTCGGQGVY VRHLSRELVA LGHRVQVVSG PPYPVLEEGV GLTELPSLDL 
YRDSDPFRWP GLAEFHGLPD VVEFAMMRTG QFSEPLAFSL RACQALRPRA SGGRPPFDIV 
HDNQGLGYGL LALRAALRPY RIPVVGTVHH PITVDRRLHL AAATTFTSRL GLRRWYSFLP 
MQARVARGLD GIVIPSESSR REIIADMNLP PTVMRTVPLG VDADVFTPAP AGNPAVPGRV 
VVVTSADVPL KGLLVLLEAL AKLRVDRSAH LVCVGKVREG GTAQRQVAEL GLADAVTFRS 
NMPEPELVDL LRSAEVAVVP SLYEGFSLPA VEEMACGIPL VATTAGALPE VAGPDGEAAL 
LVPPGDAGAL ADAIGSLLDD PERRARMGAA GRRRVEARFS WRAAAAATAD WYAERIAAVG 
GTPTSPVPAP GPGPGPAAQW TPAPLSTPGA VTPGAAASAP ASSTLTG