Gene Francci3_1629 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1629
Symbol
ID	3905908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1958268
End bp	1959296
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	70%
IMG OID	637878967
Product	glycosyl transferase family protein
Protein accession	YP_480734
Protein GI	86740334
COG category	[R] General function prediction only
COG ID	[COG1216] Predicted glycosyltransferases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCACA GGCTGTTGGC GGTCGTCGTT TCTCACGGGG GATCGACGTC TCTGTACCGG 
TTGCTGACCA CACTGGATGC CATGGCGGAA TGTCGGGTGT TTCTGGTAGA AAATGATGGG 
AAATCCCGAC ATGATGCGTT GCCGGACGGT GTGCGCGTGG TCCAGGGGCA CGGGAACGTC 
GGATACGGCA CCGCGGTGAA CCTCGCTGTC CGCCGTGCCC TGGAGGACGG GCTGCGGCCG 
GAGTGGATCC TGGTGGTCAA CAGTGACGTG ACGGTCCCTG CCGACACCGC GACGATGATC 
CCGAAGCTGC TCGCCTGGGC CCCGTCGTCC GCCGACGTGG TCGGCTTCCC GATCCGCGGC 
ACGGCGGGCG AGCGGGGACG GGCGAGTGCC GTCCTGCCGC GCCCGCGGAC GAACGCCTAC 
ACGGCGGTAC GGGGCGAGAT CGCCGCGGTG GAGAGGTGGC CGGAACTGCG CTATCCGGTC 
GGCGCCTTCT TCGCCGTCCG CTCGGAGATT TTCCTACGGC TGGGCGGATT CGACCCGTCG 
TACTGGATGT ACTACGAGGA GACGGATCTG TTCGCCCGGT TGCACGCCGC GGGTGGGCGC 
ATCGTCTGGG CGGACGACGC CTGGCCGGTC GTTCATGTGG GCGGGGAGAC CGTCGGGCGG 
TCCGGGCTGC TGTACGCCGA ACTCGGCCGG TCGGCAGCCA CCTATGCCCG GCGGCACCGT 
CACGACGTGG GCCGGTCGTG GACCGCGGTG CACGCGGCCC AGTTGACCGT CCTCGCCGCG 
CGCAAATTGG CCGTGGGCCG GTCGCACGAC GCGTTGCGCG CGGTCCGGAT CCTCTCCGGG 
CTGGTGAGCG GGCTGGCCCG GCCAGGCTGG GAGCCCGCGG TCAGCTCACG GTGGCACGCC 
GTCCCGGCCG AGACGCGGCT GCGTCTCGGC CATCTCCGCC CGGTCCCGCG GACGCCGCGG 
CAGCGGCAGG ACGATCTGAT CGATGATCTC GCCGACGGCT CCCCCGGCTC CTCTGGCCAG 
CGGACGTAG

Protein sequence

MMHRLLAVVV SHGGSTSLYR LLTTLDAMAE CRVFLVENDG KSRHDALPDG VRVVQGHGNV 
GYGTAVNLAV RRALEDGLRP EWILVVNSDV TVPADTATMI PKLLAWAPSS ADVVGFPIRG 
TAGERGRASA VLPRPRTNAY TAVRGEIAAV ERWPELRYPV GAFFAVRSEI FLRLGGFDPS 
YWMYYEETDL FARLHAAGGR IVWADDAWPV VHVGGETVGR SGLLYAELGR SAATYARRHR 
HDVGRSWTAV HAAQLTVLAA RKLAVGRSHD ALRAVRILSG LVSGLARPGW EPAVSSRWHA 
VPAETRLRLG HLRPVPRTPR QRQDDLIDDL ADGSPGSSGQ RT