Gene Francci3_1304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1304
Symbol
ID	3904353
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1560118
End bp	1561443
Gene Length	1326 bp
Protein Length	441 aa
Translation table	11
GC content	72%
IMG OID	637878637
Product	glycosyl transferase, group 1
Protein accession	YP_480410
Protein GI	86740010
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTCCCCT CTCCTGTCCG GTCGCGCGTC CTGCTGGTGA CGCACTACTT CCCCCCGGAG 
ACCGGAGCTC CCCAGTCCCG GTTGTCGGAG ACGGCACGCG CGTGGGCGGC GAACGGGCTC 
GACGTCACCG TACTCACCGG CATGCCGAAC CACCCGACGG GCAAGATCCC TGCCGCCTAT 
CGCGGCGCCT GGCTGCGGAC CGAGCGGGTC GACGGGTACC GCGTCGTACG CACCTGGCTC 
TATGCCACTC CCAACGAGGG GATCGCCCGC AAGACCCTCG GTCATCTGTC GTTCATGGTC 
ACCAGCGTCC TGCTCGGCGG CCGGCCCGCC GGCCCGGCCG ACGTGGTGGT GGTGTCCTCG 
CCGACCTTCT TTCCCCTCGG CTCGGCCTGG CTGCTCGCCA GGCTGCGCGG CGCCCGGCTG 
GTTGTGGAGG TCCGCGACCT GTGGCCGGCC ATCTTCGAGC ACCTCGGCGT CCTCACCGAC 
CGGCGGGTCC TCGGCGTTCT CGAACGCCTC GAACTCGCCG CCTACCGGGC CGCCGACGCC 
GTTGTCACGG TGACGGAGGG GTTCCGGGAG GACATCGTGC GACGAGGCAT CGCGCCGCGC 
AAGGTGCACG TGATTCCCAA CGGCGTGGAC CTCCGCCGGT TCCACCCGAC GACCGCGGCC 
TCGGCCGACA TCCGGGCCTG GCTGGGCGCC ACCGACGGCG ACACCCTCGT GCTCTACCTC 
GGCGCCCACG GCATCTCGCA CGGACTGACC TCGATCGCCG ACGCGGCCGC CCGGGTGACC 
GGCCGGCCGA TCCGGTTCGC CTTCGTCGGT GAGGGGGCCG AGAAACGCAG GCTCGTCGGG 
CACGTCGAGA GCCTGGGACT GGCCAACACG GTGCTGCGCG ACGGGGTTGC CCGCGAGGAG 
GTACCCGCCG TCGTCGCGAC CGCCGACATC TGCGTTGTCC CACTGCGGGA CGTGCCGATG 
TTCGACACGT TCATCCCATC GAAGATGTTC GAGTTCCTCG CCGCGGGCCG CCCGGTGATC 
GGGGCGGTCC GCGGCGAGGC GGCCCGGATC CTCCTTGCCG CCGGGCAGAT GGTCGTGCCC 
CCCGAGGACT CGGCCGCGCT GGCGGAGGCG ATCCTGGTCC TGGCGGCGGA CCCGGACCGC 
CGGGCGCGGA TGGCCCGCGG CGGGCGGGCG CACGTCGAGG CCCACTACGA TCGCGACGAT 
CTGGCCCGCC GGTACCAGAC GCTGCTGTTC GACAACGCAC CGTTCCCGGC GCCGCCTCCA 
CCGACGACCC TTTCCCCACC GGTGCAGGTA CCTGCACCGG TACCTGCACC GGACGTGGTC 
GCATGA

Protein sequence

MVPSPVRSRV LLVTHYFPPE TGAPQSRLSE TARAWAANGL DVTVLTGMPN HPTGKIPAAY 
RGAWLRTERV DGYRVVRTWL YATPNEGIAR KTLGHLSFMV TSVLLGGRPA GPADVVVVSS 
PTFFPLGSAW LLARLRGARL VVEVRDLWPA IFEHLGVLTD RRVLGVLERL ELAAYRAADA 
VVTVTEGFRE DIVRRGIAPR KVHVIPNGVD LRRFHPTTAA SADIRAWLGA TDGDTLVLYL 
GAHGISHGLT SIADAAARVT GRPIRFAFVG EGAEKRRLVG HVESLGLANT VLRDGVAREE 
VPAVVATADI CVVPLRDVPM FDTFIPSKMF EFLAAGRPVI GAVRGEAARI LLAAGQMVVP 
PEDSAALAEA ILVLAADPDR RARMARGGRA HVEAHYDRDD LARRYQTLLF DNAPFPAPPP 
PTTLSPPVQV PAPVPAPDVV A