Gene Francci3_3948 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3948
Symbol
ID	3906907
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4726681
End bp	4728096
Gene Length	1416 bp
Protein Length	471 aa
Translation table	11
GC content	73%
IMG OID	637881275
Product	glycosyl transferase family protein
Protein accession	YP_483027
Protein GI	86742627
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1215] Glycosyltransferases, probably involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGGGTGG GGTCGAGGTG CGCGCAGGCC CGCCGGGGGT CCATCCGATT CCGCGGGACG 
ACTTTGGCGC GGTGCGGGTG TCACGGCTGC GCGGCGTCAT GGCGTCATGG CGTCAATGGC 
GCCGTACCGC AAAGGACGGA GCCGTTGGTT GTGGCTGACC GGCGGAACGC TACGGTAACC 
GCCATGACAG GTGTCCGGAC CATCGGTCGA GGTGCCGCCG TGGCGGCGCT GGGAGCCACA 
ACCGTTTACG GTCACGTCTT GTATCCGATC TATATCGGAT TGCGCAGCCG TGGTCTGGAG 
TCGACGGCAC CGCCGGACCC TGAGATCTGG CCGGGACTGA GCGTGGTCGT CTCCGCCTAT 
CGGGAGTCGG CGGTGATCGG GGCGAAACTG GATGAACTCA CCCGCGCGGA CTATCCCGGG 
CCGATGGAGA TCATCGTCGT GGCCGACGAT CCGGAGACGG CCGAGGCCTC GCGCCGGCCC 
GGCGTGCGGG TGCTGTCGTC CGGGGAACGC CTCGGCAAGG CGCGGGCGGT CAACCGGGGA 
GTCGCCGCCG CCACCCACGA GCTCGTGGTG CTCACCGATG CGAACGCTGT GCTCGCGCCC 
GGTGCCCTGC GGGCAGCCGC CCGTCATTTC ACCGACGAGA CGGTCGGCGC GGTGGCGGGG 
GAGAAGCAGG TTGACGATCC CGACGGCGCC CAGGGCTTCT ACTGGAAGTT CGAGTCCTGG 
CTGAAGCGCC GCGAGTCGGC GACCGGGGCG ACCATCGGCG TGGTCGGCGA GATGCTGGCC 
TTCCGCCGCC AGGCGTTTCG GCCCCTGCCC GCGGACGTGG CCGTCGACGA TGCCTGGCTG 
GCTCTCGACA TCCTCGAAGG GGGGCTGCGG GTCGTCTACG AACCCGAGGC GTACTCGATC 
GAGTCGTCGA GCCCGGACTA CTCGGCGGAG TGGGAGCGGC GGACCCGGAT CGTCGCTGGC 
AACCTCGACA TGCTCTGGCG GCGCCGGGCG GCGCTGGTGC CCGGCGCGCT GCCGGTCACC 
CCGCAACTGT GGGGCCACCG GCTGGTCCGC TCGTCATTCG GCCCGTTGGC GCAGGTCGTC 
CTGGTGGGGC TCGCCCTCCC GGCCGCCCGC CGGAGCTGGA TTGCCCGGCT GTTCCTGGCC 
GGCAACGCCG TCGGCGCTGT GAGTACCGCG GCGCTGCTGA CCGGGCGCAC GCCGCCCGGT 
CCGACCCGCC TGGTCGCGCA GGTCTTCTTC CTGCAGGCCG TCGCGCTCGG CGGGGTGCGG 
CGCTTTGTGG CCCGGGACCG GCCCGCCGTC TGGCCCAAGC CGGAGCGGCC GGCCGTGGCC 
TCCGCGACGT CACCGGCGCC CCCGGGGTCG GTCCTGCCAC CGGGGCAGAC GACGCCGCCT 
GGCCCGCCGA CCGAGTTGGC CCCGGCCGGC AACTGA

Protein sequence

MRVGSRCAQA RRGSIRFRGT TLARCGCHGC AASWRHGVNG AVPQRTEPLV VADRRNATVT 
AMTGVRTIGR GAAVAALGAT TVYGHVLYPI YIGLRSRGLE STAPPDPEIW PGLSVVVSAY 
RESAVIGAKL DELTRADYPG PMEIIVVADD PETAEASRRP GVRVLSSGER LGKARAVNRG 
VAAATHELVV LTDANAVLAP GALRAAARHF TDETVGAVAG EKQVDDPDGA QGFYWKFESW 
LKRRESATGA TIGVVGEMLA FRRQAFRPLP ADVAVDDAWL ALDILEGGLR VVYEPEAYSI 
ESSSPDYSAE WERRTRIVAG NLDMLWRRRA ALVPGALPVT PQLWGHRLVR SSFGPLAQVV 
LVGLALPAAR RSWIARLFLA GNAVGAVSTA ALLTGRTPPG PTRLVAQVFF LQAVALGGVR 
RFVARDRPAV WPKPERPAVA SATSPAPPGS VLPPGQTTPP GPPTELAPAG N