Gene Francci3_0964 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0964
Symbol
ID	3903871
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1139233
End bp	1140699
Gene Length	1467 bp
Protein Length	488 aa
Translation table	11
GC content	71%
IMG OID	637878298
Product	glycosyl transferase family protein
Protein accession	YP_480077
Protein GI	86739677
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.824604
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCTCGA CCGATCAGGG GGGCAGGACC GATCAAGCGA GTAGGACCGA TCAAGCGAGT 
AGGACCGAGC AGGGGAGCCG GACCGGGCCG GCGGGCAGAC CGGACGACCG CACGGGCCTG 
CTCCGTCTGC CCGTTCTGCC GCATCCCCGC CACCCGCTGG AGCGTCCCGA GCGGACGGGC 
GGTTCGGCCG CGGAACCGGT CGGTTCCCGG CTGGACGTCG GGCCACAGGT GTCGGTCGTG 
ATACCCACCC GCAACGAGGC GCGCAACGTC GAACCGCTGC TGCGGCGCCT CGACGAGGCG 
CTGCACGGCC TGTCCGGAGA AGTAATCTTC GTTGACGACT CCGACGACGG AACGCCCGAG 
GTCATCGCGC GCGTCCGCCC CTCGGTGCGG TTACCGGTAC GGGTGCACCA CCGGACCCCG 
GCCCAGCGGG TCGGCGGGCT GGGGGGCGCG GTCAGCGAGG GCTTCGCGCT CTGTGCCGCG 
CCCTATGCGG TGATCATCGA TGGGGACCTC CAGCATCCGC CGGAGACCAT CCCGGCGCTG 
CTCGGCACCG CCGTGGAACA TGCCGCCGAT GTGGTGATCG GCAGCCGGTA CGTGTCCGGC 
GGCAGCGCAT CGGGGCTCGC TGGAAGCATG CGGCACCTGG TCTCGACGGG GTCGAACCGG 
TTGTGTCGGT GGGTCTTCCC CCGTCGGCTG CGCGGCGTCT CGGACGTGAT GAGCGGCTTC 
TTCCTGGTAC GGGTCGCCGT CGTGGACCGG GCCGGCCTGC GACCGGACGG CTACAAGATC 
CTGCTGGAGC TGCTCGTCGC GTCCGGACGG CTGCGCGTCC GCGAGATCGG GTACGCCTTC 
GCCGAGCGGC ACGCCGGGAC CTCCAACGCC TCGCTGACCG AAGGCGCCCG CTTCGCCCGG 
CGGCTGTTCG CGTTGCGGGT TCCGAAGCCC GCGCGGTTCG CCCTGGTCGG GGCGTCCGGG 
ACGGTGCCGA ACCTGCTTGG CACCGCCGTG CTTCACCACG TCGGCTTGCA CTACCTGGTC 
GCGGCGATCG TCGCGACCCA GATCGCCGTC GGCTGGAACT TCCTCGGCTG CGAGCTCCTG 
GTCTGGGATC GGGAGACGGG TTCCCGGCTG CGTCGCTATC CGGCGTTCGC GCTCATCAAC 
AATCTCGATC TGGTCATTCG GCTGCCACTG CTCGCGGTGC TGGTCGGGCG ATGGCATCTC 
GGCGTCGGCA TCTCGACCCT GATGTCCCTG GCCGCCGCGG TGATCGTCCG ATACCTGGTG 
GTGGATCGGC TGGTGTACCG GCGACGGGCG GTGTCTGAGC GGGCGGTGTC TGAGCGGGCG 
GTGTCTGAGC GGGCGGTGTC TGAGCGGGCG GTGTCTGAGC GGGCGGTGTC TGAGCGGGCG 
GTGTCTGAGC GGGCGGTGTC TGAGCGGGCG GTGTCGCCGT CCCACGGAAG GCCGTCGGAG 
GACGGGGTGT CCGGTGCGGT TTCGTAG

Protein sequence

MTSTDQGGRT DQASRTDQAS RTEQGSRTGP AGRPDDRTGL LRLPVLPHPR HPLERPERTG 
GSAAEPVGSR LDVGPQVSVV IPTRNEARNV EPLLRRLDEA LHGLSGEVIF VDDSDDGTPE 
VIARVRPSVR LPVRVHHRTP AQRVGGLGGA VSEGFALCAA PYAVIIDGDL QHPPETIPAL 
LGTAVEHAAD VVIGSRYVSG GSASGLAGSM RHLVSTGSNR LCRWVFPRRL RGVSDVMSGF 
FLVRVAVVDR AGLRPDGYKI LLELLVASGR LRVREIGYAF AERHAGTSNA SLTEGARFAR 
RLFALRVPKP ARFALVGASG TVPNLLGTAV LHHVGLHYLV AAIVATQIAV GWNFLGCELL 
VWDRETGSRL RRYPAFALIN NLDLVIRLPL LAVLVGRWHL GVGISTLMSL AAAVIVRYLV 
VDRLVYRRRA VSERAVSERA VSERAVSERA VSERAVSERA VSERAVSERA VSPSHGRPSE 
DGVSGAVS