Gene Francci3_1310 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1310
Symbol
ID	3904359
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1569297
End bp	1570487
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	72%
IMG OID	637878643
Product	glycosyl transferase, group 1
Protein accession	YP_480416
Protein GI	86740016
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0438] Glycosyltransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.039712
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGGTCG TCGCCACCGA CGCGTGGTTC CATCACCGGC CGAGTGGGTG GCGGCGCCGG 
GGCCCGATAA CGGTGCTGAA GGTGCTGAAC CGGATGGAGC GCTCCGGCAT TCATCCGGGG 
GCCGTGAACC TGCTCCGCCG CCTCGACCAG GACGAGTTCC GGCTGTTGTT CGCGGTGACG 
TCCGGCGCGG CAGGAGCGTT CGACGGTGAG ATCCGGGCGC TCGGCGGCGA GGTGTACCAC 
TGCCGGGCCG ACTGGCGCTT TCCATGGTCC TTCCTGAGGC TGCTGCGCCA GGTACGCCCG 
GACGTGGTGC AGGCGGAGGT GGTGCAGGCG GACGTGACGA TCCTCTCCGG GGTGGTCCTC 
GCGCTGGCCC GGCTCGGGGG GGTTCGGCGC CGCGTCGCCT ACCTCGCCGA TGCCCCGGAC 
CGGCACGGCG ACAGCCTGGG CGGCCGGGTG CGGCGGATCG TCGGCCGGTT GCTGCTCGAC 
CGGTTCGCCA CCCATCTGGT CGCGGTGAGC GAGGCGGTGA TGCGGGGTCT GTGGCGGGAG 
AACTGGCGGC TCGACTCCCG TTGCCGCGTC ATCTACCACG GCGTCGAGCT GGAACCGGTC 
GGCGTCGCCA TCGCGGCCCG CCGCCGCGCG GAGGAACTCG CCGAGGACGA TCAGGAGCTT 
GTCACCATCG TCCACGTTGC CTGCCCGGAT TCGGCGAAGA GCCGGGACCG GGCCGTGGAG 
ATTCTCGCGG CGCTGCGGGG GCGGTCTGTG AACGCCCGGC TCCTCTTCGT GGGTCGTCAG 
GATGCCGCCG AGACGGCCCG GCTGGTCGCG CTGGCGTCTC GACGTGGCGT CGCTGACCAC 
GTCGAGTTCA TCGGCGAGGT TCTTGAGATC CCACGCCTGC TGGTCGCGGC CTCGCTGCTG 
CTGGTCACCT CCCGCCACGA GGGCCTGACC GGCATCGTGC TCGAGGCCTG CGCGGTCGGG 
ACGCCCGTGC TCTGCGCGGA CCTGCCCGGG GTCGACGAGA TCGCCCGGCT GCTCCCCGGC 
GTGACGATCC TGCCGCTGCG TATCTCCGAC GCGGTCTGGG CCGACACCGC CGAGATGCTC 
ACCGCCGTTC CCCCGACCAT TGATCAGCGC CGGGAGGCGA TGCGTCTGCT GCGCCGGTCC 
CCGTTCACGA TGGAGCACTG GCAACGCGAC ATCACGGCGG TGTGGTCGTA G

Protein sequence

MRVVATDAWF HHRPSGWRRR GPITVLKVLN RMERSGIHPG AVNLLRRLDQ DEFRLLFAVT 
SGAAGAFDGE IRALGGEVYH CRADWRFPWS FLRLLRQVRP DVVQAEVVQA DVTILSGVVL 
ALARLGGVRR RVAYLADAPD RHGDSLGGRV RRIVGRLLLD RFATHLVAVS EAVMRGLWRE 
NWRLDSRCRV IYHGVELEPV GVAIAARRRA EELAEDDQEL VTIVHVACPD SAKSRDRAVE 
ILAALRGRSV NARLLFVGRQ DAAETARLVA LASRRGVADH VEFIGEVLEI PRLLVAASLL 
LVTSRHEGLT GIVLEACAVG TPVLCADLPG VDEIARLLPG VTILPLRISD AVWADTAEML 
TAVPPTIDQR REAMRLLRRS PFTMEHWQRD ITAVWS