Gene Francci3_1301 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1301
Symbol
ID	3904350
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	1556212
End bp	1557264
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	71%
IMG OID	637878634
Product	glycosyl transferase family protein
Protein accession	YP_480407
Protein GI	86740007
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACGACGC AGACCCACCG AATCCCGCCG CGCCAGGGCC CGTCGTTCCC CGCGGCACCA 
CCGGCCGCAC CAGAACCGGC AACGCCAGCA CCGGCCGCGC CAGAACCAGC CGCGCCAGAA 
CCAGCAACGA CGCGAACCCC GCGCCGAGCG AACTGGCCGA CCCCCTATGA CACCGCCGCC 
CCCGCCGGAT CGACACAGCC ACAGCCGGCG CCGGGATCGG TTCCCGTCAC CGCGATCATC 
CTCGCCCACA ACGAGGCACC AAACATCGTC CGGGCGATCA GGTCCGCCGG TTGGTGTCGA 
CAGGTCGTCG TCGTGGACTC GGGTTCCACC GACGGCACCG CGGATCTGGC CCGCGCCATC 
GGTGCGACCG TCTGGCACGA GCCCTGGCGT GGGTTCGCCG GCCAGCGGCA GTGGGCGATG 
ACCAACCCGG GGATCGCCCA CGACTGGGTG TACTTCCTCG ACAGCGACGA ATGGGTGTCG 
ACCGCGCTCG CCGCCGAGAT CGCCGCCCGG CTGGGGACGG CGGACTGCGC GGCCTACAGC 
CAACGACGCC GGCTGGTGTT CGAAGGCCGC TGGATCGCGC ATTGCGGGTG GTACGCGAAC 
AGCTGGCAGG CGCGGCTGCT CGATCGGCGG GTGGCGTACT TCGACGCCGC CGTCACCTAC 
AGCGAACGGG CCGTGGTCAC TGGTGAGGTC GGACGGCTGT CCGCCGACCT GATCGACGAG 
GACCACAAGG GACTCGCCGC CTGGCTACGC AAGCACGTGC GCTACGCCGA ACTGGAGGCG 
GCGCGCCGCG TGACGCAGCC CGCTGTCCGG GAGCGGTTGG CGCGGGTCCG CGAGGAGGTG 
CGCCGGCCCA CCGGGTCGAC CCGACCGCTC ACCCGGACCA TCGCGAGGGA CGTGATCTTC 
CCGCTGGTTC CGGCCAAGCC GGCGGTCCTC TTCTGCTACA TGTACCTGCT ACGGAGCGGA 
TGGCGGGATG GGCGGCAGGG GCTGCTGTTC TGTCTCTACT ACGCCTGGTA TGAGCTCACG 
ATCGGCGCAC TGACTCGGTC CGTTCACCGG TGA

Protein sequence

MTTQTHRIPP RQGPSFPAAP PAAPEPATPA PAAPEPAAPE PATTRTPRRA NWPTPYDTAA 
PAGSTQPQPA PGSVPVTAII LAHNEAPNIV RAIRSAGWCR QVVVVDSGST DGTADLARAI 
GATVWHEPWR GFAGQRQWAM TNPGIAHDWV YFLDSDEWVS TALAAEIAAR LGTADCAAYS 
QRRRLVFEGR WIAHCGWYAN SWQARLLDRR VAYFDAAVTY SERAVVTGEV GRLSADLIDE 
DHKGLAAWLR KHVRYAELEA ARRVTQPAVR ERLARVREEV RRPTGSTRPL TRTIARDVIF 
PLVPAKPAVL FCYMYLLRSG WRDGRQGLLF CLYYAWYELT IGALTRSVHR