Gene Francci3_3843 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3843
Symbol
ID	3905591
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4603463
End bp	4604503
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	62%
IMG OID	637881169
Product	glycoside hydrolase family protein
Protein accession	YP_482922
Protein GI	86742522
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2273] Beta-glucanase/Beta-glucan synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	34
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	8
Fosmid unclonability p-value	0.106581
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCTC GGGTGAGGCG TTGGAGACTG AGTCGACGCG GAGGACTGGT CGCTCTTCTT 
CTCGTCTGCC TGGTCGTGGG ATGTGGAACC TCGAAACGGG AATCTGGTTC GCCGCAGGCC 
ACGCCTCGAC CTTCGGTGGC TGGTCCGGGC GTTGGCGGCA TGGTGACCTC CTCCGCGCTA 
CCATCCGGCC CACCGTCGGC GACCGGCGCC TCGGCAGGTT CTAGTCCCCG ATCCTCCGGA 
GAGGTTTCTC CGCCGAATGG TCCGCGGACT CCGCGAGAGG ATGACGGGAT GGAGCCGCGA 
CTGCTGTGGT CCGATGAATT TGACGGTCCG GCGAACGCCT CGGTTGATCC CGCCAGGTGG 
TTGATCACGC AAGGGGGGAA ATGGGGGCCG ACGGACGTCT CCTGTTATAC GGCCGATCCC 
CGTAACGTCG GCCTGGACGG CAAGGGCCAT CTCAAGCTGA CGGCGATTGC GGAGAAATCT 
CCCGTAAAAA CCTGTGGGGA TACTCACTTC TCGTCGGGCC GGGTGGAGAC CCGCGGTAAG 
GCCTCCTGGA GATATGGGTA CTTCGAGTTC CGGGCCCGGC TGCCGATCGG TACCGGGACG 
TTGCCTGCTC TCTGGCTCCT AGGGCCGAAC GGAATTTATG ACTGGCCTCG CTCCGGCGAG 
ATCGATGTCG TCGAGGCGAC GGCAAACGAG CCGGCCACGG TCCATACCAA CATTGTTGGA 
GTGGATGGCT CTGGAAATCG TTGGGAGGCC GGCTGGTGGG GGCGGGGAAA GAACTATGTC 
TACCCAGGTG GCACGCTTGC GGATCGCTAT CATAACTATG CTCTTGACTG GGGGCCGAAC 
AGGCTCGACT TCTATTTCGA CGGCCTTCTC ATCCGCCATC TCGAGCCGAA GGACACGCCG 
GTTTGGCTGT GGAACAAAGA CTTCTATATA ATCATGGATG TCGCCGTCAG CGCGAAGCTG 
AGCCCCCCGC TTCCGCCGGC CTCCGCGTTC CCGCAGACGC TGTTCGTAGA CTATGTGCGT 
GTCTATTCAG GCAGACCTTA G

Protein sequence

MKPRVRRWRL SRRGGLVALL LVCLVVGCGT SKRESGSPQA TPRPSVAGPG VGGMVTSSAL 
PSGPPSATGA SAGSSPRSSG EVSPPNGPRT PREDDGMEPR LLWSDEFDGP ANASVDPARW 
LITQGGKWGP TDVSCYTADP RNVGLDGKGH LKLTAIAEKS PVKTCGDTHF SSGRVETRGK 
ASWRYGYFEF RARLPIGTGT LPALWLLGPN GIYDWPRSGE IDVVEATANE PATVHTNIVG 
VDGSGNRWEA GWWGRGKNYV YPGGTLADRY HNYALDWGPN RLDFYFDGLL IRHLEPKDTP 
VWLWNKDFYI IMDVAVSAKL SPPLPPASAF PQTLFVDYVR VYSGRP