Gene Francci3_0648 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0648
Symbol
ID	3902982
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	739854
End bp	740924
Gene Length	1071 bp
Protein Length	356 aa
Translation table	11
GC content	72%
IMG OID	637877981
Product	PGAP1-like
Protein accession	YP_479761
Protein GI	86739361
COG category	[R] General function prediction only
COG ID	[COG1075] Predicted acetyltransferases and hydrolases with the alpha/beta hydrolase fold
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.00162479
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.67184
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCGCGG ACAACATCGC CGCTCCAGGG CGGTCGGTCC TCACCGGCCT GCGCACGACC 
CCGGTGAACG CCCGCGGGCT CGCCGTGGAA GCGGCCTGGA TCGCCACCCA CCTCGCCCTC 
TACCCGGCGA GTGCGCTGCG CCGGCAGCGC CCGCGCGAGC ACGAGCCCTA CTCGCTGAGC 
GCGCTCTCCC CGCTGCACCG CAGCCTGCTG GTCAACGCTC CCGACGCGGC AGGCACCCCG 
ATCCTGCTGA TCCACGGCCT GATCGACAAC CGGTCCGTGT TCACCCGGTT GGGCCGGTCG 
CTACGCCGCC GCGGTTTCCG CCGGGTGCGC ACGGTGGAGC TGCCGCTGCT CGTGCCGACG 
GTGCAGGAAG CGGCGCTCCG ACTCGCCGCG TCCGTGCACG CCGCGATGAC GGACAGCGGC 
AGGCAGCGCG TGCACATCGT CGCCCATTCA CTCGGCGGGC TGGTGGCCCG CTACTACGTG 
CAGCAACTCG GGGGCGATCA GTACGTGGAC ACGCTGATCA CTCTCGCGAC GCCTCATTCC 
GGCACCCGTC TCGCCGGGCT CGTCCCCCGG TCGGTGCCGT ACCGGCTCGT CACCCAGCTA 
CGGCCGGGAT CGGCGCTCCT ACGCGAGCTC GCCGCACCCG CCCCCGGCTG CCGGACCCGG 
TTCGTCGCGA TCGGCGCCGG GCTGGACAGC GTGGTGCGGC CCGCCGAGGC GGCGCTCGAC 
CATCCCGATC TCGACATCGA AAATTACACC GTGCCGGGCC TCGGGCATCA TTCCCTGGCG 
TTCAGCGGCA AGGTTGCCCA CCTGGTCGCG AGCTGCCTCG CCGGGGCGGC GGACCGGCCG 
GGACTCTCGG GACCGTCAGA GCTTCTCGAC GGGGGCGTAC CGCAGGAGCA GGCGCTTCGT 
GCCGGTGTTC TCGCCGAAAT CGATGGTCGC CTCCGCGGAG TCACCGACCC CGCCGGTGGC 
GACGACAACT CCGAGACCGA AACTGTCATG CGTCACCCGG TCGCCCTGAC GCAACTCCAG 
GACGGCCCGA GCGGCCGGCC GCGCGCGACC CGAGAACGGC GAGTTCGGTA G

Protein sequence

MAADNIAAPG RSVLTGLRTT PVNARGLAVE AAWIATHLAL YPASALRRQR PREHEPYSLS 
ALSPLHRSLL VNAPDAAGTP ILLIHGLIDN RSVFTRLGRS LRRRGFRRVR TVELPLLVPT 
VQEAALRLAA SVHAAMTDSG RQRVHIVAHS LGGLVARYYV QQLGGDQYVD TLITLATPHS 
GTRLAGLVPR SVPYRLVTQL RPGSALLREL AAPAPGCRTR FVAIGAGLDS VVRPAEAALD 
HPDLDIENYT VPGLGHHSLA FSGKVAHLVA SCLAGAADRP GLSGPSELLD GGVPQEQALR 
AGVLAEIDGR LRGVTDPAGG DDNSETETVM RHPVALTQLQ DGPSGRPRAT RERRVR