Gene Francci3_1104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1104
Symbol
ID	3905775
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1317629
End bp	1318846
Gene Length	1218 bp
Protein Length	405 aa
Translation table	11
GC content	74%
IMG OID	637878436
Product	transposase IS66
Protein accession	YP_480213
Protein GI	86739813
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.159368
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.482446
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGGGTCG TACGGCGGAC GACCCGACGA CGCCGCTACC GGCGGGCCTG CGCCTGCTAC 
GGCCCGGCGA CGGTCATGGC GCCGGGCGAA CCGCGGGCAC TCGGCAAGGG GCTGTGGACG 
AACCGGTCGC TCGCGCTGCT GCTCGTCGAG CGCTACGGCG CGGGCCGGTC CCTGAACTCG 
CTGGTGGCGG GCCTGGCCCG GCACGGCGCG GTGCTGGCGG CCCCGACCCT GGTGGGTGCG 
TGCGCCCAGG CCGGCGTGCT GCTCGCCCCG CTGGTCGAGG CGATCCGCCA ACGGTCCCAG 
GCATCGTGGC ACCTGCACGC CGACGAGACG AGCTGGAAGG TGTTCACCCC GAACGGCGGC 
GGGAAGCCGC AGCGCTGGTG GCTGTGGGTC TCCCTCGGCG AGGACACGGT GTGCTTCGTG 
ATCGACCAGA CCCGGGCCAG TTCGGTGCTC ACCGGCCACC TCGGCCTCAC CGAGCAGGCG 
GACGGCACGC TCACCGCCCC CGGCGGCGGC GAGCGGGTAT TGTCCTCCGA CTTCTACGCG 
GTCTACGTCT CCGTCGGCCG CCGCCGCGCC GGCCTCGTCA ACCTCTACCG CGTCGCCCAC 
CTTCGCCGCT ACTTCCCGCG GGCGAGGCTG TCGAACCCGG TCCAGCTGGA GTACTGGGAG 
AAGGCCTGGC TCGACCGGTT CCGCGCGCTC TACACAGCCC ACCGGGAACT GGCCACGGCG 
TGGGCGCGAG CGCGCGACAC CCCCGGCCCC GACGCCGACA CCCGGCTGGC CGAGGCCTAC 
ACCGCCTGGG ACGGCGCGAT CGAGGCGATC GACACCGCCC GCCGCGAGCA GCAGGCCTCC 
CCAGGGCTAC AGCCCGCGGC GAAGGACGCC CTCGCCACCC TCGAACGCGA GTGGGACGGG 
GTCGTCGCGC ACCGCGACTA CCCCATGGTA GATCTTGACA ACAACGCCGC GGAGCGCGCC 
CCGCGCCGCC CGGTCGTGAC CCGCAAGAAC GCCTACGGCT CCCGCACCGA CGACGCCGCG 
GCCCTCGCCG CCGCCGTCTG GACCGTCCTG GGCACCGCCG AGAAGCACGG ACTGAACACG 
CTGACCTACC TGACCGCCTA CCTCGACGCC TGCGGCCGAG CCGGCGGCAA ACCCCCACAG 
GGAACCGACC TCGACCGGTT CCTGCCCTGG CTGGCCAGCC CCGACGACCT CGCCACGTGG 
AAACAGCCAC CCGGCTGA

Protein sequence

MRVVRRTTRR RRYRRACACY GPATVMAPGE PRALGKGLWT NRSLALLLVE RYGAGRSLNS 
LVAGLARHGA VLAAPTLVGA CAQAGVLLAP LVEAIRQRSQ ASWHLHADET SWKVFTPNGG 
GKPQRWWLWV SLGEDTVCFV IDQTRASSVL TGHLGLTEQA DGTLTAPGGG ERVLSSDFYA 
VYVSVGRRRA GLVNLYRVAH LRRYFPRARL SNPVQLEYWE KAWLDRFRAL YTAHRELATA 
WARARDTPGP DADTRLAEAY TAWDGAIEAI DTARREQQAS PGLQPAAKDA LATLEREWDG 
VVAHRDYPMV DLDNNAAERA PRRPVVTRKN AYGSRTDDAA ALAAAVWTVL GTAEKHGLNT 
LTYLTAYLDA CGRAGGKPPQ GTDLDRFLPW LASPDDLATW KQPPG