Gene Francci3_2533 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2533
Symbol
ID	3904677
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2996004
End bp	2997644
Gene Length	1641 bp
Protein Length	546 aa
Translation table	11
GC content	71%
IMG OID	637879861
Product	transposase IS66
Protein accession	YP_481627
Protein GI	86741227
COG category	[L] Replication, recombination and repair
COG ID	[COG3436] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCTGTTC TGTCTGTCAC CGATGATGTC ACCGAGGTGG CGTACTGGCG TGGGCGTGCC 
GAGCGGGCCG AGGAGTGTGC GGAGAAAGCC GAGGCCCGTG TCGGGCAGCT GCAGCTGCGG 
GTCGAGGAGT TGAGCGAGCA GGTCGCGGTG CTGTCCCGGA TGCTGTTCGG TCGTTCCTCG 
GAGAAGACCG GCCCGTCGTC GGCTGTGGAT GAGAAACCAG AAGATCGGCA GGATTCGGGC 
GGTGGGGATG CCGGCCGGCC GGCGCGTCAA CGCGGGCAGC GGCCGGGGAG CCGGGGGCAT 
GGCCGGCGGG ACTACTCGCA TCTGCAGACC CGCGAGGAGA TCCATGATGT GCCCGAGGTC 
GACCGTGCCT GCCCCGGGTG TGGGGTGGCG TTCACGCCGT TGGGGACCGA CGACAGCGAA 
CAGGTCGACT GGCAGGTCGT GATCACCCGG ATCGTGCATC GGCGGCGGCG GTATCGGCGG 
TGCTGCACAT GTCCGGGGCC GCGGACAGTG ACCGCGCCGG TGCCACCCAA ACCGATTCCC 
AAGGGCCGGT TCACCGCGGG GTTCCTCGCC CGCCTTCTCT ACGAGAAGTA TGTCCTGGGC 
CTGCCGTTGC ACCGGATCGC TCGGGCGCTG GCCGCCGCCG GGCTCGGTGT TGCCGAGGGC 
ACTCTGTGTG GGGCGTTGAA GGACGTGCAT GGACTGCTCG GCGGGCTCGA TGAGCAGATC 
GTGGCGCGTA ACGCCGCCGC CGGTCATGTC CACGCGGACG AGACGACGTG GCGGGTGTTC 
GAGCGGGTCG AGGGCAAGGA CGGGACCCGC TGGTGGCTGT GGGTGTTCGT CGCCGCCGAC 
ACGGTGGTGT TCCGGATGGA CCCGACCCGC TCGGCTGCCC CGGTCGAGAA GCACTTCGGG 
ATCGACCGGG CCGCCGGGGC GCTGTCCGAC GGATGTCGCC TCGTCGTCTC GTCGGACTTC 
TACACCGTCT ACCAGTCCCT GGGCCGCGTC GACGGAGTCG ACCCGCTCTG GTGCTGGGCA 
CACATCCGCC GGTACTTCAT CCGGGCCGGG GACGCCCACC CCCAACTGCG GTACTGGGCC 
GACCAGTGGG TCGCCCGGAT CGGGATGCTC TACCTCGCTC ACCGCGCCCT CGCCGCCGAG 
CAGCCCACAA CCGGCGGCTA CCGCGAGGCC GCCGGCGCGT TCGAGGCCGC GCTGAGGGCG 
ATCGACACGG CGCGGCGCGC GGAGGCGGCG ATCCACAGCC TGCACCCGGC GGCGAAGAAG 
GTCCTGGCGA CCCTGGACCG GGAATGGGAC GGGCTGGCCC GCCACCAGGA CTTCCCCGAC 
CTGGATCTTG ACAACAATGC TGCCGAGAGA GCGCTACGGA CCCCGGTCGT CGGGCGGAAG 
AACTACTACG GCGCACACGC TGAGTGGGCC GCGCACCTCG CCGCCCGGGT CTGGACCATC 
GTCGCCACCG CGGAGCGTAA CGGCCGTGAA CCCCTCGCGT TCCTGACCGG CTACCTGAAC 
GCCTGCGCCA CAGCCGGCGG GAAAGCACCC GCCGGCCCCG CCCTCGAACC CTTCCTCACC 
TGGCAGACCA CCACCCAGAC CGGCAGCCCT CCCAGCACCG ACCCACCCCA GGACGGCCCA 
CCCGACGGGC CCGAGCCCTA A

Protein sequence

MSVLSVTDDV TEVAYWRGRA ERAEECAEKA EARVGQLQLR VEELSEQVAV LSRMLFGRSS 
EKTGPSSAVD EKPEDRQDSG GGDAGRPARQ RGQRPGSRGH GRRDYSHLQT REEIHDVPEV 
DRACPGCGVA FTPLGTDDSE QVDWQVVITR IVHRRRRYRR CCTCPGPRTV TAPVPPKPIP 
KGRFTAGFLA RLLYEKYVLG LPLHRIARAL AAAGLGVAEG TLCGALKDVH GLLGGLDEQI 
VARNAAAGHV HADETTWRVF ERVEGKDGTR WWLWVFVAAD TVVFRMDPTR SAAPVEKHFG 
IDRAAGALSD GCRLVVSSDF YTVYQSLGRV DGVDPLWCWA HIRRYFIRAG DAHPQLRYWA 
DQWVARIGML YLAHRALAAE QPTTGGYREA AGAFEAALRA IDTARRAEAA IHSLHPAAKK 
VLATLDREWD GLARHQDFPD LDLDNNAAER ALRTPVVGRK NYYGAHAEWA AHLAARVWTI 
VATAERNGRE PLAFLTGYLN ACATAGGKAP AGPALEPFLT WQTTTQTGSP PSTDPPQDGP 
PDGPEP