Gene Francci3_1959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1959
Symbol
ID	3904321
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	2300823
End bp	2302085
Gene Length	1263 bp
Protein Length	420 aa
Translation table	11
GC content	69%
IMG OID	637879296
Product	transposase IS116/IS110/IS902
Protein accession	YP_481063
Protein GI	86740663
COG category	[L] Replication, recombination and repair
COG ID	[COG3547] Transposase and inactivated derivatives
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.945198
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGCGGC AGGTGGCGCG GTGCGCCGGT CTGGACGTGC ACAAGGACGA GATCGTCGCC 
TGTGCGCGGA TCTCCGATCC GGGTGGGCCT GGCCGGGTCG AGTTGCACAC GTTCGGGACG 
ACGACGCGTG AGCTGTTGGC GTTGCGGGAC TGGCTGACGG GGCTGGGCGT GACCCGGGTC 
GGGATGGAGT CGACCGGGGT TTTCTGGAAG GCGCCGTTCC ACATTCTGGA GGACGCGGTC 
GCCGAGTGCT GGCTGCTCAA TGCCCGGCAT CTGCGCAACG TGCCGGGCCG TAAGACGGAT 
GCGGCGGACG CGGCGTGGAT CGCGGAGCTG GTCGAGTACG GCCTGGTCCG CCCGTCGTTC 
GTGCCGCCCC AGCCGATCCG GGAACTACGT GACCTGACCC GGTATCGCCG CGCGCAGATC 
GACGAGCGGA CCCGGGAGGC GCAGCGCCTC GACAAGGTCC TCCAGGACGC GGGGATCAAG 
CTGTCGTCGG TCGCGTCGGA TGTGCTCGGG AAGTCCGGGC GGGCGATCCT CGACGCGCTG 
GTCGCGGGGA CCACCGACCC GGTCGTGCTC GCCGAGCTCG CCAAGGGCCA GCTCCGTAAG 
AAGATCCCGG CGCTGCAAGA GGCGCTGACC GCGTTCTTCA CCGGCCATCA CGCGATCATC 
ATCGGGGAGA TCCTGTCCAA GCTGGACTAC CTGGACGAGG CCATCGACCG GCTCTCGACC 
GAGATCGACC GGGTGATCGC CCCTTTCGCG GATGAGGTCG CCCTGCTGGA CACGATCCCC 
GGGGTCGACC GCCGCATGGC CGAATGCCTG ATCGCCGAGA TCGGCGTCGA CATGACCGTC 
TTCGGCTCCG CCGAACGGCT CGCCTCCTGG GCGGGCCGCT GCCCCGGCCA GCACGAGTCC 
GCCGGCAAGT CCAAAGGCGG CCGGACCCGC AAAGGGTCGA AATGGCTGCG GATCTACCTG 
CACGACGCCG CCCGCGCCGC CAGCCGCACC AAGAACAGCT ACCTCAACGC CCAATATCAC 
CGGATCAAAG CCCGCCGCGG CCCCGCCAAA GCCAGGGTCG CCGTCGAGCA CTCGATCCTC 
GTCGCCGCCT TCCACATGCT CGACCGAGGC GAGCCCTACC ACGACCTCGG CGCCGACTAC 
TTCACCCGAC GCCGCGACCC CAACCGCCAC GCCCAACGCC TGATCAGCCA GCTCGACGCC 
CTCGGCTACG ACGCGGTCAT CACCAGACGA ACCGACCAGC CCACCGACAC CAAGGCCGCG 
TGA

Protein sequence

MERQVARCAG LDVHKDEIVA CARISDPGGP GRVELHTFGT TTRELLALRD WLTGLGVTRV 
GMESTGVFWK APFHILEDAV AECWLLNARH LRNVPGRKTD AADAAWIAEL VEYGLVRPSF 
VPPQPIRELR DLTRYRRAQI DERTREAQRL DKVLQDAGIK LSSVASDVLG KSGRAILDAL 
VAGTTDPVVL AELAKGQLRK KIPALQEALT AFFTGHHAII IGEILSKLDY LDEAIDRLST 
EIDRVIAPFA DEVALLDTIP GVDRRMAECL IAEIGVDMTV FGSAERLASW AGRCPGQHES 
AGKSKGGRTR KGSKWLRIYL HDAARAASRT KNSYLNAQYH RIKARRGPAK ARVAVEHSIL 
VAAFHMLDRG EPYHDLGADY FTRRRDPNRH AQRLISQLDA LGYDAVITRR TDQPTDTKAA