Gene Francci3_0114 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_0114
Symbol
ID	3903444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	140305
End bp	141600
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	67%
IMG OID	637877447
Product	phage integrase
Protein accession	YP_479237
Protein GI	86738837
COG category	[L] Replication, recombination and repair
COG ID	[COG0582] Integrase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.646267
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTCTAC CTCCGGCGTG TCGCCGGTAT CCGTCCAGGT CAGACCATGC ATCGGCCGAT 
GCCAAGAATG ATCAACTTGG CCTATCGACT ACGAAATGGC CCTGGGGCTC GATCTACCAG 
CGCGAGAGCG ACGGGATGTG GGTGGGGGCT GCCTACGTCC TCATGCCCGA CGGAACGCAG 
CGACGCCGGC CGGTATACGG GAAGACTGCC GACATCGTCC GCGAGAAGCT CACCAAGATG 
CAGGCCCAGT CGGACCAGGG CATCCCAGCC GAGGCAACCG GGTGGACCAT GGAGCGGTTC 
CTCACCTATT GGCTCAGCGA CATCGTGACG CCGGCTTGCA AACCGCGCAC GGTGCAGGGC 
TACGAGGTCA TCGTCCGGAA CTACCTGATC CCGGCGATCG GCAAGAAGCG GCTGAACAAG 
CTGAACGGCG TCGATGTGCG GAACCTGCTC AAGCGGGTGC GCGGCACCTG CCTGTGCTGC 
CTGCACGGCA CCGACCGCCG CCGCCCTGTG AAGCAGCGTC GCTGCTGCGC CGTTGGGCGC 
TGCTGCCACC AGGCGCCGTC CGCCCGGCTC GTGCAGCAGG TCCACAGCGT TCTGCGTAAC 
GTCCTCGGCG CCGCAGTACG CGAGGAACTG GTCGGCCGCA ATGTCGCGAA GCTCGCGAAG 
GTCTCCGGCC CGACCTACAA GGTGCACCGG GGGCTCAGCG CCGACCAGGC CAGCCACTTG 
CTCAAGGCCG CCGCGCACGA CCGGCTATAC GCGCTCTACG TCCTGGCCCT GTACCTGGGG 
CTGCGGCGAG GGGAGATCCT TGGCCTGCGC TGGGAGGACA TCGACTTCGA GGACGAGACC 
CTTGCCGTGC GGCACTCGTT GCAGCGGGTC GGTGGGCATC TGAGGGTGGT AGCGCCGAAG 
ACGCGGACCT CGGAGCGAAC CCTGCCGCTG CTGCCGCTGA TCGCGAAGGT CCTGCGCGAG 
CACCAGGCAC GGCAGGACGC GGAACGCGAG ACAGCCGATG TGAACTGGCG GGAGACTGGC 
TTCGTGTTCA CCACGGCGAT TGGTACGCCG ATCGAGCCGG ACAACCTTCG ACGTAGCTGG 
CTGCCGCTGT GCGGCGTACT CGGCTTGGAG GGCGTGCGCT TCCACGACAT CCGCCACACC 
TGCGTCACGC TGCTGCTGAA CGCGGGCGTG CCCCCGCACG TCGTCCGCGA GATCGCGGGG 
CACTCCGCGA TCGACGTTAC GATGGAGATC TATGCCCATG CCTCGCTGGA CGACAAGCGG 
GCGGCGCTCC AGAAGCTCGT CGACGAGCTG GCGTAG

Protein sequence

MRLPPACRRY PSRSDHASAD AKNDQLGLST TKWPWGSIYQ RESDGMWVGA AYVLMPDGTQ 
RRRPVYGKTA DIVREKLTKM QAQSDQGIPA EATGWTMERF LTYWLSDIVT PACKPRTVQG 
YEVIVRNYLI PAIGKKRLNK LNGVDVRNLL KRVRGTCLCC LHGTDRRRPV KQRRCCAVGR 
CCHQAPSARL VQQVHSVLRN VLGAAVREEL VGRNVAKLAK VSGPTYKVHR GLSADQASHL 
LKAAAHDRLY ALYVLALYLG LRRGEILGLR WEDIDFEDET LAVRHSLQRV GGHLRVVAPK 
TRTSERTLPL LPLIAKVLRE HQARQDAERE TADVNWRETG FVFTTAIGTP IEPDNLRRSW 
LPLCGVLGLE GVRFHDIRHT CVTLLLNAGV PPHVVREIAG HSAIDVTMEI YAHASLDDKR 
AALQKLVDEL A