Gene Francci3_1107 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_1107
Symbol
ID	3905778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	1321240
End bp	1322889
Gene Length	1650 bp
Protein Length	549 aa
Translation table	11
GC content	71%
IMG OID	637878439
Product	transposase
Protein accession	YP_480216
Protein GI	86739816
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.373309
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.299253
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAGCGGA TCAACGAGGT GGTGCTCGCG GAGAAGTTCG CGGTGCTGTT GCCGCATCTG 
GATGAGCGGC AGCGCCGGCT GGTGCTGGGT GCGGACGCGC GGGCGTTCGG GCATGGCGGG 
ATCCGTCTGG TGGCCCGGGC GGCCGGGGTA TCGGTGGACA CGGTCTCGCG TGGTGTCGCC 
GAGCTGGGGG CGGGCGCAGC CTCGACGGGC CGGGTGCGCG CGCCGGGTGG GGGTCGTAAG 
GCGTTGCGGG AGAAGGATCC GGAGCTGGTG GCGGCGCTGC TGGCGCTGGT CGAGCCCGAC 
CAGCGGGGGG CTCCGGAGTC GCCGTTGCGG TGGACGGTGA AGTCCACCCG CCGGCTCGCC 
GAGCAGCTCA CCGCACGTGG GCATCCGGTC GGCGCGGATA CGGTCGGTGG GCTGCTGCGG 
GCGGAGGGGT TCAGCCTGCA GGGCACCTCA CGCACGACCG AGGGCGCACG TCACCCTGAC 
CGGGACGACC AGTTTCGCTA TATCAACGAA CGGGTCAAGG AGTTCACCGC GGGCGGGCAG 
CCGGTCGTCA GTGTGGACAC GAAGAAAAAG GAAGTCCTCG GTGACTACGC CGTCGCCGGA 
CGGGAGTGGC ACCGTAAGGG GCAGCCGGTG CGGGTCCGCG CCCATGACTT TCCCGAGAAG 
GGCGCGCAGA AGGCAGTGCC CTACGGGGTC TACGATCTGG CCGCCGACAC CGGCTGGGTG 
TCGGTCGGCT GCGACGGGGA CACCGCCGCG TTCGCGGTCG CGACCCTGCG TCGCTGGTGG 
GACGGGGAAG GCCGTCACCG CTACCCGACC GCGACCCGGC TGCTGATCAC CGCGGACGTC 
GGCGGGGCCA ACGGCTACCG GGTACGTGCC TGGAAGAAGG AACTCGCCGA CCTCGCCCGC 
ACGACCGGCC TGCAGATCAC CGTGTGCCAC TTCCCGCCGG GCACGTCGAA ATGGAACAAG 
ATCGAGCACC GGTTGTTCTC CCGGATCAGT ACGAACTGGC GTGGCCGGCC GTTGACCAGC 
CACGAGGTCG TGGTCAACAC GATCGGCGCG ACGACGACTC GCACCGGGCT GAGCGTCCAC 
GCCGAACTCG ACCCCGGCTC CTACCCGACC GGGCTGACCG TGCCCGACGA GGTCATGGAC 
GCCCTACCAC TGACCGCCCA CGACTGGCAC GGCCCGTGGA ACTACACCCT CGCCCCGGCG 
CCACCCCGCG CCGTCTCGAC GCCGGCGTCC CGGTACGTCG AGACCGGCCA GCCCGACGAC 
CGGGCCCCGG ACTGGCTACA CCATCCGACG ATCACCGGGA TGAACGGCGG CGAGTACGCC 
ACCCTGCTCG CCTCCGTCGA GCAGTACATC CTCGACCACC CGCCCATCAG CCTGCACCCC 
AAGCGCGCCC GTCACCGGGT CCTGCGACGC GGGCCCCTGT CGCTGTCCGA CCGGCTGCTG 
GTCACCGTGA TCCACCACCG GTGGACCACC CAGCAGCAGG CCCTCACCCG TCTGCTGGGC 
TCACCCCGCG GAGCCGTCGG CGACGCGATC CACGAGATGA CCCCAGTCCT GGACGGCCTC 
GACCGGCGGA TCCAACCCGC GCCGATCACC GCGCCCACCG TCCAGGACCT CACCACCCTG 
ATCCACAACA TCAAGAACGG ACCTTATTAA

Protein sequence

MERINEVVLA EKFAVLLPHL DERQRRLVLG ADARAFGHGG IRLVARAAGV SVDTVSRGVA 
ELGAGAASTG RVRAPGGGRK ALREKDPELV AALLALVEPD QRGAPESPLR WTVKSTRRLA 
EQLTARGHPV GADTVGGLLR AEGFSLQGTS RTTEGARHPD RDDQFRYINE RVKEFTAGGQ 
PVVSVDTKKK EVLGDYAVAG REWHRKGQPV RVRAHDFPEK GAQKAVPYGV YDLAADTGWV 
SVGCDGDTAA FAVATLRRWW DGEGRHRYPT ATRLLITADV GGANGYRVRA WKKELADLAR 
TTGLQITVCH FPPGTSKWNK IEHRLFSRIS TNWRGRPLTS HEVVVNTIGA TTTRTGLSVH 
AELDPGSYPT GLTVPDEVMD ALPLTAHDWH GPWNYTLAPA PPRAVSTPAS RYVETGQPDD 
RAPDWLHHPT ITGMNGGEYA TLLASVEQYI LDHPPISLHP KRARHRVLRR GPLSLSDRLL 
VTVIHHRWTT QQQALTRLLG SPRGAVGDAI HEMTPVLDGL DRRIQPAPIT APTVQDLTTL 
IHNIKNGPY