Gene Francci3_2963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2963
Symbol
ID	3903778
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	3510249
End bp	3511448
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	70%
IMG OID	637880284
Product	putative transposase, IS891/IS1136/IS1341
Protein accession	YP_482050
Protein GI	86741650
COG category	[L] Replication, recombination and repair
COG ID	[COG0675] Transposase and inactivated derivatives
TIGRFAM ID	[TIGR01766] transposase, IS605 OrfB family, central region

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.268101
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.616422
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGAGACGGT CGTACAAGTT CCTGCTCCGC CCGACCGCGC ACCAGCAGAT CGCGTTGACG 
GCGATGCTCG ACGACCACCG GGCGCTGTAC AACGCCGCGC TTCAGGAGCG GCGCGATGCC 
TACCGGCATC CGAGCAAGAC GACGGTCCGC TACGGGGGCC AGTCGGCCCA GCTCAAGGAC 
ATTCGGGGGT TTGACGCGGA TCAGGCCCGC TGGTCGTTCT CCTCTCAGCA GGCCACCCTG 
CGTCGCCTCA ATCTCGCATT CGCCGCGTTC TTCCGCCGGG TCAAGGCGGG CGAGACGCCC 
GGCTACCCGC GGTTCAAGGG CGCCGGCTGG TTCGACACGG TGACGTGGCC CGCCAACGGT 
GACGGGTGCC TCTGGGACTC GCAGCCCGAG AACCCGAAGA CGATGTTCGT CCGCCTTCAG 
GGCGTCGGCC ACGTCAAGGT CCACCAGCAC CGGCCAGTGG CTGGCCGGGT CAAGACGCTG 
TCCGTCAGGC GGGAGGGTGC CCGCTGGTAC CTCGTGCTGT CCTGCGACGA CGTGCCCGCC 
GAGCCGCTGG AACCAACGGG CGCCGTCGTC GGCGTGGACT TGGGTGTCGC CTCGCTGGCC 
AGCACGTCGA ACGGCGAGCA CTACGGCAAC CCGCGTTTCC TCGAACGGGC CGCCGGGCGC 
CTCGCCAACG CGCAGCGCGA CCTTGCCCGT AAGAAGCGCG GCTCGAAGCG GCGCCGCAAG 
GCGGCTACTC GGGTCGCGAA CCAGTCCCGG GCCGTGGCCC GGCAGCGCGT CGACCTCGCG 
AACAAGACCG CGCGCGAACT GGTCGCCGAC CACGACCTGA TCGCTGTCGA GAAGCTGAAC 
GTCAAGGGCA TGGTCCGCCG GGCCAAGCCG AAGCCCGACC CGGACCAGCC GGGGGCGTTC 
CTGCCGAACG GGCAGGCCGC CAAGTCCGGG CTGAACAGGT CGATTCTCGA CGCCGGGTGG 
GGGGTGTTCC TCAACGCACT GCGTGCCAAG GCTGAAAGCG CCGGGCGGGT CGTCGTCGAG 
GTCAACCCCC GCCACACCTC CCAGCGATGC GCCGAATGTG GCCATGTCGC CCCGGAGAAC 
CGGCCCAGTC AGGCCACGTT CCGCTGTGTG GAGTGCGGCC ACGCCGCGCA CGCAGACGTG 
AACGCGGCGA TCAACATACT CGGGGCGGGG CTCGCCCTTC AGGTGGCGCA AGCTTCCTGA

Protein sequence

MRRSYKFLLR PTAHQQIALT AMLDDHRALY NAALQERRDA YRHPSKTTVR YGGQSAQLKD 
IRGFDADQAR WSFSSQQATL RRLNLAFAAF FRRVKAGETP GYPRFKGAGW FDTVTWPANG 
DGCLWDSQPE NPKTMFVRLQ GVGHVKVHQH RPVAGRVKTL SVRREGARWY LVLSCDDVPA 
EPLEPTGAVV GVDLGVASLA STSNGEHYGN PRFLERAAGR LANAQRDLAR KKRGSKRRRK 
AATRVANQSR AVARQRVDLA NKTARELVAD HDLIAVEKLN VKGMVRRAKP KPDPDQPGAF 
LPNGQAAKSG LNRSILDAGW GVFLNALRAK AESAGRVVVE VNPRHTSQRC AECGHVAPEN 
RPSQATFRCV ECGHAAHADV NAAINILGAG LALQVAQAS