Gene Franean1_3143 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3143
Symbol
ID	5671520
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3698724
End bp	3699980
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	70%
IMG OID	641242038
Product	transposase IS4 family protein
Protein accession	YP_001507458
Protein GI	158314950
COG category	[L] Replication, recombination and repair
COG ID	[COG5659] FOG: Transposase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

TTGGCCGCCG CGTGCACGTA CTACATTTCC AGATCTTGGA ACTTTGTCGG GTGGCTGATC 
GTCGGGCCTG GCATGGTTGG GGTCGTGGCA GCGGAGGATG TCGTCGGGTG GGAGCGGGAG 
CTCGCGGCGT TGACGGACGG GCTGGGTGGG TTGTTCAACC GGCCTGAGCC CAGGCGTGTG 
TTCGGTGACT TCGTGCGGGC GCTGCTGGCG GACGTACCGA AGAAGAACTC GTGGGGGCTG 
GCCGAGCATG CGGGTTATGC AACGCCGCGG CCGTTCGAGC ATCTGCTCGA CGGGGCTGTG 
TGGGACGCCG ATCTGCTGCG CGACGCGGTG CGGGAGTTCG TGGTCGACCG GCTCGGGTCG 
CCGGTGGGTG TGCTGGTCGT CGATGACACG CAGGCGTTGA AGAAAGGTGA CAAGTCGGTG 
GGGGTGGCTC CTCAGTACTA CGGGCTGACC GGGGACGTCG CGAACGTGCA GACCATGGTC 
ATGTGTACCT ATGCCTCGCC GGCCGGGCAC GCGTTCGTGG ACCGGGAGTT GTACCTGCCC 
GAGGTGTGGA CCAGCGACCC GGCCCGCTGC CGGGCGGCCG GCGTGCCCAC CGACCGACAG 
TTCGCCACGA AACCCCAGCT CGCGGTGGCG ATGCTGACCC GGGCGGTCGA CGCCGGGGTG 
CCGTTTCGCT GGGTCGTCGC CGACAGCGGC TACGGCAAGG ACGCCCGGCT GCGGGGGTTC 
TGCCACGACC GGGGGCTGTC CTACGTGCTG GCCGTCCCGA AGAACCTCGC CCTCCTCGAC 
GCCCGGGGCC GGCCGACCCG CCCGGACCGG TTACACGCCC GGCTGCCCGT GGGAGTGTTC 
GAGCGCCGTT CGTGCGGTGC CGGGTCGAAA GGCGCCCGCT GGTATGACTG GGCCGCCCAC 
GCGGTCACCG TCGCCGGAGA GGACCCGGCC AGCGGGCACG CTCACACCCT GCTGGTGCGT 
AAGTCCACCA CCCCGCGTAC TCGTGACGGC AAGACCTTCT ACGACGTCGA GTACTTCCTC 
GCCCACGCCC CGACCGCGAC CGGCGTCCCC GACCTGGTCG CCGCCGCCGG GACGAGGTGG 
ACCATCGAGG AAAACAACGG CCAGGGCAAG GACGTCCTCG GTCTCGACCA GTACCAGGTC 
CGGAAATGGA CCCCCTGGCA CCGACACGTC ACCCTCAGCA TGCTCGCCCA GGCGTTCCTC 
GCCGCGACCC GCGCCAACCC GGGAAAAGAC CCCCGCATCC AGGAGGCCAC CAGCTAA

Protein sequence

MAAACTYYIS RSWNFVGWLI VGPGMVGVVA AEDVVGWERE LAALTDGLGG LFNRPEPRRV 
FGDFVRALLA DVPKKNSWGL AEHAGYATPR PFEHLLDGAV WDADLLRDAV REFVVDRLGS 
PVGVLVVDDT QALKKGDKSV GVAPQYYGLT GDVANVQTMV MCTYASPAGH AFVDRELYLP 
EVWTSDPARC RAAGVPTDRQ FATKPQLAVA MLTRAVDAGV PFRWVVADSG YGKDARLRGF 
CHDRGLSYVL AVPKNLALLD ARGRPTRPDR LHARLPVGVF ERRSCGAGSK GARWYDWAAH 
AVTVAGEDPA SGHAHTLLVR KSTTPRTRDG KTFYDVEYFL AHAPTATGVP DLVAAAGTRW 
TIEENNGQGK DVLGLDQYQV RKWTPWHRHV TLSMLAQAFL AATRANPGKD PRIQEATS