Gene Franean1_1889 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1889
Symbol
ID	5670291
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	2267030
End bp	2268307
Gene Length	1278 bp
Protein Length	425 aa
Translation table	11
GC content	72%
IMG OID	641240811
Product	transposase IS4 family protein
Protein accession	YP_001506233
Protein GI	158313725
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.847623
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGGCGT GGCCTCGGTG CCGCTGGGTG GTTTGGTCAC GGTTCGTGGC TTCGATGGTG 
ACCCCGGACC AGGTGTCGGT CGGGGTGCTG GTGACGGCGG TGCCGCGTGA CGCGGTCGAC 
GAGGCCGTCG CGGCCTGTGG GGTGGGTGCG CGGCGGGCGG GCGGGAAGCT CCCACCGCAT 
GTGACGGCGT ACCTGACGTT GGCGATGTCC CTGTTTCCGG ACGACGACTA CGCCGAGGTC 
GCCCAGAAGG TGACCGGGTC GCTGGACCGG TTCGGCTGCT GGGACGCGGC GTGGGCGCCG 
CCGAGCGCGA GCGGGATCAC CCAGGCGCGT AAGCGGCTGG GCCGGATGGT GATGGCCGAG 
GTGTTCGAGC GGGTCGCGGG CCAGGTCGCG ACACTGTCGA CGCGTGGCGC GTGGCTGCGG 
GGCCGGTTGT TGCTCGCGAT CGACGGGTTT GACGTCGACG TGCCCGACAC CGAGGAGAAC 
GCGGCCGAGT TCGGCTACGC CGGCACCGGG GAGAAGCGGT CGGCGTTCCC GAAGATCCGG 
GTCGTCGCGT TGGCGGAGTG CGGGACGCAC GCGTTCCGGG CCGCCGAGGT CGGTGGCTGG 
GCGGCTGGGG AGAGGACGCT GGCCCGCGGG CTGCTGATGC GGCTGAACCG CGACGAGGTG 
CTGACCGCCG ACCGTGGGTT CTACTCGTTC GACAACTGGG CGCTGGCCGC GGGCACCGGC 
GCCGACCTGA TCTGGCGGGC CCCGACCGGG CTGAACCTGC CGGTCGTGCG GGTCCTGTCC 
GATGGCACGT TCCTCACCGT CCTGATCAAC CCGGAGATCA CGGGAGGTCG GCGCCGCGAG 
CGGCTGCTCG CCGCCGCGAA GGCCGGCGAC GAGCTTGATC CGGACGAGGC GCACCTGGCC 
CGGGTCGTCG AGTACGACAT CCCCGACCGG GCCGGTAACG GTACCGGCGA ACTGGTCGTC 
GTGCTGACCA CGATCCTCGA CCCGCGTCAG GCCCGTGCCG ACGAGGTCGC CGCCGGATAC 
AACGAGCGCT GGGAGGAGGA AACCGCGAAC GACCAGCTCA AGACCCATCT ACGCGGCCCC 
GGGAGAGTCC TGCGCTCCCG GCTGCCGGAC CTGGCGGTCC AGGAGATGTG GGCCTGGCTG 
ATCGTCCAGT ACGCGCTCAC CGCCCTGATC GCCGGCGCCG CGGAGGCCGC CGAGATCGAC 
CCCGACCGGG TCGGTTTCGC CCGGACACTG CGCCTGGTCC GCCGTTCCGC CACCGGAACG 
GCGGACATTT CCCCCTGA

Protein sequence

MAAWPRCRWV VWSRFVASMV TPDQVSVGVL VTAVPRDAVD EAVAACGVGA RRAGGKLPPH 
VTAYLTLAMS LFPDDDYAEV AQKVTGSLDR FGCWDAAWAP PSASGITQAR KRLGRMVMAE 
VFERVAGQVA TLSTRGAWLR GRLLLAIDGF DVDVPDTEEN AAEFGYAGTG EKRSAFPKIR 
VVALAECGTH AFRAAEVGGW AAGERTLARG LLMRLNRDEV LTADRGFYSF DNWALAAGTG 
ADLIWRAPTG LNLPVVRVLS DGTFLTVLIN PEITGGRRRE RLLAAAKAGD ELDPDEAHLA 
RVVEYDIPDR AGNGTGELVV VLTTILDPRQ ARADEVAAGY NERWEEETAN DQLKTHLRGP 
GRVLRSRLPD LAVQEMWAWL IVQYALTALI AGAAEAAEID PDRVGFARTL RLVRRSATGT 
ADISP