Gene Franean1_3065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3065
Symbol
ID	5671444
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3619848
End bp	3621182
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	68%
IMG OID	641241963
Product	transposase
Protein accession	YP_001507383
Protein GI	158314875
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCGATCA TGGGGGATGT TCTGGACCAG CTGTCTCGTC GGTTCGCGGT GGTGCTGCCG 
CACCTCGACG AGCGGCAGCG GCGACTGGTG CTGGCAACCG AAGCCCGGCT GCTGGGGCAT 
GGCGGTATCC GCGCGGTGGC CCGAGTCGCC GGTGTCAGCG AGACCACGGT CCGCGTCGGC 
GTGTTCGAGC TCGAAGCGGG CGGGGAACCC CTGCCCGATC GACGAGTCCG CCGGCCAGGT 
GGGGGCCGTA AACGCATCGA GGACACCGAC CCGGCCGTGG TGACAGCGCT CCTCGCACTC 
GTCGAGCCGG ACGAGCGAGG TGATCCGACC TCACCGCTGC GGTGGACCAC GAAGTCGCTA 
CGACACCTCG CCGAACAGCT CACCCGCCAA GGGCACCCGG TATCGCCGTC GACAGTCCGC 
CGGCTCTTGC AGGCGGCTGG TTTCAGCCTG CAGGCGAACT CCAAAACCCT GGAAGGAAAG 
CAGCACCCCG ACCGGGACGC CCAGTTCCGC TACCTGAACA ACCAGGTCAT GGAACATCAG 
AAAGTCGGCG AGCCGGTCAT CAGCGTGGAC GCGAAAAAGA AGGAGATGCT CGGCCAGCTC 
CCGAACCCGG GCCGTGAATG GCGACCGAAA GGCGACCCTG TCCAGGTCGA GGATCACAGC 
TTCTTCACCG GCCCGCAGGG CGACACCGCC ATCCCCTACG GCGTCTACGA CCTGACCACC 
GACGCCGGCT GGGTCAACGT CGGGGTCGAC CACGACACCT CAGCGTTCGC GGTGGCCTCG 
ATCCGCCGCT GGTGGCAGGC CCGCGGCCAG GCCGACTACC CCCAGGCCAC CCGGCTGCTG 
GTCACCGCGG ACGCGGGCGG GTCGAATAGC TACCGCTTTC GAGCTTGGAA AGCCGAACTC 
GCCGCGCTCG CCGCCGACAC CGGCCTGACG ATCACCGTGT GTCATTTTCC GCCCGGCACG 
TCGAAATGGA GTCGCGGTAG GGACCGCCCT TGCGGGCGGC CCCCCGCACA GATCCCAGCG 
TGCGGGACTA CCGCACTGGG CTCCTGCCTC AGGTTCTGGC TGCGAAGCGT CTCTCCGGGA 
AGGGATGCAT CACTCGGACT GGGGGTAGCC ATCGAGCCGC GATCCGCCCC ATCCGTTGCC 
AGTTCATCCG GTCACGTTGG CTGCGGCGCC GCAGCGCCTT GCACCAGTGC CGTGTCACCT 
GGGTACGGAA GGCCGACATC GTGTCGGTGT TGCCGGGCAC GGCGTAGTAG GCCATATGCC 
CACGTAGCAC GCTCGCCAAC CAGCGTCCCT GATCCGGGAT GGGCGTATGC CGGCGACGCT 
TCAGCTGCTC ATTGA

Protein sequence

MAIMGDVLDQ LSRRFAVVLP HLDERQRRLV LATEARLLGH GGIRAVARVA GVSETTVRVG 
VFELEAGGEP LPDRRVRRPG GGRKRIEDTD PAVVTALLAL VEPDERGDPT SPLRWTTKSL 
RHLAEQLTRQ GHPVSPSTVR RLLQAAGFSL QANSKTLEGK QHPDRDAQFR YLNNQVMEHQ 
KVGEPVISVD AKKKEMLGQL PNPGREWRPK GDPVQVEDHS FFTGPQGDTA IPYGVYDLTT 
DAGWVNVGVD HDTSAFAVAS IRRWWQARGQ ADYPQATRLL VTADAGGSNS YRFRAWKAEL 
AALAADTGLT ITVCHFPPGT SKWSRGRDRP CGRPPAQIPA CGTTALGSCL RFWLRSVSPG 
RDASLGLGVA IEPRSAPSVA SSSGHVGCGA AAPCTSAVSP GYGRPTSCRC CRARRSRPYA 
HVARSPTSVP DPGWAYAGDA SAAH