Gene Franean1_4129 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4129
Symbol
ID	5672487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	4912028
End bp	4913047
Gene Length	1020 bp
Protein Length	339 aa
Translation table	11
GC content	70%
IMG OID	641243005
Product	aminoglycoside phosphotransferase
Protein accession	YP_001508422
Protein GI	158315914
COG category	[R] General function prediction only
COG ID	[COG3173] Predicted aminoglycoside phosphotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.753306
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.346085
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCGAGT CCGACCGGAA GATGCACGCC AGCGAGGTCG TCATCGACAC CTCGCTGGTG 
GGCCGGTTGA TCGCCGCGCA GTTCCCCGAG TGGGCGGGCC TTCCCCTCGA ACCGGTCCGC 
TCCGCAGGCG CTGACAACGC GATCTACCGC CTCGGCGTGG ACCTGGCAGT ACGGCTACCC 
CGCATCCCCG CAGCGGCCGG GCAGGTGGAC AAGGAGCACC GGTGGCTGCC GCAGCTCGCG 
CCCCTACTGC CATTGGACAT CCCGGTCCCG CTCGGGACGG GCACACCCGG CGAGGGCTAC 
CCGTGGCCCT GGTCGGTCCA CCTGTGGCTG GAGGGCGAGG ACCTGCTCGC CGAACCTGTC 
ATTGACCTAC ACCGCATGGC CATCGAACTG GGAAACTTCG TCGCAGCCCT GCAACAGGTC 
GACCCCACGG GGGGACCACC TCCCGGGGCA CACAACTTCT TCCGTGGCGC CCCGCTCGCC 
CGGCGGGACG CGGCGACCCG GGCCGCCATC CACTCCCTGC GGGCCACCCT CGACACCGCA 
GCGGCGACCG CGGCGTGGGA CACGGCCATG CACGCGCCCC GCTGGCAGGG AACGCTGGTA 
TGGATCCACG GCGACCTTCT CCCCGGGAAT CTGCTCACCC GGGGCGGCCG GCTGCATGCC 
GTCATCGACT TCGGCGGCCT GGGCATGGGA GATCCGGCCT GCGACGTGAT GGCCGCCTGG 
ACGCTGCTGT CCACCGAAAG CCGCGAGGCG TTCCGGAGCA CGATCGGAGC CGATGACGCG 
ACCTGGGCAC GGGCCCGTGG CTGGGCGCTG TCCTTCGGAC TCATCGCCCT GCCCTACTAC 
CAGGACAGCA ACCCCACACT CGCCCACATC GCCCGGCGCA CCATCGACGA GGCCATCACC 
GATCCATCCC GGCCGCCGCC CACCGGCACC GCGCCGACGC CGGCGAAACC TGGACCCACT 
ACGCCCCGGG CGAGCACAGT CGATGACCAG GAACTTCCTC GCTACTGTCA CATCACATGA

Protein sequence

MSESDRKMHA SEVVIDTSLV GRLIAAQFPE WAGLPLEPVR SAGADNAIYR LGVDLAVRLP 
RIPAAAGQVD KEHRWLPQLA PLLPLDIPVP LGTGTPGEGY PWPWSVHLWL EGEDLLAEPV 
IDLHRMAIEL GNFVAALQQV DPTGGPPPGA HNFFRGAPLA RRDAATRAAI HSLRATLDTA 
AATAAWDTAM HAPRWQGTLV WIHGDLLPGN LLTRGGRLHA VIDFGGLGMG DPACDVMAAW 
TLLSTESREA FRSTIGADDA TWARARGWAL SFGLIALPYY QDSNPTLAHI ARRTIDEAIT 
DPSRPPPTGT APTPAKPGPT TPRASTVDDQ ELPRYCHIT