Gene Franean1_0116 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0116
Symbol
ID	5668541
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	137538
End bp	138677
Gene Length	1140 bp
Protein Length	379 aa
Translation table	11
GC content	71%
IMG OID	641239044
Product	aminoglycoside phosphotransferase
Protein accession	YP_001504489
Protein GI	158311981
COG category	[R] General function prediction only
COG ID	[COG3173] Predicted aminoglycoside phosphotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGCGACG AGGACGCGTT CGACGTACCC GCGGTGGACG GCTGGCTTCG GCGCCGGCTG 
CAGGAGCGGG CCGCGGTCGG CGCGGCCGAG ATGGGGGTCG CGACCGGCGC GGGGGTGCTG 
ACCGAGCGCC CGCCGGTCGC CCGTTCCATC CCGCCGCCGG GCCGCCCGCA GGTCCGGCAG 
TTCTCCGGCG GCGCGTCCAA TCTGACCTAT CTCCTGCGCT ACGAGGACCG CGACCTCGTC 
CTGCGGCGGC CGCCGCACGG GCGGAAGGCG TCCGGCGCCC ACGACATGGC GCGGGAGTAT 
CGGGTGCAGG CCCGGCTGCG CCCGGCGTTC CGGTACGTCC CGCGGATGGT CGCCTTCTGC 
GACGACCCCA CGGTGATCGG CTCGGAGTTC TACATCATGG AGCGGGTGCC CGGCGTCATC 
CCGCGCTCGG AGTTCCCGCG CTCACTCACC TTCGATCCGG AGCGGACGCG CCGGCTGGCC 
TTCCAGGTCG TGGATCTCCT GGTCGCCCTG CACGACATTG ACCCGGTCGC CTACGGGCTG 
TCCGACCTGG GGCGCGGTGC CGGGTATGTC GATCGGCAGC TCACCGGCTG GGCCCGGCGC 
TACCGGGACG CCCGCACGCC GAACGTGCCC TCCTTCGAGG TCGTCATGCG CTGGCTCACC 
GAGTACGCCC CCGAGGACGT CGCCACCTGC GTCATCCACA ACGACTTTCG CATCGACAAC 
GTGGTCTTCG ATGTGGCCCG CATCGGTGAC GACGGCCTGC CCAGGATCAG TGGTGTCCTC 
GACTGGGAGA TGGCCACCCT CGGCGATCCG CTCATGGACC TCGGGGGTGC CCTCGCCTAC 
TGGGTGCAGG CTGACGACGA CGCCCTCTTC CGGCTCACCC GGCGCCAGCC GACCCACAGC 
CCCGGCATGC CCACCCGGGC GGAGATCGTC GAGTACTACG CGGCACGGCG CGGACTGGAC 
GTCGGCAGAT GGCCCTTCTA CCAGGTGTTC GGGCTGTTCC GGCTGGCTGT CATCGCGCAG 
CAGATCTACT TCCGCTACCA CCACGGCCAG ACGACCAACC CGGCGTTCCG CGAGTACTGG 
CAGGTCGTCA CACACCTCGA GAAGCGGTGC CTGCGCGTGA TGGCGGCGGC CGGCCTCTAG

Protein sequence

MRDEDAFDVP AVDGWLRRRL QERAAVGAAE MGVATGAGVL TERPPVARSI PPPGRPQVRQ 
FSGGASNLTY LLRYEDRDLV LRRPPHGRKA SGAHDMAREY RVQARLRPAF RYVPRMVAFC 
DDPTVIGSEF YIMERVPGVI PRSEFPRSLT FDPERTRRLA FQVVDLLVAL HDIDPVAYGL 
SDLGRGAGYV DRQLTGWARR YRDARTPNVP SFEVVMRWLT EYAPEDVATC VIHNDFRIDN 
VVFDVARIGD DGLPRISGVL DWEMATLGDP LMDLGGALAY WVQADDDALF RLTRRQPTHS 
PGMPTRAEIV EYYAARRGLD VGRWPFYQVF GLFRLAVIAQ QIYFRYHHGQ TTNPAFREYW 
QVVTHLEKRC LRVMAAAGL