Gene Franean1_1983 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1983
Symbol
ID	5670384
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2382270
End bp	2383565
Gene Length	1296 bp
Protein Length	431 aa
Translation table	11
GC content	71%
IMG OID	641240904
Product	hypothetical protein
Protein accession	YP_001506326
Protein GI	158313818
COG category	[C] Energy production and conversion [H] Coenzyme transport and metabolism
COG ID	[COG0654] 2-polyprenyl-6-methoxyphenol hydroxylase and related FAD-dependent oxidoreductases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.564684
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATGCCTG ACGCCGCAGG CCCCGCGTTC GACGTGTGTG TGGTGGGCGC AGGCCCGGCC 
GGGATGATGC TCGGCCTGTT GCTCGCCCGC GACGGCCTCG AGACCTGCGT GTTGGAGAAG 
CACGCCGACT TCCTGCGCGA CTTCCGCGGG GACACCGTGC ACCCGTCCAC GCTCGATCTG 
CTGGATTCGA TCGGCCTTGG CGAACGCGTG CGCGACCTGC CCGGACGCCA GGTCACCGGG 
CTGAGATTCA GCTTCGTGGA CGGGACCTAC CAGGTCGCCG ACTTCTCCCG GCTGCGGGTG 
AGTCATCCCT ACATTTACTT CGTCCCGCAG TGGGACCTGC TGGAGATGCT CGCGCAGGCC 
GGCGCCGGCA TTCCGACCTT CACGCTGCTG CGTGAGCACG AGGTGACCGG CCTTGTCCGG 
GATGGCGATC GGGTGGTGGG CGCCGAGGCT CGGACCGCCC AGGGCCGCCG GGTGGTGCGG 
GCGCGTCTCA CGGTCGGTGC CGACGGCCGT GGATCTGTCG TCCGCGCGTC GCTTGGCCTG 
CCACTGCGAC GTTTCGGCGC TCCGATGGAT GTGTTGTGGT TCCGGCTCCC CCGCCGGGCG 
AGTGACGGGG ATGGCCTCGG CGGCCTGGTC GGCCCGGGAC GGATGCTCAT CCGCATCGAT 
CGGGGCAGCT ACTGGCAGAC CGCCTATCTG ATCCGCAAGG GTGGATACGA CGCCGTGCAC 
GCGGCGGGAC TCGACTGCCT CCGCGACAAC GTCGCGACGC TCGCTCCGGA CCTCGCCGAC 
CGGGTCGATG AGATCAGAAG CTGGGAGGAC GTCCACCTGC TGAGGGTGCA GGTCGACCGG 
GTGCGGCGCT GGCACGCTCC CGGCGCACTG CTCATAGGGG ACGCCGCTCA CGCGATGTCG 
CCGATCGGCG GGGTCGGGAT CAATCTGGCG ATCCAGGACG CGGTCGCCGC GGCACGTATC 
CTCCGTGCGC CCCTGCTCGC CGGCCGGGGC ACCGGAACCG CACCACCGCC CGGGCGTCTG 
GCCGCGGTAC AGCGTCGCCG CACGCCACCT ACCATCCTCA CCCAGCTTGC GCAGCGGGTC 
GCCCAACGAG GATTGCTGCG CCCGGTGCTG GAGGCCGGCG ACAAGCCGGT CACGGCGCCC 
ATGCCGGTCC GGCTCCTCGC CCGGATACCG GCCGCCCAGC GCGTGCTCGC CCGTGCGGTC 
GGCGTCGGGC TCCGGCCCGA GGCGGTCGGA CAGGCCGCAC CACACACCGC GACGGAGAAC 
GTTTCCCGTG CAGCCACCAA CGAGAATGAT CGTTAG

Protein sequence

MMPDAAGPAF DVCVVGAGPA GMMLGLLLAR DGLETCVLEK HADFLRDFRG DTVHPSTLDL 
LDSIGLGERV RDLPGRQVTG LRFSFVDGTY QVADFSRLRV SHPYIYFVPQ WDLLEMLAQA 
GAGIPTFTLL REHEVTGLVR DGDRVVGAEA RTAQGRRVVR ARLTVGADGR GSVVRASLGL 
PLRRFGAPMD VLWFRLPRRA SDGDGLGGLV GPGRMLIRID RGSYWQTAYL IRKGGYDAVH 
AAGLDCLRDN VATLAPDLAD RVDEIRSWED VHLLRVQVDR VRRWHAPGAL LIGDAAHAMS 
PIGGVGINLA IQDAVAAARI LRAPLLAGRG TGTAPPPGRL AAVQRRRTPP TILTQLAQRV 
AQRGLLRPVL EAGDKPVTAP MPVRLLARIP AAQRVLARAV GVGLRPEAVG QAAPHTATEN 
VSRAATNEND R