Gene Franean1_2220 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2220
Symbol
ID	5670619
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2655941
End bp	2657224
Gene Length	1284 bp
Protein Length	427 aa
Translation table	11
GC content	74%
IMG OID	641241140
Product	hydroxyglutarate oxidase
Protein accession	YP_001506561
Protein GI	158314053
COG category	[R] General function prediction only
COG ID	[COG0579] Predicted dehydrogenase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.531505
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0413594
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCGGAGC GGATCGCGGT CATCGGCGGC GGGATCCTCG GGCTCGCGGT GGCACGCAGG 
CTCGGGCAGG TCGTGCCCGG ATCGACGGTC ACCGTGTTCG AGAAGGAGCA TGACGTCGCC 
CAGCACCAGA CGGGGCGCAA CAGCGGCGTC GTCCACGCGG GCCTCTACTA CAAGCCGGGC 
TCGCTGAAGG CGACGCTGTG CCGCCGCGGC GTCGGCCTGC TGCGCGAGTA CTGCGAGGCC 
CGCGGCATCC GCTACGAGGA GTGCGGCAAG GTCGTCGTGG CCGTCGACGA CAGCGAGCTG 
GGCCGGCTCG ACGACATCGC GCAGCGGGCG ACGGCCAACG GCGTGCCCGA CACCCGCATG 
CTTGACGCCA CCGAGCTGCG CACGATCGAG CCGCACGCCC GCGGGGTCGC CGCGCTGCAC 
TCCCCGACCA CGGCGATCGT GGACTACCCG GCCGTCGCCC GGGCGCTGCG CGCGGACATC 
CTGGACGCGG GCGGCGCGGT GCGCACCGGC GCCGAGGTGA TCGGCGTGGA CGACGGCCCG 
GCGGGCGTCC GGCTGCGGCT GCGGGTACGC GGCTCCGCGC CGGTCGCGCC GAACGGGAAC 
CACCACACGG CGGCGGTCGA CGGCGGGACG GTCCGGGTGG TGTCGGAGTC GGTCGGCCCG 
TTCGACCGGC TGATCTCCTG CGCCGGCCTG CACTCCGACG AGGTCGCCGC GCTCACCGGA 
GAGGACAGCT CGCCGCGGAT CATCCCGTTC CGCGGCGACT ACTGGCTGCT GCGCCCCGAG 
CGGCGCAACC TCGTCCGTGG CCTGATCTAC CCGGTGCCCG ACCCGCGCTA CCCGTTCCTG 
GGCATCCACC TCACCAAGCG GGTGGACGGG GAGATCCTCG TCGGCCCCAA CGCCGTGCTC 
GCCACCGCCC GCGAGGGCTA CACGGTGGGC ACCGTCGACC GGGGTGACCT GCGGCAGACC 
CTGTCCTGGC CGGGCTTCCA GAAGATGGCT AAGACGCACT GGCGCACCGG CGCCAAGGAG 
ATACTGCGCA CCGCCAGCAG GCGCGCGTTC GTCGCCGAGG CCCGACGCTA CGTTCCCGAG 
CTGCGCACCG CGGACGTCGT GCGGGGCCCG GCGGGAGTGC GGGCCCAGGC CGTCGCGCGG 
GACGGCAGCC TGGTCGACGA CTTCGTCCTC GCCGTGCGCG GACGGGTCGT CCACGTGCGC 
AACGCCCCGT CCCCGGGTGC GACCGCGTCG CTGGCGATCG CGGAGCACAT CGTCGCCGAC 
GCGGTACCCG AACGCACGTC CTGA

Protein sequence

MAERIAVIGG GILGLAVARR LGQVVPGSTV TVFEKEHDVA QHQTGRNSGV VHAGLYYKPG 
SLKATLCRRG VGLLREYCEA RGIRYEECGK VVVAVDDSEL GRLDDIAQRA TANGVPDTRM 
LDATELRTIE PHARGVAALH SPTTAIVDYP AVARALRADI LDAGGAVRTG AEVIGVDDGP 
AGVRLRLRVR GSAPVAPNGN HHTAAVDGGT VRVVSESVGP FDRLISCAGL HSDEVAALTG 
EDSSPRIIPF RGDYWLLRPE RRNLVRGLIY PVPDPRYPFL GIHLTKRVDG EILVGPNAVL 
ATAREGYTVG TVDRGDLRQT LSWPGFQKMA KTHWRTGAKE ILRTASRRAF VAEARRYVPE 
LRTADVVRGP AGVRAQAVAR DGSLVDDFVL AVRGRVVHVR NAPSPGATAS LAIAEHIVAD 
AVPERTS