Gene Franean1_1514 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_1514
Symbol
ID	5669918
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	1817765
End bp	1818814
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	69%
IMG OID	641240434
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001505860
Protein GI	158313352
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	2
Fosmid unclonability p-value	0.0000791042
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGGCCCAG GGAAATGGGC CCGAGGAATG CGGAAGGGTG GTCATTTCAT GGTCGGCACA 
CACCTGGTCA TGGGAGCGAG CGGTTTCCTC GGTTCGCACG TCACACGGCA GCTCGCGGAG 
CGCGGCGACG ACGTCCGCGT GTGGATTCGC CGATCCAGCT CCACGCGGGC TTTCGACGAC 
TTACCGGTGC AACGTTGCTA TGGCGAGCTG GTCGACGACG CGGCGATCCG CGAGGCGATG 
CACGGCGTCG ACACCGTGTA CTACTGCATT GTCGACACCC GGGCCTGGCT GCGTGATCCG 
GCGCCGCTGT TCGCGACGAA CGTCGACGGC CTGCGGCACG CACTGGACGC GGCGCTCGAA 
GCCCAGGTGC GGCGCTTCGT GTTCTGCAGC ACCGTCGGCA CGATCGGCCT CTCGCCGGAC 
GGCCGCCCGG CCGACGAGAG CGTTCCGCAC ACCTGGGAGC ACCTGGGTGG GCCGTACATC 
CAGACGCGCG TCGCCGCCGA GAACCTCGTC CTGCGCTACT GCCGTGAGCA CGGGCTGCCG 
GGGATCGTCA TGTGCGTGTC GACGACCTAC GGAGCGCCCG ACCACGGCTC CCCGCACGGC 
CGCATGGTGT CCGACGCCGC GAAGGGCAGG CTGCCGTTCT ACTTCGGCAA TGCGGCGATG 
GAGGTCGTCG GCATCTCCGA CGCCGCCCGC GCGTTCCTGC TGGCCGCGGA GAAGGGCCGC 
GTCGGCGAGC GGTACATCAT CAGCGAGCGT TACATGACCT GGAAGGAACT GGTCACGACG 
GCGGCCGACG CCGGCGGCGC GAAGCCGCCG CGCGTGGGGA TCCCGCTCCC CGTGATGAAG 
GCCGTCGGTC GCCTCGGTGA CGTGGCGGGG CGCGTACTGC GCCGCGACGT CGTGATGAAC 
AGCGTCAGCA CCCGGCTCAT GCACTTCATG CCGCCGCTCG ACCACAGTAA AGCCACCCGG 
GAACTCGGCT GGGATCCGTC CCCGACACCG GATGCCGTCC GCGCGGCCGC GAAGTTCTAC 
CTCGAGCAAC AGCACCAGAC CGGCCGCTGA

Protein sequence

MGPGKWARGM RKGGHFMVGT HLVMGASGFL GSHVTRQLAE RGDDVRVWIR RSSSTRAFDD 
LPVQRCYGEL VDDAAIREAM HGVDTVYYCI VDTRAWLRDP APLFATNVDG LRHALDAALE 
AQVRRFVFCS TVGTIGLSPD GRPADESVPH TWEHLGGPYI QTRVAAENLV LRYCREHGLP 
GIVMCVSTTY GAPDHGSPHG RMVSDAAKGR LPFYFGNAAM EVVGISDAAR AFLLAAEKGR 
VGERYIISER YMTWKELVTT AADAGGAKPP RVGIPLPVMK AVGRLGDVAG RVLRRDVVMN 
SVSTRLMHFM PPLDHSKATR ELGWDPSPTP DAVRAAAKFY LEQQHQTGR