Gene Franean1_6137 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6137
Symbol
ID	5674458
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	7466903
End bp	7467943
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	70%
IMG OID	641244989
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001510387
Protein GI	158317879
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.206898
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	13
Fosmid unclonability p-value	0.924748
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCCAC GTCGCGTGCT TGTGACAGGG GTGTCGCGTC CGCTGGGCGC CGAGGTCGCT 
GCCGCACTCG CCGCCGACCC CGAGATCGTC GATGTGGTCG GGGTCGACAC CATCGCCCCG 
ACGGCGGATC TCGGCCGGAC CCAGTTCGTC CGGGTGGACA TCCGAAACCC GCTGATCGCG 
AAGGTCATCT CCACCGCCGC CATCGACACC GTCCTGCATC TGAGTGTGCT CGCCACGCCG 
CTCGGCGCCG GCGGGCGCAC GGCGATGAAG GAGATCAACG TCATCGGGAC GATGCAGCTC 
CTCGCCGCCT GCCAGAAGAC CCCCGGGGTG AAGAAACTGG TGGTGAAGTC GACGACGTCG 
ATCTACGGCT CGTCGCCGCG CGACCCCGCG CTGTTCACCG AGGAGATGGA ACCGCGCGGC 
CTTCCCGGCG GCGGTTACGC CAAGGATGCC GTCGAGGTCG AGGGGTACGT CCGAGGCTTC 
GGCCGGAGGC GCCCCGACAT CGCGGTGACG GTGCTGCGCC TGGCGAACGT GCTCGGCCCG 
CGAGTGGACA GCCCGCTCGC GCGGTACCTC GACCTTCCGC TGGTCCCGAC GGTCCTCGGC 
TTCGACCCAC GGATTCAGCT GCTGCACTCC GACGACGCGA TGGCGGTACT CCTGAAGGCC 
ACCCGGGAGA CCCACGCCGG CACCTTCAAC GTGGCCGGGG ACGGCGTGCT CCTGCTCTCG 
CAGGCGATCC GGCGGGCCGG GCGGCCGGCG CTGCCAGTGC CCTTCCCCGC GATCGGGTCG 
TTGGGCAACA TCGCCCGCCG GCTGCGGCTC GTCGACTTCT CCTCCGAGCA GCTCGGGTTC 
CTCGCGCACG GGCGCGCGGT GGACACCACC AAGCTCAAAG AGGTGTTCGG ATACGTTCCT 
CAGTACACGA CCGTCGCGAC GTTCGACAGT TTCGTTCAGG ACCGCGGACT GCGGTTCACC 
ATCGACCACG AGCTGGTCTC GCGGGTGGAG CACGGCCTTC AGGGCGCGCT CGCCCGACGC 
CGGCTGCTCG GCACGTCCTG A

Protein sequence

MRPRRVLVTG VSRPLGAEVA AALAADPEIV DVVGVDTIAP TADLGRTQFV RVDIRNPLIA 
KVISTAAIDT VLHLSVLATP LGAGGRTAMK EINVIGTMQL LAACQKTPGV KKLVVKSTTS 
IYGSSPRDPA LFTEEMEPRG LPGGGYAKDA VEVEGYVRGF GRRRPDIAVT VLRLANVLGP 
RVDSPLARYL DLPLVPTVLG FDPRIQLLHS DDAMAVLLKA TRETHAGTFN VAGDGVLLLS 
QAIRRAGRPA LPVPFPAIGS LGNIARRLRL VDFSSEQLGF LAHGRAVDTT KLKEVFGYVP 
QYTTVATFDS FVQDRGLRFT IDHELVSRVE HGLQGALARR RLLGTS