Gene Franean1_0963 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_0963
Symbol
ID	5669377
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	1126323
End bp	1127315
Gene Length	993 bp
Protein Length	330 aa
Translation table	11
GC content	73%
IMG OID	641239891
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001505325
Protein GI	158312817
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.409004
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	9
Fosmid unclonability p-value	0.187686
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCGTATCC TCGTCACCGG CGCGGCCGGT TTCATCGGTT CCACCGTCGT CGATCGGATG 
CTTGCTGACG GTCATTCGGT CGTGGGCATC GACGACCTGT CGTCCGGGCG CATGGAGAAT 
CTCACGCAGG CGGCGACCGA TGCCCGGTTC TCGTTCGAGA AGGGCGATAT CACGTCGCCC 
GATCTCGGTG ACTTCGTCGC CCGGGTCCGC CCCGACGCGG TGGCTCATCT CGCGGCGCAG 
ATCGACGTCC GGATCAGCGT CGCCGACCCG CTGCTCGACG CCCGGCTGAA CGTTCTCGGC 
ACGATCAACG TGCTGGAGGC GGCCCGGGCC GCCGGGGTGG TGAAGGTCAT CCACACCTCG 
TCCGGCGGGT CGATCTACGG CACGCCGGCC GCGCTGCCCG TCGACGAGTC CGTGCCACCC 
GCGCCCGAGT CACCGTACGC GGCCGGGAAG GCCGCCGGCG AACTGTACCT CAACGTGTAC 
CGGGTGACCT ACGGTGTCGC GACGACGGCG CTGGCGCTCG GGAACGTCTA CGGGCCCCGC 
CAGGACCCGC ACGGCGAGGC CGGGGTGGTC GCCATCTTCG GCACCGCCCT GCTCGAGGGG 
CGCCCGACCA AGATCTTCGG TGACGGCGCG ACCAGCCGGG ACTACGTCTT CGTCGGGGAC 
GTCGCCGACG CCTTCGCCCG GTGCGTGCCG GCCCAGGCGG CCAACGGCCT GCGGATCAAC 
ATCGGGACCG GCGCCGAGAC CACCGTTCTC GACCTGCACA GCCGCATCGC GCGGGTGGTC 
GGGGTGCCGG ACGAGCCCCA GTTCGCCCCG CCGCGCCCCG GCGAGCTGCA GCGCATCAGC 
CTGGACGTCG GCCTCGCGGA GCGGGAGATC GGCTGGCGGC CGCGGATGGA CCTGGACGGC 
GGGCTCACCC GGACCGTCGA CTGGATCCGG GCCCGGATCG GCGCCCGCGC CGCCGCCTCC 
GGCTCGGCCG GCGCGACCGG CGCGACCGGC TGA

Protein sequence

MRILVTGAAG FIGSTVVDRM LADGHSVVGI DDLSSGRMEN LTQAATDARF SFEKGDITSP 
DLGDFVARVR PDAVAHLAAQ IDVRISVADP LLDARLNVLG TINVLEAARA AGVVKVIHTS 
SGGSIYGTPA ALPVDESVPP APESPYAAGK AAGELYLNVY RVTYGVATTA LALGNVYGPR 
QDPHGEAGVV AIFGTALLEG RPTKIFGDGA TSRDYVFVGD VADAFARCVP AQAANGLRIN 
IGTGAETTVL DLHSRIARVV GVPDEPQFAP PRPGELQRIS LDVGLAEREI GWRPRMDLDG 
GLTRTVDWIR ARIGARAAAS GSAGATGATG