Gene Franean1_6288 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_6288
Symbol
ID	5674607
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	7637310
End bp	7638338
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	69%
IMG OID	641245140
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_001510536
Protein GI	158318028
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGGCTGC GGAATGTTCT GGTGACGGGA GGAGCCGGAT TCATCGGCTC CCACCTCGTC 
GTCCGTCTGA TCAGCAACCC GACGGTCGAA AAGGTGACGG TGCTGGACGC CCTCACCTAC 
GCCGGCCACC GCGACAACCT CGCCCCTGTC GCCGCCTCAC CGAAGCTGGA GTTCGTCGAG 
GGCAACATCC TCGACGCCGA CCTGCTCGCC AGCCTGATGG ACGGGCAGGA CGGTGTGGCG 
CACTTAGCCG CCGAATCCCA CGTCGACCGG TCATTCCTGG AGGCCGGGAA CTTCCTGCTC 
ACCAACGTGC TCGGCACCCA GCGGGTCCTG GACGCCGCCC TGGCCGCCGG GGTCCGGCGG 
ATCGTGCACG TGTCCACCGA CGAGGTGTAC GGGTCGTGGC CGTCGGGGGC TGCGACCGAG 
GTCGATCCGG TCCGACCCAC CTTCCCCTAT TCGGCTTCCA AGGCCGCCAG CGACCTGGCC 
ACCCTCGCCC ACTTCCGCTC CTACGGCACC CCGGTGTCGG TGACCCGGTC GTCGAACTGC 
TACGGGCCCG CCCAGCATCC CGAGAAGATC ATCCCGCTGT TCGTGACCCG GCTGCTCCAG 
GGCCTGGAGG TCAGCCTGCA CGGCCACGGC CAGCACCTGC GGAACTGGTT GCATGTGGAG 
GACAACTGCG CCGGGATCGA GTTGGTGCTG CGTGGCGGCC AGCCCGGTGA GATCTACAAC 
CTCGGCGGCG GCACCGACCT GACCACCCAC CAGCTCACCG CGCTGCTGCT GGAGCTGTGC 
GGCGCGGACT GGTCGGCCGT GTCGTATGTG CCCGACCGGA CGGCCAACGA CTACCGGTAC 
AGCATGGACT CCTCCAAGGC CATGAGCGTC CTGGGCTACC GGCCGGTCAG GGGTCTGCGG 
GAGAGCCTGG TCGAGACCGT CCAGTGGTAC CGCGACCACC CCGACCGGTG GGGGCCCGGC 
ACCCGCAACG CCGCCGCCCC GCTCGCCCAG GTTGAAGTCT CCACGCTGAC CACTACCGCG 
CATGAGTGA

Protein sequence

MRLRNVLVTG GAGFIGSHLV VRLISNPTVE KVTVLDALTY AGHRDNLAPV AASPKLEFVE 
GNILDADLLA SLMDGQDGVA HLAAESHVDR SFLEAGNFLL TNVLGTQRVL DAALAAGVRR 
IVHVSTDEVY GSWPSGAATE VDPVRPTFPY SASKAASDLA TLAHFRSYGT PVSVTRSSNC 
YGPAQHPEKI IPLFVTRLLQ GLEVSLHGHG QHLRNWLHVE DNCAGIELVL RGGQPGEIYN 
LGGGTDLTTH QLTALLLELC GADWSAVSYV PDRTANDYRY SMDSSKAMSV LGYRPVRGLR 
ESLVETVQWY RDHPDRWGPG TRNAAAPLAQ VEVSTLTTTA HE