Gene Franean1_2097 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2097
Symbol
ID	5670497
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	2520902
End bp	2521945
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	69%
IMG OID	641241018
Product	dTDP-glucose 4,6-dehydratase
Protein accession	YP_001506439
Protein GI	158313931
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID	[TIGR01181] dTDP-glucose 4,6-dehydratase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGACGAC GCACCGAACG ACGCACCGAA AGGCGAACGA TGACCACTCT GCTGGTGACC 
GGGGCCGCCG GTTTCATCGG GTCCAACTTC GTCCGGTACT GGCTGGGGAC GCACCCCGGC 
GACCGCGTGA TCGCGCTCGA CGCGCTGACC TACGCGGGCT GCCGGGAGAA CCTCGCCGAC 
CTCGAGGACG GGATCACGTT CGTCCACGGC GACATCCGTG ACCGTGAGCT CATCGAGTCC 
ACGCTGCGCG AGCACCGTGT GGACGTCGTG GTCAACTTCG CCGCCGAGTC CCACAACAGC 
CTGGCGATCA TCCGTCCCGG CGAGTTCTTC TCCACCAACG TCATGGGCAC GCAGACCCTG 
CTGGAGGCCG CGCGGACCGT CGGGGTCGCC CGCTTCCACC AGATCTCGAC CTGCGAGGTC 
TACGGCGACA TGGACCTCGA CGACCCCGGC GCCTTCACCG AGGACTCCCC CTACCTGCCG 
CGCACGCCGT ACAACGCCGC CAAGGCCGGC TCGGACCACG CCGTGCGCTC CTACGGTTTC 
ACCTACGGCC TGCCGGTGAC CATCACCAAC TGCTCGAACA ACTACGGGCC GTTCCAGTTC 
CCGGAGAAGG TCATCCCACT GTTCGTGACC CGGGCGCTGC AGGGCCAGTC ACTGCCGCTC 
TACGCCTCCA CGAAGAACCG GCGGGAGTGG CTGCACGTGG TGGACCACTG CCGGGCCATC 
GAGGCGGTGC TCGAGCGCGG CACGGTGGGT GAGACCTACC ACGTCGGCTC CGGCATCGAG 
GCCGACATCG AGACCATCGC CGACCTGATC CTCGGCGAGC TGGGCCTGCC CGCCTCGCTG 
AAGACGATCG TGCCGGACCG TCCCTCCCAC GACCGCCGCT ACCTGCTGGA CTCCGGCAAG 
CTACGCACGA CGCTCGGCTG GGAGCCGCGG ATCAGCTTCG CGGACGGGAT GAAGGCCACC 
ATCGGGTGGT ACCGGGACAA CGAGGCGTGG TGGCGTCCCC TGCTCGGCCG CTCCCCCGTC 
TCGGAGACCG CCTGGCAGAG CTGA

Protein sequence

MRRRTERRTE RRTMTTLLVT GAAGFIGSNF VRYWLGTHPG DRVIALDALT YAGCRENLAD 
LEDGITFVHG DIRDRELIES TLREHRVDVV VNFAAESHNS LAIIRPGEFF STNVMGTQTL 
LEAARTVGVA RFHQISTCEV YGDMDLDDPG AFTEDSPYLP RTPYNAAKAG SDHAVRSYGF 
TYGLPVTITN CSNNYGPFQF PEKVIPLFVT RALQGQSLPL YASTKNRREW LHVVDHCRAI 
EAVLERGTVG ETYHVGSGIE ADIETIADLI LGELGLPASL KTIVPDRPSH DRRYLLDSGK 
LRTTLGWEPR ISFADGMKAT IGWYRDNEAW WRPLLGRSPV SETAWQS