Gene Francci3_2035 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_2035
Symbol
ID	3906752
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	2396439
End bp	2397497
Gene Length	1059 bp
Protein Length	352 aa
Translation table	11
GC content	71%
IMG OID	637879372
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_481138
Protein GI	86740738
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.0499801
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCCTGC TGATCCTGGG AGGAACCTGG TTCGTCGGCC GTGTCCTGGC TGAGGACGCG 
GTGGGCCGTG GCTGGGCGGT CACGACGTTC AACCGGGGTA GGTCCGGACC GGATGTCGCA 
GGGGTCCACC CGTTGCGCGG CGACCGAACC GACGTCCAGG ATCTTGAACG CCTCGCGGCG 
GCGGGGCCGT GGGATGCCGT GGTGGACGTC GGCGGAGCGG AGCCCCGCTC GGTCGGCCTG 
GCCGCTCAGG TTCTGGGCGC GCAGGCCGGT CGGTACGTGT TCGTGTCGAC CGTCTCGGTG 
TATCGCGACT GGCCCGCGTC CCCGGTCGAC GAATCCTCAC CTCTACATCC GGGAAACCCC 
GATCTTGTGG TGGAAGATCC TCGCTGGGAC GCGGTGCGGT ACGGCCCCCA CAAGGCCGGG 
TGTGAGGCCG CGGTCCGGCG GAGCGTTTCC CCGGATCGGC TGCTCATGGT GCGGCCGGGG 
GTGGTTCTCG GCCCGTACGA GTACGTCGGA CGGTTGCCGT GGTGGCTTCG GCGGATGGCG 
CGCGGCGGGC GGGTGCTGGC CCCCGCACCC GCCGACAGGC CGATCCAGCC TGTGGACGTG 
CGTGACCTCG CGTCGTTCCT GCTCGACCTG ATCGGGCGGT CGGCCAGCGG CATCTTCAAC 
GTCGCGGCGC CCACCGGCCA CGCGACCTAC GGCCGGATGC TGGACGCGTG CGCTGCGGCG 
ACGCGGGACG TCCGAGGCGC AGATGAGATC GAGGTTGTCT GGGCGGAACC CGATTGGTTG 
GTCGAACAGG GGGTGCGTCA GTGGACGGAG ATCCCGCTGT GGCGGGTGCA GCCAGGGACA 
TGGCGCCTGG ATGCGACCCG CGCGGCGGCG GCGGGCCTGC GTTGCCGGCC GATCGAGAAG 
ACGGTCCTGG CCACGTGGGC GTGGCTGGCG GCCGGTGGCG CTCCGGTCCG GCATGAACGT 
CAGGACGAGC ACGGTTTCGA CCCCGACAGA GAGCGCCGCC TCGTCGACCT GTGGGAGTGC 
CGGTCACAGG CCGCCTCCGG CGAGAAGGGC CTGGTGTGA

Protein sequence

MRLLILGGTW FVGRVLAEDA VGRGWAVTTF NRGRSGPDVA GVHPLRGDRT DVQDLERLAA 
AGPWDAVVDV GGAEPRSVGL AAQVLGAQAG RYVFVSTVSV YRDWPASPVD ESSPLHPGNP 
DLVVEDPRWD AVRYGPHKAG CEAAVRRSVS PDRLLMVRPG VVLGPYEYVG RLPWWLRRMA 
RGGRVLAPAP ADRPIQPVDV RDLASFLLDL IGRSASGIFN VAAPTGHATY GRMLDACAAA 
TRDVRGADEI EVVWAEPDWL VEQGVRQWTE IPLWRVQPGT WRLDATRAAA AGLRCRPIEK 
TVLATWAWLA AGGAPVRHER QDEHGFDPDR ERRLVDLWEC RSQAASGEKG LV