Gene Francci3_3475 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3475
Symbol
ID	3905209
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4144294
End bp	4145337
Gene Length	1044 bp
Protein Length	347 aa
Translation table	11
GC content	72%
IMG OID	637880797
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_482557
Protein GI	86742157
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTGAAGG TAGTCGTGAC GGGTGGGGCC GGCTTCATCG GGGCCCACCT GACCAGAGCG 
CTCCTCGCGG CAGGCACGGA GGTCGTCGTG ATCGACGATC TCAGTACCGG GGCGCTGTCG 
AATCTCGCGG GGCTGCCGGC CGAGCTCGTC GTCGGCAGCG TGACCGACCG GACGCTCGTC 
GAACAGGCGT GCACCGGGGC GTCGAGCATC GTGCATCTGG CTGCCCGGCC GTCGGTCGAA 
CGGTCGTTGC TCGACCCGAT GGCCACCCAC GCGGTGAACG CGACCGGCAC CCTGACGGTG 
CTCGGCGTCG CCCACCGGGC CGAGACGCAC GTCGTCGTCG TGTCCTCCTC ATCGGTTTAT 
GGTGACCGGT CGGCCGCTGG CGATCGGTCG GCCGCCGCTG GCGCGGGTCC GCTGTCGCCC 
TCGGCGGGCA CCCCGTGCCT TCCGCGCAGT CCCTTCGCGG CCTCGAAGCT CGCCGCCGAG 
GGATATGCGC TGTCCTACCA GGCCAGTTTC GGTCTGCCGG TGCTCACGGT CAGGCTGTTC 
GACGTGTTCG GCCCGTACCA GTCCGCCGGG CACGCGTACG CGGCCGTGGT GCCGACCTTC 
ATCGAGGCCG CGTTGGCCGG CCGGCCGCTG ACGGTGCGCG GGGACGGCCG GCAGACGCGC 
GATTTCATCC CTGTCGAGCT GGTCACCGGG ATGCTGTGCG ATGCGGTGTG CCGCCGGCTG 
ACCCATCCAC ACCCGGTCGA CATCGGGTCC GGGACCCGTA CCGATCTGCT CACCCTGATC 
GCCCGGCTGG AGGAGATTCT CGGCCGGCGG CTGGTCGTCG AGCACGCTGC GCCCCGGCCC 
GGGGAGATCT GGGACTCCCA GGCGGACACG ACGACGATGC GTTCGCTGTT CCCGGACGTG 
ACCGGGGCGG ATCTCACCAC CGCGTTGGCG GCAACCGTGA CCTGGTACGC CGACCGGCTG 
GGGGCGGACC GCGCCGGGCC GCCAGCCGCC GGGCCGCCGG ACGCGATGCT GCCCGCGTCC 
GCCGTCCACG GTGACCGGGA TTGA

Protein sequence

MVKVVVTGGA GFIGAHLTRA LLAAGTEVVV IDDLSTGALS NLAGLPAELV VGSVTDRTLV 
EQACTGASSI VHLAARPSVE RSLLDPMATH AVNATGTLTV LGVAHRAETH VVVVSSSSVY 
GDRSAAGDRS AAAGAGPLSP SAGTPCLPRS PFAASKLAAE GYALSYQASF GLPVLTVRLF 
DVFGPYQSAG HAYAAVVPTF IEAALAGRPL TVRGDGRQTR DFIPVELVTG MLCDAVCRRL 
THPHPVDIGS GTRTDLLTLI ARLEEILGRR LVVEHAAPRP GEIWDSQADT TTMRSLFPDV 
TGADLTTALA ATVTWYADRL GADRAGPPAA GPPDAMLPAS AVHGDRD