Gene Francci3_3941 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3941
Symbol
ID	3906900
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	-
Start bp	4718124
End bp	4719152
Gene Length	1029 bp
Protein Length	342 aa
Translation table	11
GC content	67%
IMG OID	637881268
Product	NAD-dependent epimerase/dehydratase
Protein accession	YP_483020
Protein GI	86742620
COG category	[G] Carbohydrate transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0451] Nucleoside-diphosphate-sugar epimerases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.438556
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGGTGC TCGTGACGGG CACGGAGGGG TATCTGGGGT GCCTGCTCGC GCCCGAGCTG 
CTGCGTGATG GCCATGAGGT CATCGGCGTG GACACCGGCT ACTACAAGTA CGGCTGGCTG 
TACCGCGGCG TCGACCGGAC CCCGTTGACC CTTGACAAGG ACCTTCGCCA TCTCACGGTC 
GAGGACTTCG CGGGGGTCGA CGCCGTCGTG CACATGGCGG AGCTGTCCAA CGACCCGCTC 
GGCGCGCTCG CCCCGGACGT GACGTACAAG GTGAACCACG TCGGCTCGGT CCGGCTGGCG 
AAGCTGGCCA AGCAGGCCGG CGTCGAACGG TTCGTCTACA TGTCCTCCTG CAGCGTCTAC 
GGCGTCGCGA CCGGTGTGGA CGTCACCGAG GCCTCGCCGG TGAACCCGCA GACCCCCTAC 
GCCGAGTGCA AGGTCTACGT GGAGCGTGAC GTCGCCCCGC TGGCGGACGA CACCTTCTCG 
CCGACCTTCC TGCGCAACGC CACCGCCTAC GGTGCCTCCC CGCGGCAGCG TTTCGACATC 
GTGCTCAACA ACCTGGCCGG GGTGGCCTGG ACTACCGGCG AGATCGCGAT GACCTCGGAT 
GGCACCCCGT GGCGCCCGCT GGTCCACGGG CTCGATATCG CGAAGGCGAT CCGCCTGGTG 
CTGACCGCAC CGCGCGACAT CGTGCACAAC CAGATCTTCA ACGTCGGCGA CAGCGAGCAG 
AATTACCAGG TGAAGGAGAT CGCGGACGCG GTCGCCACGG TGTTCACCGG CTGCACGCTG 
AGCTTCGGTG ACAACGGCGG TGACAATCGC AGCTACCGGG TGTCGTTCGA CAAGATCGCC 
TCCACCCTGC CCGGCTTCTC CTGTGACTGG AACGCGCTCA GGGGCGCCCA GCAGCTGCAC 
GACGTCTTCA CCCGTATCCA GCTCGACAAC GAGACGTTCA CCGGCCGCGG GCACACCCGG 
CTCAAGCAGC TTCAGTACCT GATCCGCACC GGCCAGCTCG ACGCCGACCT GTTCTGGGCC 
CACTCGTGA

Protein sequence

MKVLVTGTEG YLGCLLAPEL LRDGHEVIGV DTGYYKYGWL YRGVDRTPLT LDKDLRHLTV 
EDFAGVDAVV HMAELSNDPL GALAPDVTYK VNHVGSVRLA KLAKQAGVER FVYMSSCSVY 
GVATGVDVTE ASPVNPQTPY AECKVYVERD VAPLADDTFS PTFLRNATAY GASPRQRFDI 
VLNNLAGVAW TTGEIAMTSD GTPWRPLVHG LDIAKAIRLV LTAPRDIVHN QIFNVGDSEQ 
NYQVKEIADA VATVFTGCTL SFGDNGGDNR SYRVSFDKIA STLPGFSCDW NALRGAQQLH 
DVFTRIQLDN ETFTGRGHTR LKQLQYLIRT GQLDADLFWA HS