Gene Francci3_3825 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Francci3_3825
Symbol
ID	3905573
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. CcI3
Kingdom	Bacteria
Replicon accession	NC_007777
Strand	+
Start bp	4585943
End bp	4587385
Gene Length	1443 bp
Protein Length	480 aa
Translation table	11
GC content	75%
IMG OID	637881151
Product	aldehyde dehydrogenase
Protein accession	YP_482904
Protein GI	86742504
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.344076
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0683109
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCGAGC CGACGCCGTT CTGGCTGGCA GGCAAGCCGG CCACCGGGTC GGCGACGACC 
ACCGTTCGGC ACCCGTTCGA CGGCGCGGAG GTCGCCGTCG TCGCGCAGCC GGACCCCGAC 
CAGGTTGAGA CGGCCGTGGC CGCCGCGGCG GCGGTCGCCC CGGCGTTCGC GGCGCTGCCG 
GCCCACGTCC GCGCCGGCGC GCTCGCCGGC GTGTCGAAGG AGATCGCCCG TCGAGGCGAC 
GAACTGGCCC GTCTCATCAC CGCGGAGAGC GGTAAGCCGC TGACCTGGTC GCGTGCCGAG 
GTGGCCCGGG CAAGCTCCAC CTTCCGCTGG GGGGCGGAGG AGGCCCGGCG TTTCGCCGGG 
GAGCTGACCA GGCTGGACAC CGATCCCCCC GGGGAGGGAC GGCTCGCGCT CACCCGGCGT 
TTCCCCCGCG GGCCCGTGCT GGGCATCACC CCCTTCAACT TCCCGCTCAA CCTGGTCGCC 
CACAAGGTGG CGCCGGCGCT GGCGGTCGGC GCGCCGATCA TCGTGAAGCC GGCCCCGCGC 
ACGCCGCTGT CGGCGCTGTT CCTCGGCGAC CTGCTCGCCG ACGCCGGCTT GCCCGAGGGG 
TCGTGGTCGG TCCTCCCGAT CCCCAACGAC CGCCTCGGCC CGCTCGTCGC GGACCCTCGG 
CTGCCCGTGG TGTCCTTCAC CGGCTCCGGC CCGGTGGGCT GGTCCATCCG CGACACGGTC 
CCCCGCAAGC ATGTGGTCCT CGAACTCGGC GGGAACGCGG CGGTGCTGGT CGCCGCCGAC 
TACGCGACCC CCGCCGATCT GGCCCGGGCC GCCGGCCGCA TCGCCCTGTT CGCCAACTAC 
CAGGCCGGCC AGTCGTGCAT CGCCGTGCAG CGGGTCTACG CCGACCGCAC GATCGTCGAC 
GAGCTGCTCG CCGAGATCGT CGCCGCCGTG CGGGCGCTGC ACGACGGGGA TCCGGCCGAC 
CCGGCCACCG ACGTGGGGCC GCTGATCGAC GTCGCGGCGG CGGAACGGGT CGAGGCGTGG 
ATCACCGAGG CCGTCGAGGC GGGGGCGACA CTCGTCTGCG GCGGGACGCG CCACGGCACG 
AGTCTCAGCC CGGCCGTGCT GACCGGCGTT CCGCCCACCG CCAAGGTGGT GAGCGAGGAG 
GTCTTCGGCC CGGTGATCGT CGTGGCGGCG GTCGACGGCG TTGACGAGGG CTTCGCCCGG 
ATCAACGACA GCGCCTACGG CCTGCAGGCC GGGGTGTTCA CCCACGACCT GGCCACCGCC 
TTCCGCGCCC ACCGGGAGCT CCAGGTCGGG GGGGTCGTCA TCGGCGACGT CCCGTCGTAC 
CGGGCCGACC AGATGCCCTA CGGCGGGACG AAGGGTTCCG GCATCGGGCG GGAGGGGGTC 
CGCTCGGCCA TGACCGACCT CACCGAGGAC CGGGTGCTGG TCCTGACCGG TCTGGACCTG 
TAG

Protein sequence

MSEPTPFWLA GKPATGSATT TVRHPFDGAE VAVVAQPDPD QVETAVAAAA AVAPAFAALP 
AHVRAGALAG VSKEIARRGD ELARLITAES GKPLTWSRAE VARASSTFRW GAEEARRFAG 
ELTRLDTDPP GEGRLALTRR FPRGPVLGIT PFNFPLNLVA HKVAPALAVG APIIVKPAPR 
TPLSALFLGD LLADAGLPEG SWSVLPIPND RLGPLVADPR LPVVSFTGSG PVGWSIRDTV 
PRKHVVLELG GNAAVLVAAD YATPADLARA AGRIALFANY QAGQSCIAVQ RVYADRTIVD 
ELLAEIVAAV RALHDGDPAD PATDVGPLID VAAAERVEAW ITEAVEAGAT LVCGGTRHGT 
SLSPAVLTGV PPTAKVVSEE VFGPVIVVAA VDGVDEGFAR INDSAYGLQA GVFTHDLATA 
FRAHRELQVG GVVIGDVPSY RADQMPYGGT KGSGIGREGV RSAMTDLTED RVLVLTGLDL