Gene Franean1_3125 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3125
Symbol
ID	5671503
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3680460
End bp	3681968
Gene Length	1509 bp
Protein Length	502 aa
Translation table	11
GC content	68%
IMG OID	641242022
Product	aldehyde dehydrogenase
Protein accession	YP_001507442
Protein GI	158314934
COG category	[C] Energy production and conversion
COG ID	[COG1012] NAD-dependent aldehyde dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGAGCGATG TGTGGAGTCT CGACCCGCGA ACCGGACGGC GGGTCCAGTT GGTTGCCGCC 
TCGACATCGG TCTCGGGCGT TGACGCGGCT GCCAAAGCTG CAAAGGGCGC GGCTGGCGAA 
CTTGTCCGTT CGGGTCGCGC GACGCGGGCA CTGCTGCTGC GCCGAATCGC CGCGGTCGTT 
GAGGAGCGGG CCGACAAGTT GTTGGAGGTC GCTGACCGGG AAACCGCCCT GGGTTCCCCC 
CGGTTGCCCG GGGAGCTGGC GCGTACGGCG GGACAGCTAC ACCTGTTCGC CGACATCGTC 
GAAGACGGCT CCTACCAGGA GGCGGTGATC ACGGATGCGC GCACGGACGT GGAACCGCCT 
GTTCCGGATC TGCGACGGCT ACTCGTCCCG TTGGGGCCGG TTGCGGTCTT CGGAGCCAGC 
AACTTCCCCT TCGCGTTCTC GGTGCTCGGC GGCGACACGG CGGCGGCGCT CGCCGCAGGT 
TGTCCCGTCG TGGTCAAGTG CCACCCGGGG CACCCGGAGA CGTCGGTGCT GATGCTCGAG 
GCGTGGCGTC AGGCCGCTGC TGAAACTGGT GTTCGCGAGG ATGCGGTGCA GTTGGTGTTC 
GGTACCGATG CCGGGCGCCA GCTCGTCGAG CACCCGCATA TCCGAGCGGT CAGCTTCACC 
GGCTCGCTGG CGGTCGGGCG CGAACTGCAC GACCTGGCCG CCGGACGGCC GGATCCAATA 
CCGTTCTACG GCGAGCTCGC CGGGATGAAT CCGCTGATCG TCACGCCCGG TGCGGCCCAG 
CAGCGGGCCG AGGAGATCGG CCGGGGAGCG GCAGCATCGT TCACCTTGAA CGGCGGCCAG 
TTCTGCACGA AGCCAGGGCT GTTGTTCGTG CCTGCCGGAC CGGACGGTGA CCGGCTGATC 
GCCGCTGCAG CAGCATACGT CACCAAGATG ATGCCTGTGG TGATGTTGAC CGCGCAGACG 
CGACGCGCCT ACCAGGCCGG ACTCGAGGCA TTGCTATCCC ACCCTCGTGT TACGGCAGTG 
GCGCGGGTCG CTGACCCCGC CGGCGGGACA TTGGACCCCG ACTACGAGGG TAGCTGCCTG 
GCCACGCCCG CGCTCCTGGA GCTGTCGTCG AGTGATCTCG ACCGGTCGGT GCTGCAAGAG 
TGCTTCGGCC CGGTCGCGGT CGTCGCCCGG TACGAGTCGA CGTCAAGGAT GATCGACGGT 
CTTGCCGACC TGGAGGGGGC GCTCGCGGCG GCCGTGCACA GCACCAAGGA TGAGACAGAG 
CTGACCGCTG CGATCACTGA GGCGGTGCTC CCCAAGGTCG GCCGCATCGT CTACAACGGT 
TATCCCACGG GAGTCGCGGT CACGGCAGCC ATGACTCACG GTGGACCCTG GCCCGCGACC 
AGCAACGCGC TACACAGCTC GGTCGGCCCA TCGGCGATTC GGCGGTTCCT CCGGCCCGTC 
ACCTATCAGA ACGCACCCCA GGGCATCGTC CCTGAAGAAC TCCGCGGCCG GATCGGTAGC 
AGGAGGTGA

Protein sequence

MSDVWSLDPR TGRRVQLVAA STSVSGVDAA AKAAKGAAGE LVRSGRATRA LLLRRIAAVV 
EERADKLLEV ADRETALGSP RLPGELARTA GQLHLFADIV EDGSYQEAVI TDARTDVEPP 
VPDLRRLLVP LGPVAVFGAS NFPFAFSVLG GDTAAALAAG CPVVVKCHPG HPETSVLMLE 
AWRQAAAETG VREDAVQLVF GTDAGRQLVE HPHIRAVSFT GSLAVGRELH DLAAGRPDPI 
PFYGELAGMN PLIVTPGAAQ QRAEEIGRGA AASFTLNGGQ FCTKPGLLFV PAGPDGDRLI 
AAAAAYVTKM MPVVMLTAQT RRAYQAGLEA LLSHPRVTAV ARVADPAGGT LDPDYEGSCL 
ATPALLELSS SDLDRSVLQE CFGPVAVVAR YESTSRMIDG LADLEGALAA AVHSTKDETE 
LTAAITEAVL PKVGRIVYNG YPTGVAVTAA MTHGGPWPAT SNALHSSVGP SAIRRFLRPV 
TYQNAPQGIV PEELRGRIGS RR