Gene Franean1_3014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_3014
Symbol
ID	5671396
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	-
Start bp	3545889
End bp	3547244
Gene Length	1356 bp
Protein Length	451 aa
Translation table	11
GC content	68%
IMG OID	641241916
Product	crotonyl-CoA reductase
Protein accession	YP_001507336
Protein GI	158314828
COG category	[C] Energy production and conversion [R] General function prediction only
COG ID	[COG0604] NADPH:quinone reductase and related Zn-dependent oxidoreductases
TIGRFAM ID	[TIGR01751] crotonyl-CoA reductase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATGA AGGACATCAT CGATGCAGTC CTCGTCCAGG CCCCCCGCAC CGAAGCCCGC 
AGAGCCGAGT TCGAGGCCCT GTCCGTGCCC GCCGCCTATC GGGGAGTGGT GGTCCGCCGG 
GACGAAGTCG GCATGTTCGC GGGCCGGGCG TCGCGGGACA AGGACCCCCG CGAGTCCCTG 
CACCTCGACG AGGTGGCGAC CCCGGAAATC GGGCCGGGTG AGGCCCTGGT GGCGGTCATG 
GCCTCCTCGG TGAACTACAA CACGGTCTGG ACATCGATCT TCGAACCGAT GCCGACGTTC 
GGGTTCCTCG GGCGCTACGG CCGCACCTCG CCACTGGCCC GCCGCCACGA CCAGCCCTAC 
CACGTGGTCG GCTCGGACCT GGCCGGCGTC GTGCTACGCA CCGGGCCCGG GGTGCACGCC 
TGGGCACCGG GCGACGAGGT CGTCGCGCAC TGCCTGTCGG TCGAGCTCGA ACGTCCCGAA 
GGTCATAACG ACACGATGCT CGATCCCGAA CAGCGGATCT GGGGGTTCGA GACGAATTTC 
GGTGGTCTCG CCGAACTTGC GCTGGTCAAG GCCAACCAGC TCATGCCCAA ACCCGACCAC 
CTCACCTGGG AGGAGGCCGC CGCCCCCGGC CTGGTCAACT CCACCGCCTA CCGCCAACTC 
GTCTCCACCA ACGGCGCGAA CATGAAACAG GGCGACGTCG TCCTGATCTG GGGCGCCTCA 
GGAGGCCTCG GCTCGTACGC CACCCAGCTG GCGCTACGCG GCGGCGCCAT CCCGGTCTGC 
ATGGTCTCCT CACCGGCCAA AGCCGAGATC TGCCGTTCAC TGGGCGCCGA ACTCGTCATC 
GACCGCGCGA GCGAGGACTA CCGGTTCTGG ACCGACGAAC ACACCCAGAA CCCGAGGGAA 
TGGCAGCGCC TCGGCAAACG GATCCGCTCG CTCACCGGCG GCGACGACCC CGACATCGTC 
TTCGAGCACC CCGGCAGGGA GACCTTCGGC GCATCCGTCT ACGCGGCGCG GCGCGGCGGC 
ACCATCGTCA CCTGCGCCTC GACCAGCGGC TTCCTACACA GCTACGACAA CCGCTACCTG 
TGGATGAACC TCAAACGCAT CATCGGCTCG CACTTCGCGA ACTACCGCGA GGCATGGGAA 
GCCAACCGGC TCATCGCCCG CGGCCTGATC CACCCCACAC TGTCCCGGGT CTACCCACTC 
GCCGACACCG GACAGGCCGC CCACGACGTC CACCACAACA ACCACCAGGG CAAGGTCGGC 
GTCCTCTGCC TCGCCCCATC CGAAGGACTC GGCGTCCGCG ACGAAACAAC CCGGGCCCGC 
CACCTCACCG CAATCAACCG CTTCCGCGGC ATGTGA

Protein sequence

MSMKDIIDAV LVQAPRTEAR RAEFEALSVP AAYRGVVVRR DEVGMFAGRA SRDKDPRESL 
HLDEVATPEI GPGEALVAVM ASSVNYNTVW TSIFEPMPTF GFLGRYGRTS PLARRHDQPY 
HVVGSDLAGV VLRTGPGVHA WAPGDEVVAH CLSVELERPE GHNDTMLDPE QRIWGFETNF 
GGLAELALVK ANQLMPKPDH LTWEEAAAPG LVNSTAYRQL VSTNGANMKQ GDVVLIWGAS 
GGLGSYATQL ALRGGAIPVC MVSSPAKAEI CRSLGAELVI DRASEDYRFW TDEHTQNPRE 
WQRLGKRIRS LTGGDDPDIV FEHPGRETFG ASVYAARRGG TIVTCASTSG FLHSYDNRYL 
WMNLKRIIGS HFANYREAWE ANRLIARGLI HPTLSRVYPL ADTGQAAHDV HHNNHQGKVG 
VLCLAPSEGL GVRDETTRAR HLTAINRFRG M