Gene Franean1_2922 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_2922
Symbol
ID	5671309
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	3438677
End bp	3439927
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	67%
IMG OID	641241829
Product	acyl-CoA dehydrogenase domain-containing protein
Protein accession	YP_001507249
Protein GI	158314741
COG category	[I] Lipid transport and metabolism
COG ID	[COG1960] Acyl-CoA dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	26
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCCGA CGGCTACTGA GAGCTTGGAT GGCTTCCGCG ACCGGGCCCG AAAGTTCATC 
CGAGCCAACT TAGAACCTGC CGCGCCGTCC GTGGCCACCA GCCTGCGCGG GGGGCGCAGT 
GACGAGGAGG AGCTCGCCGC TGTTACTCGC GACCGGGAAC TCCAGCGGCT TTTGTTCGAC 
GCCGGGCTCG CCGGTATCTG CTTTCCCCGC GAGTACGGCG GCCAAGGGCT CACCCCAGCG 
CACCAGGCCG TCCTGAACGA CGAGTTAGGC GGGTACGAGT ACCCGTCACA CCTCCAATCG 
CCGTCAATCT CCCAGTGCGG CCCGGTACTT CTGGAGTTCG GTACTGAGGA ACAGAAGCGC 
GAACACATCC CGGCGCTGCT CCGCGGGGAC GAGATCTGGA TGCAGTTCCT GTCCGAGCCC 
GGCAGCGGAT CCGATGTGGC GGCCGCTCTC ACCAGCGCCG TACGTGATGG CGACGACTGG 
GTGCTCAACG GCTCGAAGAT CTGGACGACC GGCGCCTGGT GGTCCGACTG GGCACTCTGC 
CTCGCCCGCT CGAACTGGGA CGTCCCGAAG CACAGGGGCC TCACCGTTTT CATGGTGCCG 
ATCCGGCATC CGGGCATCAA GGTCCACCGC ATCGAGCTCC TGAGCGGTTC CCAGGAGTTC 
TGCCAGGAGT TCATGACCGA CGTACGGATC CCCGATGCCT ACCGCATCGG CGAGGTCGAC 
GGCGGGTGGA CGGTCGGAGT CCGCTGGATG TTCCACGAAC GTCTCGGCAC GAGCTCTCCT 
CTCGTCACCC TCTCGGGTGG CTCGCACCTC GGCCGGTCCA CCGACCCCGT CGCGGTGGCC 
CGCGCGACCG GGCGTCTGGA CGATCCGACC GCCCGCGATC TCATCGGAGA GGCTCGCACT 
CTCGAACTCG TCGGAGGCGC GCTGTCGAGC CGCCTGGCCT CGGCGATATC CGGCGGGCAG 
ATGTCAGACC AGGCAGCCGC CATCGGGCGG CTCTTCAGCG GAGTGGCCGC CATCCGGAGG 
ACCACCATCG TCTTTGAACT CGCGGGTGCG GTCGGAGCCG CCTGGACCGA GGACGACGGT 
GACGCCGGAG AGATCGGGAC CGACTTTCTG ATGCGCCAGG TCGCAACCAT CGCCGGTGGA 
ACGACGGAGA TGGCCCGGAA CGTGATTAGT GAACGCGTCC TAGGAATGCC GCGCGAGCGC 
ACTGTCGACC GCGAACTCCC CTTCCGGGAC GTGCCTCGAT CGAAGCGATA G

Protein sequence

MSPTATESLD GFRDRARKFI RANLEPAAPS VATSLRGGRS DEEELAAVTR DRELQRLLFD 
AGLAGICFPR EYGGQGLTPA HQAVLNDELG GYEYPSHLQS PSISQCGPVL LEFGTEEQKR 
EHIPALLRGD EIWMQFLSEP GSGSDVAAAL TSAVRDGDDW VLNGSKIWTT GAWWSDWALC 
LARSNWDVPK HRGLTVFMVP IRHPGIKVHR IELLSGSQEF CQEFMTDVRI PDAYRIGEVD 
GGWTVGVRWM FHERLGTSSP LVTLSGGSHL GRSTDPVAVA RATGRLDDPT ARDLIGEART 
LELVGGALSS RLASAISGGQ MSDQAAAIGR LFSGVAAIRR TTIVFELAGA VGAAWTEDDG 
DAGEIGTDFL MRQVATIAGG TTEMARNVIS ERVLGMPRER TVDRELPFRD VPRSKR