Gene Franean1_4031 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Franean1_4031
Symbol
ID	5672389
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Frankia sp. EAN1pec
Kingdom	Bacteria
Replicon accession	NC_009921
Strand	+
Start bp	4806800
End bp	4807999
Gene Length	1200 bp
Protein Length	399 aa
Translation table	11
GC content	64%
IMG OID	641242907
Product	acyl-CoA dehydrogenase domain-containing protein
Protein accession	YP_001508324
Protein GI	158315816
COG category	[I] Lipid transport and metabolism
COG ID	[COG1960] Acyl-CoA dehydrogenases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.328111
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.707323
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAGGA TCGCGCAGAC CGATGGGCTG ACCGAGGTGC AGTCCGACAT CCTCGCGGCG 
GTGCGGTCGT TCGTGGACAA GGAGATCCTG CCGAACGCGG GCGATCTTGA GCGTAAGGAC 
GAGTATCCCG AGGCGATCGT CGAGGCGATG AAGGAGATGG GCCTGTTCGG GATCACCATC 
CCGGAGCAGT ACGGCGGTCT CGGTGAGTCG TTGTTGACGT ACGCGCTGGT GGTGGAGGAG 
ATCGCCCGCG GGTGGATGAG TGTGTCCGGG GTGATCAACA CTCATTTCAT CGTGGCGTAT 
CTGGTGTTGC AGCACGGTAC CGACGAGCAG CGGGAGCGGT TGTTGCCGCG GATGGCGACC 
GGTGAGCTGC GTGGGGCGTT CTCGATGAGT GAGCCGGGGT GTGGTTCGGA TGTGTCGGCG 
ATCACGACCC GGGCTGGCCG TGACGGCGAC GAGTACACGA TCACCGGGCA GAAGATGTGG 
CTGACCAACG GTGCCCGTGC GGGTCTGGTC GCGACGTTGG TGAAGACGGA TGAGGGTGCG 
GAGTCGGTCT ATCGGAACAT GACGACGTTC CTGTTGGAGA AGGAGCCGGG GTTTGGTACC 
GACGGTGGTA TCACGATTCC CGGGAAGCTG GAGAAGCTCG GGTACAAGGG TGTCGAGACC 
ACGGAGATGA TCCTGGATGG TCATCGGGTG CCGGCGAGTT CGATCCTGGG TGGCCCCGGG 
GGGGCGGGTC GTGGTTTCTA CCAGATGATG GATGGGGTGG AGGTCGGGCG GGTCAACGTC 
GCGGCCCGTG CCTGCGGGAT CATGATCCGG GCGTTCGAGT TGGCGATCGC CTACGCTCAG 
CAGCGGCGGA CGTTCGGCCA TCAGATCGCC GATCATCAGG CGATCGCGTT CAAGCTCGCG 
GACATGGCGA CCAAGGTCGA GGCGGGTCAT CTGATGATGG TCAACGCCGC GCGTAAGAAG 
GACAGCGGGC AGCGTAACGA CGTCGAGGCC GGGATGGCGA AGTACCTGGC CAGTGAGTAC 
TGCCATGAGG TGACCACCGA GTCGTTCCGG ATCCACGGCG GCTACGGGTA CTCCAAGGAG 
TACGAGATCG AGCGTCTCTA CCGGGAGGCC CCGTTCATGC TCATCGGCGA GGGGACGTCC 
GAGGTGCAGA AGCGCATCAT CAGCCGCGCC CTGCTCAAGG AATACAAGCT GCGAGGCTGA

Protein sequence

MGRIAQTDGL TEVQSDILAA VRSFVDKEIL PNAGDLERKD EYPEAIVEAM KEMGLFGITI 
PEQYGGLGES LLTYALVVEE IARGWMSVSG VINTHFIVAY LVLQHGTDEQ RERLLPRMAT 
GELRGAFSMS EPGCGSDVSA ITTRAGRDGD EYTITGQKMW LTNGARAGLV ATLVKTDEGA 
ESVYRNMTTF LLEKEPGFGT DGGITIPGKL EKLGYKGVET TEMILDGHRV PASSILGGPG 
GAGRGFYQMM DGVEVGRVNV AARACGIMIR AFELAIAYAQ QRRTFGHQIA DHQAIAFKLA 
DMATKVEAGH LMMVNAARKK DSGQRNDVEA GMAKYLASEY CHEVTTESFR IHGGYGYSKE 
YEIERLYREA PFMLIGEGTS EVQKRIISRA LLKEYKLRG