Gene Anae109_0033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Anae109_0033
Symbol
ID	5376569
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaeromyxobacter sp. Fw109-5
Kingdom	Bacteria
Replicon accession	NC_009675
Strand	-
Start bp	42625
End bp	43872
Gene Length	1248 bp
Protein Length	415 aa
Translation table	11
GC content	72%
IMG OID	640841547
Product	aromatic hydrocarbon degradation membrane protein
Protein accession	YP_001377237
Protein GI	153002912
COG category	[I] Lipid transport and metabolism
COG ID	[COG2067] Long-chain fatty acid transport protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.744264
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	60
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGCACGA CGCCGATCCT CGCCACGCTC CTCCTCGCCC CCGCCCTCGC CTCGGCGAGC 
GGGTACGAGG TCATCTCCGT CAACCCGCGC GACCTCGCGC TCTCCCACTC CGCGGTGGCC 
GTGCAGGTCG ACGCCGCCGC GGCGTCCCTC AACCCGGCCG CGCTCTCGAA GCTCGAGGGC 
CCCACGGTCT CCGTCGGCGG CTCCCTCCTG AACATCTGGA CGGAGTGGGA CGGCGACCCG 
GCCCGCGGGC CGGCCGGCCA CGCCCAGACC CGCTTCGAGC CGGTGACCCC CGTCGCGATC 
TACGCGGGCT GGGGCACGAA GCTCGCCGAC CGCGGCTTCG GCGTCGGCGT CGGCTTCACG 
CAGCCCTTCG GCGGCAACGT GTTCTGGGAG GACGACTGGG AGGGGCGCGG CCGCATCGTC 
GAGGTGCAGC GCCGCTTCTT CGGCACCTAC GCCACCGCGG GCTACGAGGT CCTCCCGCAG 
CTCCGCCTCG GCGGCGGGCT CGTCTGGTAC TACGGGTTCG AGTACCTGAA GCAGGGCATC 
CAGCCCATCC CGGCGGCGTA CGGCGAGCTC GACACGAAGG GCGGCGGCGT CACCTACCAG 
GTGTCCGCCG AGATCCAGCC GGTGCCCTCC TACCCGCTCG TCTTCGGCGT CGACTACAAG 
CACAAGGCGC ACGTCACGCT CGAGGGCGAC GGCAACTTCG TGGTGCCGCC GTCCCTGGAG 
AGCGCGGACA CGCGGGACCA GGGCGTGTCC CACGACGTGA CGCTGCCGAA CCTGCTCAAC 
GTGGGCGTAG GGTGGCGCCC GGCGAAGCCC GTCCTCCTGA CGCTCCAGTA CTCCTGGTCG 
CGCTGGGTGG AGTACGTGGA CGACACCTTC GAGGGCGACG CGGGCCTCAC GCTCACGGTG 
CCCCGCGACT ACCGCAACGG CCAGGTCGTC CGCGGCGGCG TGGAGTGGCA GGCGCTGCCC 
GCGCTCGCGC TGCGCCTCGG GCTCATGCGC GACACCTCCG GGCTGCGCGA CACGACCTAC 
TCGCCGACGC TCCCGGACTC GAACACCACC GGCGTGTCGA CCGGGCTCAC CTGGGCGTTC 
GGCAAGCGCG GGCTCGCCGT GAACGCCGCC TTCTTCTACG GCTACCGCGA CGAGGTGGAG 
ACGGAGGGGG ACATCGCGTT CCCCGGCACG TTCCAGACCG ACATCATGAT CACCTCGCTG 
AGCCTCAGCT GGAACACGGA CCTGGCCCGC GCCGCCCGGG CGCGCTAG

Protein sequence

MRTTPILATL LLAPALASAS GYEVISVNPR DLALSHSAVA VQVDAAAASL NPAALSKLEG 
PTVSVGGSLL NIWTEWDGDP ARGPAGHAQT RFEPVTPVAI YAGWGTKLAD RGFGVGVGFT 
QPFGGNVFWE DDWEGRGRIV EVQRRFFGTY ATAGYEVLPQ LRLGGGLVWY YGFEYLKQGI 
QPIPAAYGEL DTKGGGVTYQ VSAEIQPVPS YPLVFGVDYK HKAHVTLEGD GNFVVPPSLE 
SADTRDQGVS HDVTLPNLLN VGVGWRPAKP VLLTLQYSWS RWVEYVDDTF EGDAGLTLTV 
PRDYRNGQVV RGGVEWQALP ALALRLGLMR DTSGLRDTTY SPTLPDSNTT GVSTGLTWAF 
GKRGLAVNAA FFYGYRDEVE TEGDIAFPGT FQTDIMITSL SLSWNTDLAR AARAR