Gene Clim_0032 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Clim_0032
Symbol
ID	6355555
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium limicola DSM 245
Kingdom	Bacteria
Replicon accession	NC_010803
Strand	+
Start bp	36820
End bp	38220
Gene Length	1401 bp
Protein Length	466 aa
Translation table	11
GC content	54%
IMG OID	642667657
Product	aromatic hydrocarbon degradation membrane protein
Protein accession	YP_001942119
Protein GI	189345590
COG category	[I] Lipid transport and metabolism
COG ID	[COG2067] Long-chain fatty acid transport protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	31
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCTTTCC TGGCTGTTCT TTCAGCGGCG TCAACCGCTT TTGCCACCAA CGGCATGAAT 
CTCGAAGGGT ACGGGGCTAA ATCTCATGCT CTTGGAGGGA CAAGCACGGC CTACGATACC 
GGAAATTCAG GGGTTACGAA CAACCCGGCA ACTCTTGGCC TGAGGGAGGA GGGGTCTTCG 
GAAATCGGTA TCGGTATCCG CGGCCTTCAC CCGGACGTCA ATCTCGGGTT TAATGGCGTG 
ACGACAACCG AATCAAAAGG GGATTCCTAT TACATGCCCT CGCTCTCTTA TATGCGCAAA 
GACGGAAAGA TTACCTGGGG ATTTGCCGTT CTCGCCCAGG GAGGGATGGG AACGGAATAT 
GGCGAAAACT CTTCGCTGTT CAGCTATGGC ATGCCCATGT CGAAGCAGGG AATGGTTCCG 
CTGAGCGGGC AGGATATCCG TTCCGAGGTG GGAGTGGGAC GTCTGATGTT TCCCGTGGCG 
TATAACCTTA CGGAAAACAC CGTCATCGGA GCATCGCTCG ATTTCCTCTG GGCAAGCATG 
GATCTGCGTA TGGATATGGA CGGAGCGCAT TTCGGCGATA TGGCCATGCA GGGTATTGGC 
GGCAAGGTAA GCGGATCGAT GTTCGGTACT CTCGGGGGAA TGATCGGTTC CTCAGTCCGG 
GATATCGACT ACGTCCGCTA CGATTTTTCG AACGACAACG CCTTTCTCGG GGAGGCGATA 
GGTTACGGAA CCGGTTTCAA GGTCGGCATT ACCCACCGGT TCGGCAAGTT CCTTACGGTG 
GGAGGAAGCT ATCACTCGCA GACCCGGATT TCAGATCTCG AAACCTCCAA AGCGGTACTT 
TCGTTTGCCG GGAAGGATGC GATGAATAAT TCTTTTACCC GGTCGGTGAA CGGCACTATC 
AAGGTCCGCG ATTTCGAGTG GCCGGCCACC TTTGCCGCAG GAGTCGCCCT GTATCCCTCT 
GAACGCTGGA TGATTACCGC CGACATCAAG CATATCGACT GGTCGTCGGT AATGGAGAAG 
TTTTCGACAT CCTTTACCGC CGATAACTCT CTTTCCAACG GGCCGTTTGC AGGGCAGACG 
CTTGATGTGG AGATGCTGCA GAACTGGAAG GATCAGACCG TCATTTCGGT CGGCGTTCAG 
TACCGGGCAA CCGACAGGCT TGCGCTGAGG ACTGGAGCCA GCTTCGCGTC GAATCCGGTT 
CCCGATATGT ATCTCAATCC CATGTTTCCG GCGATAACCG AAAACCATTA TACGGCAGGA 
TTCGGTTACC GGCTTTCCGA CAGGTCTTCT GTTTCGGCGG CTCTTGCATG GGCTCCGGAA 
GTAAGCGAAA CCTCTGATGA AGGACTTGAG ATCGGTCACA GCCAGCTTAA CTGGTCACTG 
AACTATTCCC ACGAACTTTA G

Protein sequence

MAFLAVLSAA STAFATNGMN LEGYGAKSHA LGGTSTAYDT GNSGVTNNPA TLGLREEGSS 
EIGIGIRGLH PDVNLGFNGV TTTESKGDSY YMPSLSYMRK DGKITWGFAV LAQGGMGTEY 
GENSSLFSYG MPMSKQGMVP LSGQDIRSEV GVGRLMFPVA YNLTENTVIG ASLDFLWASM 
DLRMDMDGAH FGDMAMQGIG GKVSGSMFGT LGGMIGSSVR DIDYVRYDFS NDNAFLGEAI 
GYGTGFKVGI THRFGKFLTV GGSYHSQTRI SDLETSKAVL SFAGKDAMNN SFTRSVNGTI 
KVRDFEWPAT FAAGVALYPS ERWMITADIK HIDWSSVMEK FSTSFTADNS LSNGPFAGQT 
LDVEMLQNWK DQTVISVGVQ YRATDRLALR TGASFASNPV PDMYLNPMFP AITENHYTAG 
FGYRLSDRSS VSAALAWAPE VSETSDEGLE IGHSQLNWSL NYSHEL