Gene Dole_1944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1944
Symbol
ID	5694784
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	+
Start bp	2353270
End bp	2354613
Gene Length	1344 bp
Protein Length	447 aa
Translation table	11
GC content	55%
IMG OID	641264542
Product	aromatic hydrocarbon degradation membrane protein
Protein accession	YP_001529825
Protein GI	158521955
COG category	[I] Lipid transport and metabolism
COG ID	[COG2067] Long-chain fatty acid transport protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAGA CACTATGCGT TGCGGTATGT TTGGTTTTGG GAGTGATGTT GACGACGCCG 
GCCGGCGCCA CCCACTTTGG CGACACCTTT GGTTTTTCGC CGGAGGGAAT GGCACTGGGG 
AACGCCATGA CGGCAAAAGT CGATGACTGG TCGGCCGTGT ACTACAATAT TGCCGGGCTC 
GGCCGTTCCC AACACCTGGT TAACGGCAAA AGCCAGCTTT TTCTGGGTTA CATAAACAAT 
GCCCCGGATC TGGATATCGA GATTGTCAGG CGTGAAGCCG CCACCGGCGA TCGCCTGGCC 
ACCAACGGGG ACAGGGACCT GGACACCGGG ACCATTGTTA TTGGCGGCGT GCTGGATATC 
GGTACCCTTG TACATCTTCC CGAAATGGTA TCCTCGACCC GCCTGGGGCT TGCCATCGGC 
CTTAACGATG ACCAGAGCGT GGTTAAAATA AACGACCTCG ACCCCCGCAC GCATAATTTC 
ATGCGCTATG GCCGGGAATG CCAGCGCATG CTGATCACCA CCGGCATGGG ATTCGGATTT 
TTACACGACA CCTTCGGGGT CGGCCTGGGC GTTACCTCCT TTTTTACCGG AGAGGGGACC 
GCTCTCCTGG AACGTGTCGA GCTGCAGACG GAATCCCAAA GCCCGCCCGG GCAGGCCAAA 
ATGGACCTCA AAATGGAACA GGCCCTGGTG ATGGGCGCCT ATTTCAGCCC CGGGAAACTG 
TGGCGGTCCC TGGATACATT AGAGCTGGGC GTCGCCTATC GGGCCGAATC TCAGCTGGAT 
ATCACGCCTT TCAGGGCGAT TGCGTCCACC GACCTGGGGG GCATTCCCCT GAATATCAAG 
ATGGCCCTGG TAGATTATTA TCAGCCGGAA ATGTATTCCG TTGGCCTGGC CTACTCACTG 
AACCGGTTGA CCCTCTCCGC TGATCTGGAG TTCCAGCAGT GGTCCGGGTT CGAATTTTCC 
ACCCCGATGC AAGAGAACTA TGGCGGCGAA CTAAAAGAAT TTGACGATAT CTTTGTTCCC 
AAACTGGGCC TGGCCTATGA CTTCAACCCA TCTTTAGACC TGCTTTTCGG GTACTATTAT 
GAGCCCTCCT TTGTGCCCGA TGAAGCGGTC AGCGGCCGCA TGAATTTTCT GGATAACGAT 
AAACATGTCG TATCACTCGG GTGTGTCTAT CAACTGCCGA AACTGTCAAT GGTGAAGGGC 
AACAGCGAAT TCTCGATCGG CTATCAGTAT CAGCACCTGA TGGACCGGGA CGTTATCAAA 
ACAGCACCGA CCCCTGAAAA CCCGCACTAT TCCTATGGGG GGAGCTGTCA CTCGTTGATG 
CTGGGCGTCT CCATCAATAT CTAG

Protein sequence

MKKTLCVAVC LVLGVMLTTP AGATHFGDTF GFSPEGMALG NAMTAKVDDW SAVYYNIAGL 
GRSQHLVNGK SQLFLGYINN APDLDIEIVR REAATGDRLA TNGDRDLDTG TIVIGGVLDI 
GTLVHLPEMV SSTRLGLAIG LNDDQSVVKI NDLDPRTHNF MRYGRECQRM LITTGMGFGF 
LHDTFGVGLG VTSFFTGEGT ALLERVELQT ESQSPPGQAK MDLKMEQALV MGAYFSPGKL 
WRSLDTLELG VAYRAESQLD ITPFRAIAST DLGGIPLNIK MALVDYYQPE MYSVGLAYSL 
NRLTLSADLE FQQWSGFEFS TPMQENYGGE LKEFDDIFVP KLGLAYDFNP SLDLLFGYYY 
EPSFVPDEAV SGRMNFLDND KHVVSLGCVY QLPKLSMVKG NSEFSIGYQY QHLMDRDVIK 
TAPTPENPHY SYGGSCHSLM LGVSINI