Gene Dret_0104 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_0104
Symbol
ID	8417908
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	-
Start bp	138947
End bp	140266
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	54%
IMG OID	645036669
Product	aromatic hydrocarbon degradation membrane protein
Protein accession	YP_003196984
Protein GI	258404242
COG category	[I] Lipid transport and metabolism
COG ID	[COG2067] Long-chain fatty acid transport protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	37
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	23
Fosmid unclonability p-value	0.881453
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGTAAGG TTGTGCTATT CACATTCGCG TTGCTCACAC TGAGTTTTTC CACAGCCAAC 
GGCGCCGGCT TCGCCACGTA CGAGTGGAGC GCCCGCGGCA ACGCTCTCGG CGGCTCCGTA 
GTCGGTATGG CCGACGATCC GGCCGCGGTG GCGTCCAACC CAGCCGGTAT CACCCAACTC 
GAGGGCGGCC ACGGCCTGTT TGGCCTGACA GCCATTTATC CCCAGGCCGA GGTGACCACG 
AAACCCCAAG GGGGACCTGA ACAAACCACC AGCGGCGAAG ACAATATCTG GACCCTGCCC 
CACGCCTATT ACACCCGCCA GCTCTCCGAC CGCTACTGGC TCGGCCTCGG CGTGTTCACC 
CGCTTCGCCC TGGGCACAGA ATACCACGAC GACTGGCCCG GCCGTTACAA CACCCGCTAC 
ACCGGCATCA AGACCGTCTC CTTCAATCCC AACCTGGCCA TGAAACTCAC GGACACGGTC 
TCTCTGGCCG TGGGCGTTGA AGTGATGCAT ATGGATTTCC AGCAGCGGAA AGTTAAGGAC 
GCCTCAGCTT TGGCAGGACA AAAAACTGAT CCTGAAACAA CCACATACGA CTTTAGCGCT 
GACCTTAATG GTCAAAGTCA AGGTGTTGGA TTTAATATCG GTTTACATTA CAAGCCCCTG 
GATTGGATCC AAGCCGGGAT TATCTACCGC AGTCCGGTAG ATCAAAAAGT GGAAGGGGAG 
GTTAACTTCG ATCGGTCTAA TTTATCTAAG TTAACAGCCA TTAATCCAGC ATATGGTGGT 
TCTTTTCAAG ACATGGATGC ATGGGGAGAG ATCACCTTAC CCGACAGTTT TCAGGCCGGC 
ATAGCCTTTA ATCTTACCCA AAAGCTGACT GTGGAAGTGG GTGGAGCTTA CACCTTTTGG 
AGCAAATACG ACGAATTGAC TTTCAATTAC GAAAAACCTG TGATCTCAGT CAAACCTTCT 
TCAGATACAT CAACTACCCC AAAAAGCTGG GAAGACACTT GGCGATTCAA TATCGGCGCG 
GAATACGCCG TGACCCCGTG GTGCGATCTG CGGGCCGGGT ATGTCTACGA CCAGTCTCCT 
GTTCAGGATG AATACGCCGA TTATCTCATC CCGGCTGATG ACCGCCAGAT CTTCTCCTTT 
GGCACCGGCT TCGCCCTGAA CGAGCAATGG ACCCTGGATC TTTCCTACAA CTACATCATG 
ATCCAAGATC GGACCGTTGA TTACGACGAA GTACGCGTCG AAGACGAAGG CGTCTACGCT 
GCGGAATTCG ACAACGCCAA CGCCCACATG GTCGGCATGA GCCTCGGCTA CGAATTCTAA

Protein sequence

MRKVVLFTFA LLTLSFSTAN GAGFATYEWS ARGNALGGSV VGMADDPAAV ASNPAGITQL 
EGGHGLFGLT AIYPQAEVTT KPQGGPEQTT SGEDNIWTLP HAYYTRQLSD RYWLGLGVFT 
RFALGTEYHD DWPGRYNTRY TGIKTVSFNP NLAMKLTDTV SLAVGVEVMH MDFQQRKVKD 
ASALAGQKTD PETTTYDFSA DLNGQSQGVG FNIGLHYKPL DWIQAGIIYR SPVDQKVEGE 
VNFDRSNLSK LTAINPAYGG SFQDMDAWGE ITLPDSFQAG IAFNLTQKLT VEVGGAYTFW 
SKYDELTFNY EKPVISVKPS SDTSTTPKSW EDTWRFNIGA EYAVTPWCDL RAGYVYDQSP 
VQDEYADYLI PADDRQIFSF GTGFALNEQW TLDLSYNYIM IQDRTVDYDE VRVEDEGVYA 
AEFDNANAHM VGMSLGYEF