Gene Dole_1899 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dole_1899
Symbol
ID	5694739
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfococcus oleovorans Hxd3
Kingdom	Bacteria
Replicon accession	NC_009943
Strand	-
Start bp	2302880
End bp	2304151
Gene Length	1272 bp
Protein Length	423 aa
Translation table	11
GC content	53%
IMG OID	641264497
Product	YD repeat-containing protein
Protein accession	YP_001529780
Protein GI	158521910
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3209] Rhs family protein
TIGRFAM ID	[TIGR01643] YD repeat (two copies)

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.126482
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGCTGATCC CCAACCTGGG CTTTGTCACC ATCAGCGACT ACACATGGAA CCGGCCGGCT 
GCCATTACCC TGCCAGGCGG GGCCACCCGT GAGTTTGAAT ACGATCCCCT GATGCGGGTA 
AAAGAGATCA CCTCTCTTGA CCCGGGCGGC AATGCCCTGT TAAATTACAC CTACGCCCAT 
GACGCCATGG ACAACATCAC GGCCAAGCAG ACCGAGCACG GGGATTATGG GTATGGATAT 
GACGATCTGC ACCGGCTGGC TACGGTTGAC AACCCGGCCG CGGGCCTGGC CGACGAGGCC 
TTTACCTATG ACAGCGTGGG CAACCGCCTG ACCTCGGCCC AGGCGGCAGG AGACTGGACA 
TACAATGACA ACAACGAATT GTTGTCATCC GTTGGAGTGA CCGGGGGATC CACATACGAG 
TACGACGCCA ACGGCAATAC CATTAAAAAG ACAGTGGGCG GCGTTGTCAC CAGTTATGTA 
TACAACACGG AAGACCGGCT GACCCAGGTC TGGAGCGGCC TGCCCGGTTC CGGTTCTTTG 
ACAGCCACGT ACTATTATGA CCCGTTTGGC CGCAGGCTGT GGAAGGGGGT CGGGGGAACA 
CGGACGTACT TCCATTACAG TGATGAGGGC CTCGTCGCGG AAATCAATGC CTCCGGAACC 
GTGGTCAAGT CCTACGGCTG GCAGCCCGGC GGCACCTGGG GCACCGATCC GCTGTTCATG 
AAGGTTAGTG GGAATTATTA CTTCTACCAC AATGACCACC TCGGTACCCC TCAGAAGCTG 
ACGGCCAGTA ACGGGGCGGT GGTTTGGAGT GCTAAGTACG AGAGCTTTGG GGATGCGACT 
GTTGAGATCG AGACGGTTGA GAATAACCTC AGGTTCCCGG GCCAATACTT TGATGGGGAG 
AGTGGGCTGC ATTATAACCT GCATCGTTAT TATGCTCCTG AGCTAGGACG GTTCTTGAAA 
GATGATCCAA TCGGACTTCG GGGTGGGATT AATCAATATA TTTATGCAGA TAACAATGTG 
AGTAATAATA CTGATCCTTA CGGATTGTTT TCAAAAAAGA CTAAATGCCA GATAGCTTGT 
AATGTGGCAT TAGGCTATAC TTGTACTGTT TTAGGTATTG GATCAGGCAT AGTCTCCGGG 
CCATTAGTTG GAATTGGTGT TGGGGTTGTA TGCAGGGTAG TTTCATTTGG TATATGCTAT 
GCAACTTGTT CAGGGGCACC AGATGATTGC TCAGACTTTC CACCGGGAGA CTATTCTTTT 
TCTTATGCCT AA

Protein sequence

MLIPNLGFVT ISDYTWNRPA AITLPGGATR EFEYDPLMRV KEITSLDPGG NALLNYTYAH 
DAMDNITAKQ TEHGDYGYGY DDLHRLATVD NPAAGLADEA FTYDSVGNRL TSAQAAGDWT 
YNDNNELLSS VGVTGGSTYE YDANGNTIKK TVGGVVTSYV YNTEDRLTQV WSGLPGSGSL 
TATYYYDPFG RRLWKGVGGT RTYFHYSDEG LVAEINASGT VVKSYGWQPG GTWGTDPLFM 
KVSGNYYFYH NDHLGTPQKL TASNGAVVWS AKYESFGDAT VEIETVENNL RFPGQYFDGE 
SGLHYNLHRY YAPELGRFLK DDPIGLRGGI NQYIYADNNV SNNTDPYGLF SKKTKCQIAC 
NVALGYTCTV LGIGSGIVSG PLVGIGVGVV CRVVSFGICY ATCSGAPDDC SDFPPGDYSF 
SYA