Gene DvMF_2024 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_2024
Symbol
ID	7173943
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	-
Start bp	2506764
End bp	2507945
Gene Length	1182 bp
Protein Length	393 aa
Translation table	11
GC content	73%
IMG OID	643540541
Product	pseudouridine synthase
Protein accession	YP_002436435
Protein GI	218887114
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0564] Pseudouridylate synthases, 23S RNA-specific
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	97
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCAGAAC CGCTCGTGGT CACCGCCGCA GAGGCCGGAC AGAAGCTGGT GCAGTACCTG 
CAACGGCGCT GCGGCGCGCC GCAGTCGGCC ATCCAGCGCT GGGTGCGCAC CGGGCAGGTG 
CGCATCAACG GGGGGCGCTG CAAGCCCTTT GACCGCGTGG CCGAGGGCGA CGTGGTGCGG 
GTGCCGCCTT TTGCCCTGGC GGGCGGAGAG GGGGACCCGG TTGTCGGGGG GGGTGCGCCG 
GATGCAGGGC AGGGTGCAAC GCGGGCTGCG TCGGCGAATG CGGGCGGAGG AAAAGAGCGG 
GGCTCCGCCC CGCGCCCCGC AAGGGGACCG TATCCCCTTG ACCCCGAACC GGGTGAGGGT 
GCGGCCTGTG GTACGGCAGC AGCGGGAAGC ACGGCGGCAC CAGGTCCACG GGCATGCGGC 
ACACGCCCGG AATTTCAGGC ATCACCCTTG TCCGTGGCGG GCCGCGCCGA AGGGCTGCTG 
GTGCTGCTGA AGCCCGCCGG GCTGGCGGTG CAGCCGGGCA CCGGCCACGA TGATTGCGTT 
ACCGCCCGGC TTGCGGCGCA GTACGCCGGG GCGGACTTTC TGCCCACGCC CGCGCACCGG 
CTGGACCGCG ACACCTCGGG CCTGCTGCTG GTGGCCACCA GTTATGCCCG GCTGCGGGCG 
CTGTCCGACG CCTTTGCGGC GCGCGAAGGG CTGGTGAAGG AATACCTGGC CTGGGTGGCG 
GGACGCTGGC CCCACGAGGG CGCGCGGACC CTGCATGACC GGCTGGAGAA GCAGGGCGCT 
CCGGGCCGCC AGAAGGTGCG CCGGGTGGGC GGGGAGGGTT CCGTTCCTCG CGCGGCGTCT 
GGCAATGAAG CGGTTCGCGT GGAGTCTGGT ACGGACGCGG CCCATGCCGC CGCCGGTGCT 
GACGCTGGCC GCCACGCCGC CTGCACCGTC ACCCCCCTGC GGCGCGGCGA TGGGGCGTCC 
CTGCTGCTGG TGCGCCTGCA CACCGGGCGC ACCCACCAGA TCCGGGTGCA GCTTGCGGAG 
CGGGGACACC CCATCATGGG CGACCGCAAG TACGGTGGGC CCGCCTGTGG TCAGGGCATG 
CTGCTGCACG CCGTACGCCT GACCCTGCCC GACGGCGAAC GCTTCACGGC CCTGCCGGAC 
TGGACGGGCC GCTGGCAGGT GGGCGAGGGC GATCTGCCCT AG

Protein sequence

MAEPLVVTAA EAGQKLVQYL QRRCGAPQSA IQRWVRTGQV RINGGRCKPF DRVAEGDVVR 
VPPFALAGGE GDPVVGGGAP DAGQGATRAA SANAGGGKER GSAPRPARGP YPLDPEPGEG 
AACGTAAAGS TAAPGPRACG TRPEFQASPL SVAGRAEGLL VLLKPAGLAV QPGTGHDDCV 
TARLAAQYAG ADFLPTPAHR LDRDTSGLLL VATSYARLRA LSDAFAAREG LVKEYLAWVA 
GRWPHEGART LHDRLEKQGA PGRQKVRRVG GEGSVPRAAS GNEAVRVESG TDAAHAAAGA 
DAGRHAACTV TPLRRGDGAS LLLVRLHTGR THQIRVQLAE RGHPIMGDRK YGGPACGQGM 
LLHAVRLTLP DGERFTALPD WTGRWQVGEG DLP