Gene DvMF_1048 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	DvMF_1048
Symbol
ID	7172944
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris str. 'Miyazaki F'
Kingdom	Bacteria
Replicon accession	NC_011769
Strand	+
Start bp	1273441
End bp	1275138
Gene Length	1698 bp
Protein Length	565 aa
Translation table	11
GC content	70%
IMG OID	643539555
Product	Sel1 domain protein repeat-containing protein
Protein accession	YP_002435471
Protein GI	218886150
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	84
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACACAG CCCGCCGCAT CGCCGCGCGT TTTCGTCCGT CCCCTGTTCC GCAAACCTCC 
AACCGGCAGC GCTCTCCGCG CCGCGCGGCA CGCCTGGCGC TTGTCGCCCT GCTGGCGGCT 
GGCCTGCTGC TGGGCGGATG CAAGCCCCCC AAAAAGGGGA CGGCTGCCCT GCCGGAACGC 
CCTACCTACA TCCGCGAGGC CACGGACCAG GAAACTTCCG CGCCCGATGC GGGCACGAGC 
GCCACGGGCA CGACCGGGGC CACCACGCCG GATACCGGCG CCGCACCGGC TGATACCGGG 
GCCAACACCG CGCAGCCTGC CGCCCCCGAT CTTGTGGTCG CCCCTGACAG CATGGCCAAC 
AACCGCCAGC CCGAACCCAC GCCGCAACCG CAGAACCGCG CTGCCGCCCC CGTGGGTGAA 
CTGGTGGAGC TTTCCGACGG CACCAGCATG GAGGCCCCCA CTCGCCCGCA GGACCAGTTT 
GCCTTTGCCA TGGCCCTGTT GCAGGGGGCC GACGGCCAGC CCGATCCGGC CCGGGCCGCA 
ACGTGGCTGG AAAAATCCGC CGATCAGGAC TTTGGCCCGG CGCAAGACGT GCTGGCGCGC 
CTGTACCTGG ACGGCACCGG CGTGCGCAAG GACGAGGCCA AGGCCTTTGC GCTGGCCATG 
TCCGCCGCCG AGCAGGACAT CATCAACGCG CAGGCCCTGG TGGGCGTGCT GTACACTTAT 
GGACGCGGCA CCCGGCGCGA CTTCATGCAG GGCGAGAAAT GGCTCTCGCT GGCGGCGGAG 
CGGGGCCACC CGCAAGCGTG CGACCTGCTG GCCGAATACC ACCGCAAGGG GTTGGCCGGG 
CCGGAGAACC AGGAAGAAGC CTTCCGCTGG ACGGAACGCG CCGCCGCCCT TGGGGTGGTG 
CGCGCACGCT TCTGGCTGGG CGTGCACTAC CGCTACGGCA TGGGCACCCC GCGCGACGAC 
GCCAAGGCCC TGCACCTGCT GCGCGAAGCC GCCGACGCGG GCAACCCCGA CGCCATGGGG 
CTGGTGGCCG AAATGCTTTA CCGGGGCCAG GGAAGCGAGC CGGACATGGC TGGCTCCGTG 
CGCTACTTCC AGATGGGCGC CAAGGCGGGC GACCTGCACT CGCTGCTCAA CCTGGGCATC 
CTGCATCACG AAGGCACAGG CGTGCCCAAG GACTACCCGC GCAGCCTGCA ACTGTTCGGC 
CAATGCGCCG AGGGCGGCCA CCCGCGCTGC ATGACCTTGC TGGGCAGCAT GCTGGCGGAA 
GGGGAAGGAG CCGAGGCGGA CATGGTCACC GCCCATTCCT GGCTGACCCG TGCCGTGCTG 
TTCGGCGACG GCGACGCGGC TTCGGTGGCA GCCGAGGTGC AGCAACGCAT GACGCCCGAC 
CAGTTGGTGC ATTCCAAGAA CATGGCCGCG CAGTGGATGC AGGCCCACCC GCAGTTCCAG 
CCCGGCGTGC CCGCGCAACT CGAACCGGAG GCATCCACGG CGGTTCCGCA GGCCGCGCGA 
CAGGAAGCCT CGCAATCCGC ACCGGGAGCA AGCGCCGACA CCGGCACGAC GGACATGACC 
GCCACACCGC AGGGTTCCTC CAACGCGACG GCCCCTGTTA CCCAGACCGA CAAGACCGGC 
AAGACGGGCA CCACCACTGC GGCCCCGGCG AAGAAGAAAG GCACCAAGGC CGCCAAGGGC 
GCCCGCACCA CCAACTGA

Protein sequence

MNTARRIAAR FRPSPVPQTS NRQRSPRRAA RLALVALLAA GLLLGGCKPP KKGTAALPER 
PTYIREATDQ ETSAPDAGTS ATGTTGATTP DTGAAPADTG ANTAQPAAPD LVVAPDSMAN 
NRQPEPTPQP QNRAAAPVGE LVELSDGTSM EAPTRPQDQF AFAMALLQGA DGQPDPARAA 
TWLEKSADQD FGPAQDVLAR LYLDGTGVRK DEAKAFALAM SAAEQDIINA QALVGVLYTY 
GRGTRRDFMQ GEKWLSLAAE RGHPQACDLL AEYHRKGLAG PENQEEAFRW TERAAALGVV 
RARFWLGVHY RYGMGTPRDD AKALHLLREA ADAGNPDAMG LVAEMLYRGQ GSEPDMAGSV 
RYFQMGAKAG DLHSLLNLGI LHHEGTGVPK DYPRSLQLFG QCAEGGHPRC MTLLGSMLAE 
GEGAEADMVT AHSWLTRAVL FGDGDAASVA AEVQQRMTPD QLVHSKNMAA QWMQAHPQFQ 
PGVPAQLEPE ASTAVPQAAR QEASQSAPGA SADTGTTDMT ATPQGSSNAT APVTQTDKTG 
KTGTTTAAPA KKKGTKAAKG ARTTN