Gene Dvul_1034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1034
Symbol
ID	4664097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	+
Start bp	1267852
End bp	1269369
Gene Length	1518 bp
Protein Length	505 aa
Translation table	11
GC content	62%
IMG OID	639819258
Product	extracellular solute-binding protein
Protein accession	YP_966481
Protein GI	120602081
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG4623] Predicted soluble lytic transglycosylase fused to an ABC-type amino acid-binding protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.121119
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCGAAAT CCTCCGGGTG GTCACGCGTT GTCGTGCTGT TCTGTTTCAT GTTCGCCCTG 
ACAGCGCCCT GTCTGGTTGT CGTGTCGGGT ACAGCCGCCG CCATGGTCGC TGCCCAGGAG 
GATGACCCGG CGACGTTGCC GGAAGACCGC ATCCAGGACC TCATCCTCCC TGCGGAGAAG 
GCCTTCTCGG GTGATGTGAA GGAGATAAGG CAACGTGGAG TGCTTCGTGT TCTCGTCACC 
TACCGCAAGG GAGATTTCTT CATCGCTGAC GGCGAACTGC GCGGCGTGGA AGTCGAACTC 
GCCCGTGCAT TCGCCGCATG GCTTGGCAAG AAGGGGGGCA AGAAGGCCCT GCCTGTCCGC 
GCCATCTTCA TTCCGGTCGC GTTCGATGAA CTGTTGACGG CGCTTGAGCA GGGCAAGGGG 
GACATTGCCG CTGCCGGGTT CACCGTCACG GAGGCACGTA GCGCACGCGT CCCGTTCGCC 
ACGCCGTACC TGCGCGGCAT CGACGAGGTC TTTGCCATCC GCAAGGGTGC ACCCGTGCCA 
ACGAGCCTGG ATGAACTCGC GGGCAGGACG GTGCATGTCG TCCGGGGCTC AAGCCACGAG 
CAGCATCTGG GCGAACTCAA CGTCCGTCTT GCCGCACAGG GCCTTGCGCC CTTGAACATC 
GTGACGCCAT CGGCCGACCT GCAACCGGAG GACCTCTTCG ACCTTCTCGG GACAGGTGCC 
ATAGACCTGA TGGTCGCCGA CAGTCATCGT GCCCGGCTGT GGCGACGCGC CATGCCCGAT 
GTGCAGGTCG TGCCGTCACT GCAGTTGAAG ACGGGGCAGG ACATCGCATG GGCGGTACGC 
CCCGATGCCC CGGGGTTGCT GCATGAAGTG AACGCCTTCT TCGCTGCCGA TGGGGGGAGG 
GCCGTGAAGA AGGCTGCTGG ACTGCTGGAA CGCTATTACG CAGACAGGTC GTGGCACGTC 
GAAGGGCTCA ACCGCAAGTT CGCTGCCCGG GCAAAGCGTC TCTATCCCCA TTTCATCCGC 
TATGGCGACA CCTATGCCTT CGACCCGTTG CTCTTGCTTG CGCAGGGCTA CCGGGAGTCG 
CGTCTCAACC AGAAGCTGCG CAGTCCACGC GGTGCCGTCG GAGTGATGCA GGTGCTACCT 
TCGACAGCCC GGACCATGGG TTTTCCCGAT GTCGTGAAGG AGGCGGTGAC GAACATCCAT 
GCCGGGGTGC GCTATCTTGA ATATGTGCGG TCGGACTACT TTTCCGATGC CGATATCCGC 
GAACCGGACA GGACGCTGTT CAGCCTTGCC GCCTACAATA TGGGCCCCAA CCGCATGGCC 
CGTGTCCGCG AACGTGCCAT ACGGATGGGA CTCGACCCCA ATCGCTGGTT CGGCAATGTG 
GAATATGCGG CGTTACGATA CGTCGGGCGT GAACCTGTGA CCTACGTCGC TCAGATTTCA 
TCGTATTACA TCGCCTATCA GGGCAGTCAT GCCGTGACCG GTGCCCGTCG CCCGGTGCTG 
GAGGCACTGC AGAAGTGA

Protein sequence

MPKSSGWSRV VVLFCFMFAL TAPCLVVVSG TAAAMVAAQE DDPATLPEDR IQDLILPAEK 
AFSGDVKEIR QRGVLRVLVT YRKGDFFIAD GELRGVEVEL ARAFAAWLGK KGGKKALPVR 
AIFIPVAFDE LLTALEQGKG DIAAAGFTVT EARSARVPFA TPYLRGIDEV FAIRKGAPVP 
TSLDELAGRT VHVVRGSSHE QHLGELNVRL AAQGLAPLNI VTPSADLQPE DLFDLLGTGA 
IDLMVADSHR ARLWRRAMPD VQVVPSLQLK TGQDIAWAVR PDAPGLLHEV NAFFAADGGR 
AVKKAAGLLE RYYADRSWHV EGLNRKFAAR AKRLYPHFIR YGDTYAFDPL LLLAQGYRES 
RLNQKLRSPR GAVGVMQVLP STARTMGFPD VVKEAVTNIH AGVRYLEYVR SDYFSDADIR 
EPDRTLFSLA AYNMGPNRMA RVRERAIRMG LDPNRWFGNV EYAALRYVGR EPVTYVAQIS 
SYYIAYQGSH AVTGARRPVL EALQK