Gene Dvul_1106 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dvul_1106
Symbol
ID	4662795
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio vulgaris DP4
Kingdom	Bacteria
Replicon accession	NC_008751
Strand	-
Start bp	1344774
End bp	1345889
Gene Length	1116 bp
Protein Length	371 aa
Translation table	11
GC content	69%
IMG OID	639819335
Product	TPR repeat-containing protein
Protein accession	YP_966553
Protein GI	120602153
COG category	[R] General function prediction only
COG ID	[COG0457] FOG: TPR repeat
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.178209
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCATCA CAGCCACGCA CGACACCTCT TCGAAGGGCC GCCATGCCCT GCCCGCCCTC 
GCGCTTCTGC TGCTCATGAC ACTCTCGGGC TGCGCTGCGC GTGACATGGG CGACGGCACG 
TCTCCCTCGC TCATGGAACG GCATGCCACG GGCAAGAGCC TCGCCCCCGA TGCGCCGGGG 
ACACCGCAAC GGCAAGGCAC ACCGGCGGCC GAGGCGGAAG CCCACCTCCA GCGCGGCCTC 
GCCTACCTCG CACAGGACAG GCCCGAACTC GCCTTCGAGC ATTTCAGCCG CGCCGCCTCG 
CTTGCCCCGG AGATGGTCGA ACCCCGTCTG CAACGGGCGC GCCTGCTCGT CCGGCGCGGC 
ATGCCCAACG AAGCCGCCGC CGACATCGAG GCCGTGCTCG CCGCCTCCCC GCAACACGCA 
CGCGCATGGG AACTTGCGGG CATGGTGGCT TTCGACAGGG GACTTTTGGA CGAAGCCGAA 
GCGGACTTCA CGCGCGCCAT CACCCTCGAC CCCGACCTTG CCTCCTGCTA CGCGCATCTC 
GGTGCCGTAC ACGACTACAA GGGTCGCCCC GACCTCGCAC GTGACGTGTA CGCCGCCGCC 
CTTGTCCGCT TTCCGCAGTC GGGCGAATTG CACAACAACC TCGGTGTCGC CTTCTCCATG 
CTTGGAGACG ACGCCTCGGC CCTGCACCAC TTCCACGAGG CCGTCGTGCT GGGCGCGTCC 
TCCGAACGGT CATGGAACAA CATGGGGCTG GCCCTGTGCC GTCTGGGGCG CTTCGACGAG 
GCCTTCGAAG CCTTCCGCAA CGCGGGGGGC GAGGCCGCAG CGCATAACAA CCTCGGCTAT 
TTCTTCCTCG TCAACGGCGA CGCCTCGCTG GCCGTGCAGC ACCTGCAACG CGCCGTCGAA 
CTCGAACCCC GCTACTACGT CCGTGCCGCC GAGAACCTCA AGCGTGCCCG ACTCGCGGCC 
AGATTCGCAG CGGGCGGCGT ACCTGTGCCC GCCGCGGGGC CACAGGCAGG AGGCATTGCC 
GGTACGCCCG TGAACAAGGC AGGCGTCTTG CCGCCAGCAA CGGGCAAGGG TCCCGGCACA 
CGGACGACCG GCGCAGGCGA ACGGGTCATC CAGTAG

Protein sequence

MSITATHDTS SKGRHALPAL ALLLLMTLSG CAARDMGDGT SPSLMERHAT GKSLAPDAPG 
TPQRQGTPAA EAEAHLQRGL AYLAQDRPEL AFEHFSRAAS LAPEMVEPRL QRARLLVRRG 
MPNEAAADIE AVLAASPQHA RAWELAGMVA FDRGLLDEAE ADFTRAITLD PDLASCYAHL 
GAVHDYKGRP DLARDVYAAA LVRFPQSGEL HNNLGVAFSM LGDDASALHH FHEAVVLGAS 
SERSWNNMGL ALCRLGRFDE AFEAFRNAGG EAAAHNNLGY FFLVNGDASL AVQHLQRAVE 
LEPRYYVRAA ENLKRARLAA RFAAGGVPVP AAGPQAGGIA GTPVNKAGVL PPATGKGPGT 
RTTGAGERVI Q