Gene Ddes_1888 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ddes_1888
Symbol
ID	7285603
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfovibrio desulfuricans subsp. desulfuricans str. ATCC 27774
Kingdom	Bacteria
Replicon accession	NC_011883
Strand	-
Start bp	2276364
End bp	2277404
Gene Length	1041 bp
Protein Length	346 aa
Translation table	11
GC content	62%
IMG OID	643582709
Product	Sel1 domain protein repeat-containing protein
Protein accession	YP_002480462
Protein GI	220905150
COG category	[R] General function prediction only
COG ID	[COG0790] FOG: TPR repeat, SEL1 subfamily
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.15133
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAATCC GGTTAGTTAT CATAGTTTTT CTGGCATTTT TGTGCCTTTC GCCTTTGTGG 
CTGTCACAGG GCGACGCCCG CGCTGATGAT GGGGAAAGCC TGCGCCAGGT GCAGACGGCA 
CTGGGCAAAA ACGATTACGA TGAGGCCGTG CGCCTGCTCA AGCCGCTTGT TGACGGCGGC 
AATGCTGAAG CCCTGTACGT TATGGGCCGT CTTATTCTGG ACGGCAAGGG CGTGAAGAAA 
AACCGCACCC GTGCGGCGGA GTTTTTTCGC CTGGCTGCGG AAAAGGGCGA CGTGAGCGCC 
ATGAACTCCT GGGCCACAGC CTTGGCCTCG GGCGACGGTG TGCCGCGCAA CTACCGTGAG 
GCCGCGCGCT GGTTCCGCAA GGCGGCCGAA CAGGGGCTGG CCATGGCCCA GTACAACCTT 
GGTTACCTCT ACGCCCACGG GCGCGGCGTC AGCAAGGATG AGGCCGCCGC CATTGACTGG 
TACAGCCGTG CCGCCAATCA GGGCCTTGCA TCGGCCCAGT ATTCCCTGGG CTGGACCTAT 
CTGAACAGCA AGGGTGAAAA CCAGAGCGAC ACCAAAGCCG CCCACTGGTT TGAAAAAGCC 
GCGGAGCAAG ATCACCCCAA GGCGCAGAAC AATCTGGCAT TCATGTACGC CGAGGGACGG 
GGCTATGCCC AGGACCCGGC CAAGGCCGTG CAGTGGTACA CACGCGCTGC CGAACAGGGC 
TATGCCGAAG CCCAGTATAA CCTTGGCTTT ATGTACGAAC AGGGCCGCGG CGTGCCGCAG 
GACTATAACC AGGCCGTGGA CTGGTACCGT AAGGCTGCGG AGCAGAACGA GGCCGCCGCG 
CAGTACAGCC TGGGACTCAT GTATGATCAG GGAACCGGCG TGCCGCGCAA TCTGAGCGAG 
GCCAACCGCT GGTACAATCT GGCCGCCAAG AATGGCGACC CCGATGCCCG ATCCGTGGTG 
CGCGCCCAGA ACAACAAGCC GCAGCAGGCG CGCAAGGCCG CTCCGGCAAA CCGGCAACAG 
AAGCGCGATA AAAAGCAGTA G

Protein sequence

MKIRLVIIVF LAFLCLSPLW LSQGDARADD GESLRQVQTA LGKNDYDEAV RLLKPLVDGG 
NAEALYVMGR LILDGKGVKK NRTRAAEFFR LAAEKGDVSA MNSWATALAS GDGVPRNYRE 
AARWFRKAAE QGLAMAQYNL GYLYAHGRGV SKDEAAAIDW YSRAANQGLA SAQYSLGWTY 
LNSKGENQSD TKAAHWFEKA AEQDHPKAQN NLAFMYAEGR GYAQDPAKAV QWYTRAAEQG 
YAEAQYNLGF MYEQGRGVPQ DYNQAVDWYR KAAEQNEAAA QYSLGLMYDQ GTGVPRNLSE 
ANRWYNLAAK NGDPDARSVV RAQNNKPQQA RKAAPANRQQ KRDKKQ