Gene Dret_1994 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Dret_1994
Symbol
ID	8419839
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Desulfohalobium retbaense DSM 5692
Kingdom	Bacteria
Replicon accession	NC_013223
Strand	+
Start bp	2290231
End bp	2291730
Gene Length	1500 bp
Protein Length	499 aa
Translation table	11
GC content	45%
IMG OID	645038582
Product	type II and III secretion system protein
Protein accession	YP_003198856
Protein GI	258406114
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4796] Type II secretory pathway, component HofQ
TIGRFAM ID	[TIGR02515] type IV pilus secretin (or competence protein) PilQ

Plasmid Coverage information

Num covering plasmid clones	33
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	31
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCTCAGGT CAACCACAAT ATGCATTGCA ATATTCACAA TTCTGCTTTT GTCCGGATGC 
GCTACCACCG ATCAGGAAAA GGCACCTGAA TTTATAGATA AGTGGCAGAA ACTGGCGGAA 
AAATCCAAAG GCCATTCGCC TGTACCCCAA GAAGCGAATA CTCATGAGCC TGATACCTTT 
ACCAGTTTAG AGCGTCATCA ACAAGAAAAA CACAAATTGC CTCGGGAGAA AGTCTCTTTA 
AAATTTCGTG ATAACAAAAT ACAAGTTATT TTACGTACTC TAGCATCGGC AGCTAGCCAA 
AATATTGTCA TGAGCAATAA TATTAGTGGC ACCATGAGCT TAGATGTCAA AGATATTCCT 
TGGAGCCAAG CGTTCTTGAG TGTTATTACC ACCAACGGCC TGACTTATTC CTGGCAGGGA 
GATATAATTC AAGTTCAAAG CCCAAAAGAT ATGCAAATGG AGAAAGAACT CCAGCAAATC 
CAAAAGGAAA CCCAGATCCT GCAAACGACT GTTGTCGATA TTGACTATGC CCACATTGTA 
GACAAAGGCG TAAAGAGCGG AAATACCAAT GACAACGGCA ATCTGGATCA ACTGGAAAAG 
ACCTTGCGGG AAGTTCTAAA AAATGCAAGT GGAGGAAGCA AGGAAGGGAC GTTGTTTGTG 
GACAGGGAAA ACAACGCCCT AATTATCCAA GCCACGAAAG AGGACACTCA GCGCATTCTT 
CACGTTCTCA ATCATTTGGA ACGCCCCAGA AAACAAATCC ATATTGAAGC CAGTATCGTA 
GAGGCCACCC AAAATACCGC TCGAGAATTA GGCATGCGCT GGAGAGGAAG GTATGTGACG 
TCAGGAAGGG GAATTGAAGA TGTGGGCATC ATAGGCGATG CACAAGAACC CGAGGACTGG 
GGATCTGCTA TCACCACCCT TCCAGGTAGC GGAACGGATA CACTCGGTGG TTTAAAATTA 
GGGACAGTCG TCGGAGAAAT TGCCGGAAAC GTATTATTTT CTCAGCTTCA AGCTTTGGAA 
AAAGAGGGAC AAGTCAATAT CTTGGCTAGT CCATCCCTGA CCACTATGGA TAATCAAAGC 
GCCTCAACCC AGCACGGAGA GAGAGTGCCT TACGAAACCA CTGATGAAGA TGGTGATCGT 
GTCGTTAAAT TTGAGGATGT GGCAATGGGC CTAAAAGTTC ACCCCAGAAT AATTGAAGGG 
GATTTGATGG CTATGGACAT TGTTGTCACC AAAGACGAAG TGGATTTTTC CCAGAATGTC 
CAAGGCAATC CCTTGATCCG AACCAAAGAG ACGGAAACCA ACCTCTTGGT CCGCAACGGC 
GAAACCATCG TCATATCAGG CTTATCAAAG CAAACCGTCA GTGGCACTGA ACATGGAGTC 
CCTGGGCTCA GAAAAGTGCC TGGTCTGAGT TGGCTATTCA AGGGTATAGA TAAAAGTGAA 
GATATGGAGG AGTTCATGGT TTTCATCACT CCCACCATTT TGGATCAACC AGGATCATGA

Protein sequence

MLRSTTICIA IFTILLLSGC ATTDQEKAPE FIDKWQKLAE KSKGHSPVPQ EANTHEPDTF 
TSLERHQQEK HKLPREKVSL KFRDNKIQVI LRTLASAASQ NIVMSNNISG TMSLDVKDIP 
WSQAFLSVIT TNGLTYSWQG DIIQVQSPKD MQMEKELQQI QKETQILQTT VVDIDYAHIV 
DKGVKSGNTN DNGNLDQLEK TLREVLKNAS GGSKEGTLFV DRENNALIIQ ATKEDTQRIL 
HVLNHLERPR KQIHIEASIV EATQNTAREL GMRWRGRYVT SGRGIEDVGI IGDAQEPEDW 
GSAITTLPGS GTDTLGGLKL GTVVGEIAGN VLFSQLQALE KEGQVNILAS PSLTTMDNQS 
ASTQHGERVP YETTDEDGDR VVKFEDVAMG LKVHPRIIEG DLMAMDIVVT KDEVDFSQNV 
QGNPLIRTKE TETNLLVRNG ETIVISGLSK QTVSGTEHGV PGLRKVPGLS WLFKGIDKSE 
DMEEFMVFIT PTILDQPGS